火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6390|回复: 11

17173新闻分页采集插件

[复制链接]
发表于 2010-11-16 15:20:43 | 显示全部楼层 |阅读模式
本帖最后由 zhouchanglin 于 2010-11-26 18:03 编辑

使用方法:压缩包解压后,把php插件用在采集内容时,第4步里有相关设置,分页设置,请看规则的设置

测试可以
分页设置见采集规则里的,就是在源码里追加火车头可以识别的分页网址代码,处理后源码尾部多了分页的代码,这样火车就可以识别了
  1. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
  2. <html xmlns="http://www.w3.org/1999/xhtml">
  3. <head>
  4. <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
  5. <title>韩国科幻MMORPG《BERKANIX》首测(图)_网络游戏新闻_17173.com全球游戏门户第一站</title>
  6. <meta name="keywords" content="
  7. <link rel="stylesheet" href="http://ue1.17173.itc.cn/spp/u2/spp_style.css" type="text/css" />
  8. <script src="http://ue1.17173.itc.cn/spp/spp_core.js" type="text/javascript"></script>
  9. <script src="http://ue1.17173.itc.cn/spp/u2/spp_ui.js"   type="text/javascript"></script>
  10. <li
  11. <!-- END 17173 Site Census -->
  12. <script type="text/javascript" src="http://js.sohu.com/mail/pv/pv.js"></script>
  13. <script type="text/javascript">
  14. var copybq="17173.com门户站(www.17173.com)"
  15. document.body.oncopy = function () {
  16.         setTimeout( function () {
  17.                 var text = clipboardData.getData("text");
  18.                 if (text) {
  19.                                                 if(copybq){
  20.                         text = text + "\r\n本文来自:" + copybq + "详细出处参考:"+location.href;
  21.                                                 }else{
  22.                                                 text = text + "\r\n本文来自: 17173.com网络游戏第一门户站(www.17173.com) 详细出处参考:"+location.href;
  23.                                                 }
  24.                                                 clipboardData.setData("text", text);
  25.                                                
  26.                 }
  27.                                 }, 100 )  
  28. }
  29. </script></body>
  30. </html>

  31. 以下是插件处理后追加的包含分页信息的代码:

  32. 分页开始<A href=http://news.17173.com/content/2010-11-13/20101113083759885,2.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,3.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,4.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,5.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,6.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,7.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,8.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,9.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,10.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,11.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,12.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,13.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,14.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,15.shtml target=_blank></A><A href=http://news.17173.com/content/2010-11-13/20101113083759885,16.shtml target=_blank></A>分页结束
复制代码


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-11-16 19:52:41 | 显示全部楼层
好多西。谢谢楼主了。研究一下
发表于 2010-11-20 04:36:47 | 显示全部楼层
采集17173的确很难!
发表于 2010-11-20 09:55:50 | 显示全部楼层
没整明白是怎么个用法
发表于 2010-11-26 15:10:59 | 显示全部楼层
这插件是放在哪儿?能告诉一下具体怎么利用吗?
发表于 2010-11-26 15:20:18 | 显示全部楼层
试验下看看 不知道效果咋样
发表于 2010-11-26 15:33:49 | 显示全部楼层
17173分页插件.rar  这个不知道用到什么地方
发表于 2010-11-26 19:23:04 | 显示全部楼层
谢谢分享 拉拉
发表于 2010-12-6 09:25:20 | 显示全部楼层
好多西。谢谢楼主了。研究一下
发表于 2010-12-6 16:58:04 | 显示全部楼层
哪里有分页采集的教程,给一份,谢谢~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-10-7 02:31

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表