火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5673|回复: 10

关于采集列表分页问题

[复制链接]
发表于 2008-6-9 00:11:29 | 显示全部楼层 |阅读模式
看图。。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-6-9 00:13:27 | 显示全部楼层
测试采集网址工采集得到一级网址8个 二级网址552个,

但采集内容回来只有43个网址

望高手指点,难道不能同时采集多个页面吗?
发表于 2008-6-9 09:30:55 | 显示全部楼层
目标站网址 .没法测试
 楼主| 发表于 2008-6-9 10:43:11 | 显示全部楼层
原帖由 sengl 于 2008-6-9 09:30 发表
目标站网址 .没法测试



可以详细说明一下吗?
发表于 2008-6-9 10:59:50 | 显示全部楼层
可能你写采集网址规则里没有设置好,比如排除一些不正确的网址,
 楼主| 发表于 2008-6-9 11:24:26 | 显示全部楼层
呵呵,楼上的指点一下

http://newgame.duowan.com/tag/60976844417.html

关于最新加入游戏这个栏目的地址 这个跟定是要屏蔽掉的
我这样设置采集地址是:
http://newgame.duowan.com/tag/61910674294_<0,9,1,False,False>.html
文章列表页面的地址必须包含有:
http://newgame.duowan.com/tag/61910674294_(*).html
文章内容页面的地址必须包含有:
http://newgame.duowan.com/08(*)
发表于 2008-6-9 12:00:16 | 显示全部楼层
原帖由 sudoo 于 2008-6-9 11:24 发表
呵呵,楼上的指点一下

http://newgame.duowan.com/tag/60976844417.html

关于最新加入游戏这个栏目的地址 这个跟定是要屏蔽掉的
我这样设置采集地址是:
http://newgame.duowan.com/tag/61910674294_.html
...


你要采集网址那里就错了点
应该是

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-6-9 13:17:09 | 显示全部楼层
ok 谢谢 我测试一下
 楼主| 发表于 2008-6-9 13:29:01 | 显示全部楼层
另外想问下 见附件,,这块的怎么屏蔽掉了

还有发现下载回来的有些文章有标题,没有内容的,,,那有怎么处理

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2008-6-9 15:13:54 | 显示全部楼层
楼上说的不错啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 16:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表