火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3034|回复: 5

一个超奇怪现象,是bug吗?请高人来检验下

[复制链接]
发表于 2008-5-8 23:43:49 | 显示全部楼层 |阅读模式
原来也采过N多DZ论坛,要求采回复的不多,今天有个朋友要求把回复全采来

理论上这是很容易的事,做起来也不难,但结果让我郁闷了一晚上

举例说下,以DZ官方这个贴为例吧,目前有三页回复,

但无论怎么采,就只能采到 采phpwind的可以啊

P.S 刚仔细看了一下,phpwind也是同样情况



第一页的全部回复和第二,第三页回复的第一贴,

我看了N次我的规则应该是没错的,可就是采不到其它回复


http://www.discuz.net/thread-903262-1-2.html


它分页是这种形式的

<a href="viewthread.php?tid=903262&extra=&page=2">2</a>

由于&是转义后的字符在URL必须再转回去才行,所以

我这样匹配了一下

<a href="viewthread.php?tid=[ 参数 ]&extra=&page=[ 参数 ]">(*)</a>

分页网址写成

http://www.discuz.net/viewthread.php?tid=[ 参数1 ]&extra=&page=[ 参数2 ]

如果把分页网址写成伪静态的形式也不行,和上面的结果一样

[url=http://www.discuz.net/thread-[ 参数1 ]-[ 参数2 ]-2.html]http://www.discuz.net/thread-[ 参数1 ]-[ 参数2 ]-2.html[/url]


我也重下了火车试了,也是同样结果,郁闷...

方括号内我故意加的空格,不然论坛会过滤掉的,

请各位也试试,是我错了,还是这是个bug啊,

在此谢谢了,


P.S.  问了下其它朋友,原来火车现在不支持

附件是我的规则



[ 本帖最后由 aven 于 2008-5-8 23:59 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2008-5-9 02:18:15 | 显示全部楼层
循环与分页不可以同时使用
 楼主| 发表于 2008-5-9 02:42:15 | 显示全部楼层
明白了,

谢谢管理 !!
发表于 2008-5-9 03:27:44 | 显示全部楼层
火车的分页采集不支持循環,只能採集分頁的第一樓回覆
发表于 2008-5-9 13:15:55 | 显示全部楼层
嗯,不错,3ks
发表于 2008-5-9 17:52:53 | 显示全部楼层
学到了。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 10:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表