一个超奇怪现象,是bug吗?请高人来检验下
原来也采过N多DZ论坛,要求采回复的不多,今天有个朋友要求把回复全采来理论上这是很容易的事,做起来也不难,但结果让我郁闷了一晚上
举例说下,以DZ官方这个贴为例吧,目前有三页回复,
但无论怎么采,就只能采到 采phpwind的可以啊
P.S 刚仔细看了一下,phpwind也是同样情况
第一页的全部回复和第二,第三页回复的第一贴,
我看了N次我的规则应该是没错的,可就是采不到其它回复
http://www.discuz.net/thread-903262-1-2.html
它分页是这种形式的
<a href="viewthread.php?tid=903262&extra=&page=2">2</a>
由于&是转义后的字符在URL必须再转回去才行,所以
我这样匹配了一下
<a href="viewthread.php?tid=[ 参数 ]&extra=&page=[ 参数 ]">(*)</a>
分页网址写成
http://www.discuz.net/viewthread.php?tid=[ 参数1 ]&extra=&page=[ 参数2 ]
如果把分页网址写成伪静态的形式也不行,和上面的结果一样
-[ 参数2 ]-2.html]http://www.discuz.net/thread-[ 参数1 ]-[ 参数2 ]-2.html
我也重下了火车试了,也是同样结果,郁闷...
方括号内我故意加的空格,不然论坛会过滤掉的,
请各位也试试,是我错了,还是这是个bug啊,
在此谢谢了,
P.S.问了下其它朋友,原来火车现在不支持
附件是我的规则
[ 本帖最后由 aven 于 2008-5-8 23:59 编辑 ] 循环与分页不可以同时使用 明白了,
谢谢管理 !! 火车的分页采集不支持循環,只能採集分頁的第一樓回覆 嗯,不错,3ks 学到了。。。
页:
[1]