aven 发表于 2008-5-8 23:43:49

一个超奇怪现象,是bug吗?请高人来检验下

原来也采过N多DZ论坛,要求采回复的不多,今天有个朋友要求把回复全采来

理论上这是很容易的事,做起来也不难,但结果让我郁闷了一晚上

举例说下,以DZ官方这个贴为例吧,目前有三页回复,

但无论怎么采,就只能采到 采phpwind的可以啊

P.S 刚仔细看了一下,phpwind也是同样情况



第一页的全部回复和第二,第三页回复的第一贴,

我看了N次我的规则应该是没错的,可就是采不到其它回复


http://www.discuz.net/thread-903262-1-2.html


它分页是这种形式的

<a href="viewthread.php?tid=903262&extra=&page=2">2</a>

由于&是转义后的字符在URL必须再转回去才行,所以

我这样匹配了一下

<a href="viewthread.php?tid=[ 参数 ]&extra=&page=[ 参数 ]">(*)</a>

分页网址写成

http://www.discuz.net/viewthread.php?tid=[ 参数1 ]&extra=&page=[ 参数2 ]

如果把分页网址写成伪静态的形式也不行,和上面的结果一样

-[ 参数2 ]-2.html]http://www.discuz.net/thread-[ 参数1 ]-[ 参数2 ]-2.html


我也重下了火车试了,也是同样结果,郁闷...

方括号内我故意加的空格,不然论坛会过滤掉的,

请各位也试试,是我错了,还是这是个bug啊,

在此谢谢了,


P.S.问了下其它朋友,原来火车现在不支持

附件是我的规则



[ 本帖最后由 aven 于 2008-5-8 23:59 编辑 ]

孤魂 发表于 2008-5-9 02:18:15

循环与分页不可以同时使用

aven 发表于 2008-5-9 02:42:15

明白了,

谢谢管理 !!

findbest 发表于 2008-5-9 03:27:44

火车的分页采集不支持循環,只能採集分頁的第一樓回覆

qq-fantizi 发表于 2008-5-9 13:15:55

嗯,不错,3ks

萧恕 发表于 2008-5-9 17:52:53

学到了。。。
页: [1]
查看完整版本: 一个超奇怪现象,是bug吗?请高人来检验下