发新话题
打印

类似于 新华网这样的分页应 如何处理

类似于 新华网这样的分页应 如何处理


http://news.xinhuanet.com/politics/2005-12/19/content_3939864.htm

火车头好像 只采集第一页上面的分页信息
第二页就不采集了

[ 本帖最后由 ayumilove 于 2006-5-14 18:43 编辑 ]

TOP

能采的,使用中出现问题,最好先找自个的原因,再下结论。
复制内容到剪贴板
代码:
分页起:<br><center>
分页止:</center>
            </font>

TOP

是吗?
用这种方法 只能采集到 第1页 第2页  ,

                          第三页就采集不到了阿。

我测试过才说的。


我1#的帖子也是这个意思,

第二页的分页信息好像无效。

我觉得我的正则写的没有问题。

[ 本帖最后由 ayumilove 于 2006-5-14 22:23 编辑 ]

TOP

是你头尾代码没找对,请看这http://www.netdream.net.ru/bbs/read.php?tid=30920&fpage=1
三页的内容都有啊

TOP

没理由啊
麻烦看看我写的
附件: 您所在的用户组无法下载或查看附件

TOP

呵呵。。。看到内容分页没  它每页只是出来上一页和下一页的连接。。
所以不要选择全部列出模式而是上下页模式。这样程序就会不断地去分析直到获取到所有的分页内容

TOP

haha  谢谢火车头。 我一直都把那句话的意思理解错了




非常感谢

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.334248 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-22 21:18 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档