求助采集方法,循环分页如何做?
要采集的页面有很多分页,但是每次只指向一个分页,每个分页都是用“下一页”指向后一个分页,以此类推,这样的内容采集怎么做??? 上N页下N页格式.. 选择上下页形式,然后把开始和结束字符串写进去呀 怎么循环?我只能采集到第一页和第二页,第二页的“下一页”采集不到啊,怎么回事? 网址帖出来看看 http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=phone&pn=0&cl=3类似这样的结果页,能不能一直循环采集下一页,我只能采集第一页出现的页面,就是到第十页,请指教~~ 你不具体说出采集目标的站,那没办法帮你了 就是这个页啊 你这个确实够怪的,居然采集百度的搜索页,百度搜索页就是你要的目标?不过研究了一下,你这个不应该是页内的循环上下页,而应该是采集的目标页。看截图吧。内容规则我就不写了哈。
[ 本帖最后由 monface 于 2007-8-27 21:08 编辑 ] 先谢谢你~
不过。。。
这样采集出来是很多个页面,而我要把采集的结果都保存在一个页面里,因为数量太多,手动合并不太现实。所以好像采集地址只能是“单条网址”,只能通过分页的形式把内容采集出来,这样应该能保存在同一个页面里,不知道这样想对不对
那。。如何做到不停的循环采集“下一页”呢:L
页:
[1]
2