50892440 发表于 2008-8-18 18:54:30

采集分页----多个分页

一个内容页中包含分页,连续好几个下一页,即一篇由四五个或者更多的分页组成,我只能采到第一页和第二页,还想采到第三页及以后的部分,对于这样的问题怎样解决呢?
请高手帮忙,谢谢!

sengl 发表于 2008-8-18 20:02:37

这可能是你采集的分页模板不一样.第一页和第二页能采集到. 说明分页代码是成功的.    你最好看看火车头的正则视频教程.里面介绍了多模块的采集.

50892440 发表于 2008-8-18 20:45:01

http://list.taobao.com/browse/1512/n-4---0-false-----95---yes-------g,geydambvhiytambsg4--g,geydambvhlc3lo7z2hdq------------2-------b-y-40--coefp-0-all-1512.htm这是起始地址

列表页中选了一个 连接,5310的内容页地址http://list.taobao.com/browse/1512/n-4---0-false-----95---yes-------g,geydambvhiytambsg45tcmbqga3dumjqgiztoni--g,geydambvhlc3lo7z2hdtwmjqgaydmorvgmytawcn------------2-------b-y-40--coefp-0-all-1512.htm
这是内容页,这个内容页有好多页,
问题就出现在 第一页与第二页的分页代码和 第三页与第四页的分页代码不一样,怎样才能换成一样的呢?

sengl 发表于 2008-8-19 08:05:10

链接进不去.

50892440 发表于 2008-8-19 09:13:22

http://list.taobao.com/browse/1512/n-4---0-false-----95---yes-------g,geydambvhiytambsg4--g,geydambvhlc3lo7z2hdq------------2-------b-y-40--coefp-0-all-1512.htm
这是起始页,列表页是诺基亚的各个手机型号,

http://list.taobao.com/browse/1512/n-4---0-false-----95---yes-------g,geydambvhiytambsg45tcmbqga3dumjqgiztoni--g,geydambvhlc3lo7z2hdtwmjqgaydmorvgmytawcn------------2-------b-y-40--coefp-0-all-1512.htm
就是这个内容页,再采集下一页时出现问题,只能采到第一页和第二页,
页: [1]
查看完整版本: 采集分页----多个分页