今天采集太平洋的产品评论的文章,有的一个评论有10多页,感觉定制的分页规则是没问题的,但一直是只能采弟一页,痛苦了一天, 搜了好多帖子看到大家都有这样的问题但没好的条案(可能是我没看到),现把我的解决方法分享大家!
1,如果你感觉你的分页规则没问题,
2,能采集弟一页的内容,只是不能采出分页的内容,
哪好大家就别有分页规则上找问题了,可能是你的内容规则上的问题,采集其它的分页的内容规则可能和第一页的内容规则不同,如:有的弟一页在内容前面有广告代码,但分页没有,当然你用这样的规则就有可能不能采下分页的内容,也就出现你只能看到第一页的内容,其实分页规则是对的,也采了,但分页上没采到内容,说到这大家都 明白了吧.
怎么解决呢,只能做一个能兼容第一页和其它分页的规则了,这个规则大家就要忍者见忍,智者见智了,我是找到第一页和其它分页的的相同的代码段,再用排除来排除它们不同的部分,好了写到这吧,大家还有什么好的建议就跟个贴,把分页采集的经验分享一下,方便其它人
火车已用好久,的确不错,但长期潜水,深有不安,敬上一帖,以示对火车事业的支持!! |