采集文章,可是只能采集到前三页,为什么呀?
本帖最后由 最深色螺旋 于 2013-1-10 22:12 编辑采集这个站http://www.articlesbase.com/的文章,例如需要采集wedding dress的文章, 在搜索框中输入wedding dress后,在火车头中采集网址时,只有前三页可以采集到1级网址,第三页之后都采集不到了,为什么呢,试了很多遍都是这样。。。急啊。。。 咋木有人回答我捏很捉急呢亲们 。。。:lol 最深色螺旋 发表于 2013-1-11 08:23 static/image/common/back.gif
咋木有人回答我捏很捉急呢亲们 。。。
规则贴出来,让大家试试 这个有多方面的原因,有可能是你写的代码对后面的页面不匹配,也有可能是cookies值的原因,原因有很多 该网站不支持频繁访问,访问频繁会提示需要输入验证码才能打开列表页 我木有频繁访问啊 采集就是频繁访问了呢
页:
[1]