网站防采集功能 ???
用火车头3.1版本,没修改采集规则的情况下,前面还是能采集的,只是内容中有很多杂乱代码,现在什么都采集不到了,是什么问题?【标题】:
【内容】:
【作者】:
【出处】:
【时间】:
【内容简介】:
PS:还有,提示我采集成功,图片地址也正确,可下载完成0%,img文件夹为空,这个。。。。。。。:Q :Q :Q 可能没有登陆,或者模块不行 或者你试的太少。。。只要源码可见的,一般都要可采。。。 不需要登陆的站点,游客可见。
没有用其他模块,就是下载的3.1版火车头。
试的太少??? 网速慢? 有时候会这样,重新打开软件就没问题了 应该是网络的问题!
应该是被封IP了,这样的问题很常见啊
有的网站设了SESSION,或IP地址纪录,当你的浏览次数超过某数值,自动屏蔽你的IP,就没法采了,你可以打开浏览器将采集地址输入看看,应该看到禁止或者出错页面。用IP代理或者重启拨号后,动态地址改变了就可以继续采了。
建议你把采集时间间隔放大些,线程少一点。
我也碰过这样的问题,是原站的问题,别怪火车头,火车头是好的 同感
页:
[1]