求助:列表页源码中无内容页信息时如何获取内容页网址
本帖最后由 helianling 于 2016-6-23 15:39 编辑如图设置列表页(如上图),【网址采集测试】无法获取到内容网址(如下图),请教各位高人问题出在哪里?如何获取?谢谢。
注:通过抓包工具获得ID(页面源码没有ID信息)
本帖最后由 js2016 于 2016-6-24 18:43 编辑
别整了,这个网站设置了反爬虫,模拟HTTP请求总返回403 Forbidden,一般人破不了 我使用其他的采集器已经采集了这个网站。
火车头应该可以同样采集,只是不知道是规则配置问题还是免费版不支持?
现在这样的网站越来越多,如果火车头采集不了,杯具了~~~~~~ helianling 发表于 2016-6-23 20:48
我使用其他的采集器已经采集了这个网站。
火车头应该可以同样采集,只是不知道是规则配置问题还是免费版不 ...
是通过模拟HTTP请求来采集的吗?还是通过内置浏览器?我抓了完整的包,再模拟却出现403,不明所以
4444444444444444444444444444
页:
[1]