采集器访问网址是403状态码
很无奈的一个问题:采集器自带的查看源码的工具,在查看新浪的很多频道时,都无法获取到源代码,都是403.PS:采集的网址中带有反斜杠的怎么过滤啊?求个思路?
以上,help
新浪需要抓包获取 http请求里需要添加个来源页面设置 反斜杠只能用手动链接设置处理 用插件处理比较方便。 leweizxl 发表于 2016-10-28 09:16
新浪需要抓包获取 http请求里需要添加个来源页面设置 反斜杠只能用手动链接设置处理 ...
新浪的是从JS里获取的,例如:http://feed.mix.sina.com.cn/api/roll/get?pageid=155&lid=1686&num=10&page=2&callback=feedCardJsonpCallback&_=1477879255090
但是用采集器的查看源码工具访问就是403 leweizxl 发表于 2016-10-28 09:16
新浪需要抓包获取 http请求里需要添加个来源页面设置 反斜杠只能用手动链接设置处理 ...
反斜杠手动链接设置怎么搞啊?求help
页:
[1]