火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6736|回复: 4

采集器访问网址是403状态码

[复制链接]
发表于 2016-10-27 17:07:13 | 显示全部楼层 |阅读模式
很无奈的一个问题:采集器自带的查看源码的工具,在查看新浪的很多频道时,都无法获取到源代码,都是403.
PS:采集的网址中带有反斜杠的怎么过滤啊?求个思路?
以上,help
发表于 2016-10-28 09:16:33 | 显示全部楼层
新浪需要抓包获取    http请求里需要添加个来源页面设置    反斜杠只能用手动链接设置处理
发表于 2016-10-28 16:37:13 | 显示全部楼层
用插件处理比较方便。
 楼主| 发表于 2016-10-31 10:04:39 | 显示全部楼层
leweizxl 发表于 2016-10-28 09:16
新浪需要抓包获取    http请求里需要添加个来源页面设置    反斜杠只能用手动链接设置处理 ...

新浪的是从JS里获取的,例如:http://feed.mix.sina.com.cn/api/ ... amp;_=1477879255090

但是用采集器的查看源码工具访问就是403
 楼主| 发表于 2016-11-1 09:48:58 | 显示全部楼层
leweizxl 发表于 2016-10-28 09:16
新浪需要抓包获取    http请求里需要添加个来源页面设置    反斜杠只能用手动链接设置处理 ...

反斜杠手动链接设置怎么搞啊?求help
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-28 23:55

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表