多页采集问题
本人刚学习采集,可能问的问题比较初级。就是在源码里面的网址是film.sohu.com/album/9352614.html这种的。但是为什么采集的子网页都会出现 http://so.tv.sohu.com/film.sohu.com/album/9352614.html?channeled=1200200004
多出了这个头部 so.tv.sohu.com 这个网址的根节点。
问题是有个这个根节点网址就没法访问啊。数据也采集不了。
希望有人能解答一下困惑,不胜感激。
手动链接设置前缀手动添加 leweizxl 发表于 2017-5-31 09:50
手动链接设置前缀手动添加
谢谢,已解决。
页:
[1]