shengjun5221 发表于 2017-5-30 17:11:47

多页采集问题

本人刚学习采集,可能问的问题比较初级。就是在源码里面的网址是film.sohu.com/album/9352614.html这种的。
但是为什么采集的子网页都会出现 http://so.tv.sohu.com/film.sohu.com/album/9352614.html?channeled=1200200004

多出了这个头部 so.tv.sohu.com 这个网址的根节点。
问题是有个这个根节点网址就没法访问啊。数据也采集不了。


希望有人能解答一下困惑,不胜感激。

leweizxl 发表于 2017-5-31 09:50:09

手动链接设置前缀手动添加

shengjun5221 发表于 2017-5-31 14:18:47

leweizxl 发表于 2017-5-31 09:50
手动链接设置前缀手动添加

谢谢,已解决。
页: [1]
查看完整版本: 多页采集问题