网址采集地址不对
网址采集地址不对当采集深度是1的时候,我从http://linux.chinaunix.net/techdoc/beginner/开始采集,得到的地址页不正确,打开网页的源代码一看,原来是火车头对相对地址的转化有问题。
比如相对地址是:/techdoc/beginner/2008/07/23/1020136.shtml 可得到是:
http://linux.chinaunix.net/techdoc/beginner/ /techdoc/beginner/2008/07/23/1020136.shtml 没有遇到这类问题吗? 回复 2# fzs888
你好,这个完全是没有问题的,请检查下你的配置规则 无论是从网页自动分析得道地址还是手动填写链接地址 都完全没有问题
为了方便查看,见截图
效果:
配置方法一:
或 配置方法二:
页:
[1]