fzs888 发表于 2010-11-22 23:11:21

网址采集地址不对

网址采集地址不对
当采集深度是1的时候,我从http://linux.chinaunix.net/techdoc/beginner/开始采集,得到的地址页不正确,打开网页的源代码一看,原来是火车头对相对地址的转化有问题。
比如相对地址是:/techdoc/beginner/2008/07/23/1020136.shtml 可得到是:
http://linux.chinaunix.net/techdoc/beginner/ /techdoc/beginner/2008/07/23/1020136.shtml

fzs888 发表于 2010-11-23 13:07:03

没有遇到这类问题吗?

JinGui 发表于 2010-11-25 10:13:48

回复 2# fzs888

    你好,这个完全是没有问题的,请检查下你的配置规则   无论是从网页自动分析得道地址还是手动填写链接地址 都完全没有问题
为了方便查看,见截图
效果:


配置方法一:



或 配置方法二:
页: [1]
查看完整版本: 网址采集地址不对