gdgtian 发表于 2010-1-29 09:52:53

网址采集中间部份重复要怎么去掉

火车头采集的时候,前面一段网址是跟据那来的,要怎么改,

我把 /techdoc/beginner/ 这段重复的去掉一个,要不去掉前面的,要不去掉面后的不知道要怎么弄

gdgtian 发表于 2010-1-29 09:59:59

没有人顶,,自己先顶,

onwings 发表于 2010-1-29 10:06:25

选择适当的开始和结尾,或者通过替换或删除来解决

gdgtian 发表于 2010-1-29 13:36:13

替换或删除只是对内站的内容,网页好像替换删除功能。开头结尾是先定的一个框,应该是没有问题的,
http://linux.chinaunix.net/techdoc/beginner/ 这部门是火车头默认的,不知道可不可以修改的

kingnib 发表于 2010-5-8 08:59:08

一样遇到这个问题!怎么解决呢?

lhq5189935 发表于 2010-7-12 08:56:27

一样遇到这个问题!怎么解决呢?

imtos 发表于 2010-7-12 13:23:27

下载到本地用批量替换工具
然后采集本地的../ 麻烦了点
页: [1]
查看完整版本: 网址采集中间部份重复要怎么去掉