网址采集中间部份重复要怎么去掉
火车头采集的时候,前面一段网址是跟据那来的,要怎么改,我把 /techdoc/beginner/ 这段重复的去掉一个,要不去掉前面的,要不去掉面后的不知道要怎么弄 没有人顶,,自己先顶, 选择适当的开始和结尾,或者通过替换或删除来解决 替换或删除只是对内站的内容,网页好像替换删除功能。开头结尾是先定的一个框,应该是没有问题的,
http://linux.chinaunix.net/techdoc/beginner/ 这部门是火车头默认的,不知道可不可以修改的 一样遇到这个问题!怎么解决呢? 一样遇到这个问题!怎么解决呢? 下载到本地用批量替换工具
然后采集本地的../ 麻烦了点
页:
[1]