火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2389|回复: 6

网址采集中间部份重复要怎么去掉

[复制链接]
发表于 2010-1-29 09:52:53 | 显示全部楼层 |阅读模式
火车头采集的时候,前面一段网址是跟据那来的,要怎么改,

我把 /techdoc/beginner/ 这段重复的去掉一个,要不去掉前面的,要不去掉面后的不知道要怎么弄

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2010-1-29 09:59:59 | 显示全部楼层
没有人顶,,自己先顶,
发表于 2010-1-29 10:06:25 | 显示全部楼层
选择适当的开始和结尾,或者通过替换或删除来解决
 楼主| 发表于 2010-1-29 13:36:13 | 显示全部楼层
替换或删除只是对内站的内容,网页好像替换删除功能。开头结尾是先定的一个框,应该是没有问题的,
http://linux.chinaunix.net/techdoc/beginner/ 这部门是火车头默认的,不知道可不可以修改的
发表于 2010-5-8 08:59:08 | 显示全部楼层
一样遇到这个问题!怎么解决呢?
发表于 2010-7-12 08:56:27 | 显示全部楼层
一样遇到这个问题!怎么解决呢?
发表于 2010-7-12 13:23:27 | 显示全部楼层
下载到本地  用批量替换工具
然后采集本地的../ 麻烦了点
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-13 08:24

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表