火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2448|回复: 4

网址采集连接地址中间部份重复要怎么去掉

[复制链接]
发表于 2010-5-8 09:25:40 | 显示全部楼层 |阅读模式
本帖最后由 kingnib 于 2010-5-8 11:02 编辑

采集页面的连接地址源代码是
  1. <a href='/bbs/actions/archive/post/8437871_1.html?tpg=1' class="noline">[参数]</a>
复制代码
这种形式
采集得到的地址却是:

可以看到,/bbs//bbs/内容重复,这应该如何解决

http://www......cn/bbs/ 这部门是火车头默认的,不知道可不可以修改的成http://www.......cn/

论坛搜索原来已有相关问题,尚未得到解决,见论坛帖子:http://bbs.locoy.com/spider-47608-1-1.html
   
火车头采集的时候,前面一段网址是跟据那来的,要怎么改,


我把 /techdoc/beginner/ 这段重复的去掉一个,要不去掉前面的,要不去掉面后的不知道要怎么弄

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-5-8 09:46:03 | 显示全部楼层
使用自定义获取网址连接啊,<a href='/bbs/[参数]' class="noline">(*)</a>
 楼主| 发表于 2010-5-8 10:03:12 | 显示全部楼层
本帖最后由 kingnib 于 2010-5-8 10:26 编辑

回复 2# afanfan2007

老大,还是不好用啊,按照你说得设置了


得到依然是:


还是……/bbs//bbs/

如果设置成禁用系统自动识别,会采集不到网址,半忙看看我是否设置错误?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-5-8 10:45:06 | 显示全部楼层
加我QQ 我帮你看看 496891421
 楼主| 发表于 2010-5-8 11:01:39 | 显示全部楼层
本帖最后由 kingnib 于 2010-5-8 11:20 编辑

问题已经解决,感谢狂风大大热心帮助,自己还要努力学习
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-19 08:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表