火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4970|回复: 5

采集链接的bug

[复制链接]
发表于 2007-3-23 22:41:44 | 显示全部楼层 |阅读模式
用测试站点的 搜狐军事测试 采集回来的是这个样子的链接。
mil.news.sohu.com/http://mil.news.sohu.com/20061225/n247252592.shtml
这个问题只是3.1有,我已经遇到过多次。

还有火车的标签排除功能,除了能正常排除<a>标签,别的都不是太好用,而且好像小写的标签可以排除,大写的不行,规范的标签可以排除,书写不规范的不行。
 楼主| 发表于 2007-3-23 22:46:41 | 显示全部楼层
还有,既然火车有入自带的数据库的这个功能,就应该具备将采集到本地的内容再编辑,整理的功能。而现在只具备导出为sql文件或html,都不能导入到mysql等别的数据库。
头像被屏蔽
发表于 2007-3-28 23:55:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2007-4-3 20:23:20 | 显示全部楼层
网址采集也没有替换啊,只有 必须包含  不得包含。

还有一个办法就是导出二级网址,用记事本等替换后再导入。

不过这的确是链接分析的BUG啊,还是等火车老大修复吧。
发表于 2007-4-8 19:13:57 | 显示全部楼层
我用3.1好象没遇到这问题...
发表于 2007-4-15 14:32:40 | 显示全部楼层
这个问题我也遇到过。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 12:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表