火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4139|回复: 2

数据采集重复问题,请版主、高手指导

[复制链接]
发表于 2007-1-11 01:24:53 | 显示全部楼层 |阅读模式
3.0.1版的火车
在内容规则的典型页面测试中能正确采集数据
但一旦正式采集数据后,会将许多内容规则外的数据也采集过来,并且还会多次重复采集,这是怎么回事啊
请版主、高手指导一下。
附件是导出的规则。
网址:http://search.daqi.com/cgi-bin/s ... p;chl=tu&page=1,是2级目录,要采集里面的图片文章。

[ 本帖最后由 7306 于 2007-1-11 21:04 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2007-1-11 09:31:26 | 显示全部楼层
晚上给你看看吧
 楼主| 发表于 2007-1-11 21:07:54 | 显示全部楼层
谢谢版主及时回复
我后来把规则改了下似乎解决了部分问题,现在在采集网址的“开始测试网址采集”以及内容规则中的“典型页面测试”都能按要求完成,但我按开始键正式采集后还是采集出许多不相关的页面及重复页面,我如何编辑采集出来的数据?系统似乎没法手工添加或删除。

[ 本帖最后由 7306 于 2007-1-11 21:20 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 02:02

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表