火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3801|回复: 4

★☆★☆★☆★☆★☆★[BUG报告] 错误地提示重复而不进行采集?★☆★☆★

[复制链接]
发表于 2008-1-24 00:14:14 | 显示全部楼层 |阅读模式
(1)假设一个栏目有30页,我第一次设置任务是采集17页;如果我下次设置采集29页,本来应该采集其他12也出来,但是采集器为什么说重复(即使重复也是只重复前17页,后面的还没有采集的应该采呀)、报错?

(2)假设一个栏目的第1页有40篇文章,每日更新,我设置的采集任务就是每日采集这个第1页,为什么系统会错误地提示重复而不进行采集?!!!!

[ 本帖最后由 hzd888 于 2008-1-24 17:20 编辑 ]
 楼主| 发表于 2008-1-24 17:12:14 | 显示全部楼层

全局设置中"连续采集多少条后跳过"设置为0不起作用

大大的BUG!为什么不恢复呢?
 楼主| 发表于 2008-1-24 17:19:04 | 显示全部楼层

通过采集过的网站地址来设置是否重复是不科学的!

如果要过滤,可以在接口文件中自己写个语句,例如文章所属栏目、标题和日期是否一致,一直的话才认为是重复的.
 楼主| 发表于 2008-1-24 18:02:21 | 显示全部楼层

举例说明如下

举个例子给你:假设我每日只采集http://www.lllllll.cn/n480462/n480483/n480610/index.html这个网站地址,假设这个网站地址每日更新20篇文章。
按照现在的火车头SP5,错误地认为是重复的网址,而放弃采集、发布;
即使网址是重复的,但是只要文章是每日更新的---不同的,怎么就放弃采集呢?
发表于 2008-7-19 18:02:15 | 显示全部楼层
新版中可以不检测重复,直接可以采集
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 20:58

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表