火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4046|回复: 4

每个栏目总有几十篇采集不下来,能采集的 Web 在线发布正常

[复制链接]
发表于 2007-11-8 11:19:42 | 显示全部楼层 |阅读模式
如何能重新采集漏掉的这几十篇呢?要求先前已经采集入库的不重复采集!

那些漏掉的是因为内容布局不同,采集的正文内容为空,所以火车没有发布。

修改规则后,重新采集的话,因为该网址已经存在,采集器里该记录内容也已经存在,火车就不再重新采集了。

怎么办啊?



[ 本帖最后由 SmartMichael 于 2007-11-8 11:21 编辑 ]
发表于 2007-11-8 12:35:22 | 显示全部楼层
右键,删除已采集的数据
 楼主| 发表于 2007-11-8 17:32:12 | 显示全部楼层
原帖由 luobo525 于 2007-11-8 12:35 发表
右键,删除已采集的数据

没搞明白我的问题呀,好像?

发表于 2007-11-8 18:36:02 | 显示全部楼层

回复 undefined 的帖子

如何能重新采集漏掉的这几十篇呢?要求先前已经采集入库的不重复采集!
那些漏掉的是因为内容布局不同,采集的正文内容为空,所以火车没有发布。
修改规则后,重新采集的话,因为该网址已经存在,采集器里该记录内容也已经存在,火车就不再重新采集了。

这样也很简单.打开你要重新采集的任务数据数据库,你会看到有采集过和没有采集到的那些文章!

如果你已经发布过一些,那么可以排列一下这些数据,把发布的文章全部删除!然后重新设置采集规则,再采集没有采集
到的文章!
 楼主| 发表于 2007-11-8 19:06:03 | 显示全部楼层

谢谢回楼上的,我去试试。

我用的是 3.2 免费正式版
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-23 20:14

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表