火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4017|回复: 8

火车头发布重复帖

[复制链接]
发表于 2008-12-31 01:25:06 | 显示全部楼层 |阅读模式
发布到dz7.0
只采集第一个页面的文章,只要即时更新的文章.
比如第一页采集49条.发布10条.
到第二次的时候,已经采集完了.火车头也不在采集了

提示:
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081231/00192602491.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23582602473.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23082602446.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23002602445.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22452602442.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22182602428.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22152602429.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22012602421.shtml


1/这是不是证明,我的采集规则已经搞定了?
2/发帖重复.就是它不检测这个标题或是这个网址数据库里有没有.只管发.只设1个,发1个.设10,它就从数据库里找出来10来发.如何解决.谢谢.理论上如果采集没有更新帖,它是不应该发帖的.
 楼主| 发表于 2008-12-31 01:27:53 | 显示全部楼层
发布模块用的是"dz7随机用户名",该模块是"文版主"自主研发,经坛友bd540修改了一下.
 楼主| 发表于 2008-12-31 01:37:58 | 显示全部楼层
自己再顶一下吧.估计各位版主都已经休息了.
发表于 2008-12-31 01:43:40 | 显示全部楼层
也就是说 地址库存在的连接不可以再次采集
只要不删除数据库  就不回采集重复的连接··
 楼主| 发表于 2008-12-31 01:55:48 | 显示全部楼层
文版主:也就是说 地址库存在的连接不可以再次采集
只要不删除数据库  就不回采集重复的连接··

是的,地址库确实没有再采集,我也没有再删除数据库.因为之前有网友建议,不要总是删除数据库.这样最容易采集重复帖.

现在我要解决的是:既然采集没有重复,那发布重复.问题出在哪里?是不是模块的问题?
发表于 2008-12-31 06:47:12 | 显示全部楼层
根本没有重复发布
 楼主| 发表于 2009-1-1 21:09:22 | 显示全部楼层
呵呵.文版主重新发布的程序接口和模块可以解决楼主的问题.不用再回复了.呵呵.谢谢文版主.

bd540 :根本没有重复发布   如果不出现这种情况,我也不会发这样的帖子,不止我一个人遇到这种情况.别的帖子也有,你可以看下.
发表于 2009-4-9 15:28:31 | 显示全部楼层
没有人能解决吗? 我也出现这个问题
发表于 2009-6-18 16:41:48 | 显示全部楼层
地址库存放在那儿呀,我这个问题老是解决不了。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-27 02:17

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表