glgeneral 发表于 2008-12-31 01:25:06

火车头发布重复帖

发布到dz7.0
只采集第一个页面的文章,只要即时更新的文章.
比如第一页采集49条.发布10条.
到第二次的时候,已经采集完了.火车头也不在采集了

提示:
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081231/00192602491.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23582602473.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23082602446.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/23002602445.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22452602442.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22182602428.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22152602429.shtml
采网址--重复,该网址在站点地址库中存在:http://finance.sina.com.cn/money/forex/20081230/22012602421.shtml


1/这是不是证明,我的采集规则已经搞定了?
2/发帖重复.就是它不检测这个标题或是这个网址数据库里有没有.只管发.只设1个,发1个.设10,它就从数据库里找出来10来发.如何解决.谢谢.理论上如果采集没有更新帖,它是不应该发帖的.

glgeneral 发表于 2008-12-31 01:27:53

发布模块用的是"dz7随机用户名",该模块是"文版主"自主研发,经坛友bd540修改了一下.

glgeneral 发表于 2008-12-31 01:37:58

自己再顶一下吧.估计各位版主都已经休息了.

懷念過去↑文 发表于 2008-12-31 01:43:40

也就是说 地址库存在的连接不可以再次采集
只要不删除数据库就不回采集重复的连接··

glgeneral 发表于 2008-12-31 01:55:48

文版主:也就是说 地址库存在的连接不可以再次采集
只要不删除数据库就不回采集重复的连接··

是的,地址库确实没有再采集,我也没有再删除数据库.因为之前有网友建议,不要总是删除数据库.这样最容易采集重复帖.

现在我要解决的是:既然采集没有重复,那发布重复.问题出在哪里?是不是模块的问题?

bd540 发表于 2008-12-31 06:47:12

根本没有重复发布

glgeneral 发表于 2009-1-1 21:09:22

呵呵.文版主重新发布的程序接口和模块可以解决楼主的问题.不用再回复了.呵呵.谢谢文版主.

bd540 :根本没有重复发布   如果不出现这种情况,我也不会发这样的帖子,不止我一个人遇到这种情况.别的帖子也有,你可以看下.

abd1001 发表于 2009-4-9 15:28:31

没有人能解决吗? 我也出现这个问题

xixiYaYa 发表于 2009-6-18 16:41:48

地址库存放在那儿呀,我这个问题老是解决不了。
页: [1]
查看完整版本: 火车头发布重复帖