power11 发表于 2011-3-3 15:26:04

求助:怎么解除掉《采网址--重复网址,排除:》

怎么解除掉《采网址--重复网址,排除:》这个命令啊???????????
还有这个《采内容--该条记录与数据库中某个标签字段重复,自动过滤该条结果 》

303718 发表于 2011-3-3 15:42:56

这些问题采集规则里有得选呀。

蔡森斌 发表于 2011-3-3 15:55:57

想要没有重复网址,就看你在写采集规则的时候有没有过滤掉重复的网址了。

power11 发表于 2011-3-3 17:45:40

我这个问题是采集了
传到我的网站上测试过,内容不符合要求,然后重新采集时就出现了那个,再次采集不到啊???
采网址--重复网址,排除:http://bbs.XXXXX.org/read.php?tid=18947&fpage=5 id=a_ajax_18947
采网址--重复网址,排除:http://bbs.XXXXX.org/read.php?tid=23719&fpage=5 id=a_ajax_23719
采网址--重复网址,排除:http://bbs.XXXXX.org/read.php?tid=6971&fpage=5 id=a_ajax_6971
采网址--重复网址,排除:http://bbs.XXXXX.org/read.php?tid=23647&fpage=5 id=a_ajax_23647
采网址--重复网址,排除:http://bbsXXXXX.org/read.php?tid=23568&fpage=5 id=a_ajax_23568

zjyk1984 发表于 2011-3-3 20:05:37

清空原来的采集网址和数据就行了

solotraveler 发表于 2011-3-4 01:53:22

你可以选择清空采集的地址。
也可以在全局设置里面修改忽略重复地址。这样就算地址重复也照采集不误。
www.dataindex.org
页: [1]
查看完整版本: 求助:怎么解除掉《采网址--重复网址,排除:》