如何排除重复的内容---不是一般的重复!
我采集某个分类信息网时,因为那个网站上的注册者可以把自己的信息进行更新,更新后内容是一样,但是却形成了新的网址,所以每次采集的时候,都采集不同的网址,但是内容却相同,造成信息的重复和空间的浪费,有没有设置排除内容相同的功能开发???? 火车有一个内容比队的功能在标签设置里 比如你的 规则有 两个标签标题和内容 在标题标签里设置 改内容不得重复,那么采集的时候就会对内容进行 比对,如果重复了就不会 采集或发布,呵呵。
位置 自己仔细在标签里寻找 很好找。 感谢您的回复,我试一下。现在又出现重复网址的内容,又自动发布了。 和你们一块学习。。。
页:
[1]