火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 7303|回复: 8

关于火车头判断重复数据

[复制链接]
发表于 2008-10-19 10:58:15 | 显示全部楼层 |阅读模式
是不是我把采集地址和数据全删了就无法判断了。因为没有比对了
 楼主| 发表于 2008-10-19 11:01:01 | 显示全部楼层
或者网站系统自动判断。如果是,是比对标题还是内容来判断重复。
      如果标题变了,如加个序号。是不是就判断不是重复内容你?
发表于 2008-10-19 11:03:16 | 显示全部楼层
楼主正解
 楼主| 发表于 2008-10-19 11:08:34 | 显示全部楼层
如果数据是存放在数据库中。那数据库可以判断重复内容。
但是发到空间呢?
 楼主| 发表于 2008-10-19 11:09:35 | 显示全部楼层
关系型数据库能过判断标题和内容的重复吗?或者重复95%就定为是重复内容
发表于 2008-10-19 11:27:10 | 显示全部楼层
按网址判断
发表于 2008-10-19 11:40:50 | 显示全部楼层
对,因为你删除了地址库和数据库,已经把数据和地址全部给删除,采集的时候如果没有找到以前采集的地址就是按新的来算,所以,如果想更新,就别去删除地址库和数据库!!!
 楼主| 发表于 2008-10-19 12:09:42 | 显示全部楼层
一直保留地址有点不现实。我通过接口发的时候提示发布错误:内容已存在
等于说采集了重复内容,但是没有把重复内容发出去。这样还是可以的!
发表于 2008-10-19 12:19:25 | 显示全部楼层
可以在接口里写标题判断
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 18:38

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表