火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4102|回复: 5

建议:能否增加对标签内容的重复判定选择

[复制链接]
发表于 2008-10-19 10:01:37 | 显示全部楼层 |阅读模式
在采集的时候,有些标签,如标题,希望能通过火车头直接去重
目前我的解决方案是通过火车头编制完任务以后,再到生成的ACCESS数据库里,对Content表进行设计,选择标题,将标题的索引选项修改为"有(无重复)",这样才能保证采集下来的文章标题不会重复,非常麻烦
能否在火车头中的标签设置里,除了2008已经增加的"10、加入了采集时可选是否检测重复网址的功能,增加采集的速度"外,再增加一个"采集时可选标签内容是否重复",直接完成我在数据库里做的设置

在论坛及其他地方也的确看到有些朋友有问如何在发布前去重复的问题,如果加了这个功能应该可以直接实现,望火车头开发人员能参考

谢谢
发表于 2008-10-20 15:11:35 | 显示全部楼层

强列支持

强列支持强列支持强列支持
 楼主| 发表于 2008-10-23 09:48:37 | 显示全部楼层
怎么就我的帖子没管理员来啊,顶上来
发表于 2008-12-19 15:14:27 | 显示全部楼层
3# taikou

这个可以批量处理。
发表于 2008-12-20 19:31:08 | 显示全部楼层
楼主可以采集完毕后,用SQL语句批量处理本地采集数据库
发表于 2016-2-9 22:34:00 | 显示全部楼层
爪,以后学习下。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 19:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表