建议:能否增加对标签内容的重复判定选择
在采集的时候,有些标签,如标题,希望能通过火车头直接去重目前我的解决方案是通过火车头编制完任务以后,再到生成的ACCESS数据库里,对Content表进行设计,选择标题,将标题的索引选项修改为"有(无重复)",这样才能保证采集下来的文章标题不会重复,非常麻烦
能否在火车头中的标签设置里,除了2008已经增加的"10、加入了采集时可选是否检测重复网址的功能,增加采集的速度"外,再增加一个"采集时可选标签内容是否重复",直接完成我在数据库里做的设置
在论坛及其他地方也的确看到有些朋友有问如何在发布前去重复的问题,如果加了这个功能应该可以直接实现,望火车头开发人员能参考
谢谢
强列支持
强列支持强列支持强列支持 怎么就我的帖子没管理员来啊,顶上来 3# taikou这个可以批量处理。 楼主可以采集完毕后,用SQL语句批量处理本地采集数据库 爪,以后学习下。。
页:
[1]