火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4857|回复: 5

建议增加专门的采集新闻功能,每次只采集最新的几条,多余的自动标记为已发

[复制链接]
发表于 2012-8-30 11:18:16 | 显示全部楼层 |阅读模式
[hr]建议增加专门的采集新闻功能,每次只采集最新的几条,多余的自动标记为已发。这样多余的就不会下次在发布了,

新闻肯定是需要最新的资讯。
发表于 2012-10-20 11:33:05 | 显示全部楼层
难度很大吧,可以手工做规则,限制时间,不过要一天一改。理论上可行,如果火车头支持了,我也很欢迎呀!
发表于 2012-10-20 11:38:14 | 显示全部楼层
很多人都曾经这么想过,这样子想法是很好的,但是 跟采集思路是违背的或者说限制的,采集的原理就是按页码顺序抓取的。
设计这样一个思路,也是可以的。
当规则添加一个时间标签。火车头处理该标签采集结果,然后与系统时间作对比(备注:火车头要对比所有格式时间,)。如果是今天,则探测对比下一条,如果不是今天,后面直接跳过了。(备注:火车头这里可以自定义是否跳过)。
难度貌似有些大了,或者苛刻
发表于 2012-10-20 11:40:22 | 显示全部楼层
本帖最后由 caijihome 于 2012-10-20 11:41 编辑

总的来说,楼主这个问题,用定时采集就可以解决呀!每天定时采集下来就是当天数据,难道不是吗?
第一次可能做不到,以后就好了,从这个角度讲,楼主的提问就是多此一举。
发表于 2012-11-3 00:16:17 | 显示全部楼层
这厢有理了,但是此功能正如楼主3楼所说,这样的判断不违法采集原理,此功能可有!
发表于 2016-2-10 17:56:20 | 显示全部楼层
支持火车。。。。历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 03:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表