火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3071|回复: 7

请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???

[复制链接]
发表于 2011-4-18 16:39:06 | 显示全部楼层 |阅读模式
本帖最后由 linzhiwei003 于 2011-4-18 16:58 编辑

请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???

意思就是,不是每次采集文章都是从头到尾的全部采集下来,而是只采集被修改的文章或者只采集新出来的文章!!!<hr>
不知道 火车头可不可以做到。 或者 用其它什么方法可不可以做到!!!
希望有知道 的同学可不可以告诉我呢?,谢谢大家 哈!!!
 楼主| 发表于 2011-4-18 17:12:22 | 显示全部楼层
 楼主| 发表于 2011-4-19 12:01:06 | 显示全部楼层
 楼主| 发表于 2011-4-19 12:01:27 | 显示全部楼层
没有人知道吗!!!
发表于 2011-4-19 13:38:04 | 显示全部楼层
采集器有检测重复的功能,可以实现每次只采集新出来的文章,但修改后的文章目前采集器实现不了
 楼主| 发表于 2011-4-19 15:53:06 | 显示全部楼层
哦,这样啊,谢谢啊!!!
 楼主| 发表于 2011-4-19 15:54:05 | 显示全部楼层
回复 5# wxl08


    那问您一个别的问题,页面返加就一个数字,如何采集这个数字呢???
 楼主| 发表于 2011-4-19 16:48:42 | 显示全部楼层
回复 7# linzhiwei003


    自己解决了: 用如下正则表达式就可以了:   ^(?<content>[\s\S]*?)$
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-1 20:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表