linzhiwei003 发表于 2011-4-18 16:39:06

请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???

本帖最后由 linzhiwei003 于 2011-4-18 16:58 编辑

请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???

意思就是,不是每次采集文章都是从头到尾的全部采集下来,而是只采集被修改的文章或者只采集新出来的文章!!!<hr>
不知道 火车头可不可以做到。 或者 用其它什么方法可不可以做到!!!
希望有知道 的同学可不可以告诉我呢?,谢谢大家 哈!!!{:4_180:}

linzhiwei003 发表于 2011-4-18 17:12:22

{:4_181:}{:4_181:}{:4_181:}{:4_181:}

linzhiwei003 发表于 2011-4-19 12:01:06

{:4_196:}{:4_196:}{:4_196:}{:4_196:}{:4_196:}

linzhiwei003 发表于 2011-4-19 12:01:27

没有人知道吗!!!

wxl08 发表于 2011-4-19 13:38:04

采集器有检测重复的功能,可以实现每次只采集新出来的文章,但修改后的文章目前采集器实现不了

linzhiwei003 发表于 2011-4-19 15:53:06

哦,这样啊,谢谢啊!!!

linzhiwei003 发表于 2011-4-19 15:54:05

回复 5# wxl08


    那问您一个别的问题,页面返加就一个数字,如何采集这个数字呢???

linzhiwei003 发表于 2011-4-19 16:48:42

回复 7# linzhiwei003


    自己解决了: 用如下正则表达式就可以了:   ^(?<content>[\s\S]*?)$
页: [1]
查看完整版本: 请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???