请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???
本帖最后由 linzhiwei003 于 2011-4-18 16:58 编辑请教大家:火车头可不可以只采集那些新出来的文章或被修改的文章呢???
意思就是,不是每次采集文章都是从头到尾的全部采集下来,而是只采集被修改的文章或者只采集新出来的文章!!!<hr>
不知道 火车头可不可以做到。 或者 用其它什么方法可不可以做到!!!
希望有知道 的同学可不可以告诉我呢?,谢谢大家 哈!!!{:4_180:}
{:4_181:}{:4_181:}{:4_181:}{:4_181:} {:4_196:}{:4_196:}{:4_196:}{:4_196:}{:4_196:} 没有人知道吗!!! 采集器有检测重复的功能,可以实现每次只采集新出来的文章,但修改后的文章目前采集器实现不了 哦,这样啊,谢谢啊!!! 回复 5# wxl08
那问您一个别的问题,页面返加就一个数字,如何采集这个数字呢??? 回复 7# linzhiwei003
自己解决了: 用如下正则表达式就可以了: ^(?<content>[\s\S]*?)$
页:
[1]