关于采集后更新的问题
各位大虾们,如果我采集了一个站的东西,如果这个站点的东西了,我以后怎么只采集它更新的那部分回复 undefined 的帖子
怎么没人顶的 这个得看具体的列表页面.结合采集站自身的更新速度.火车头程序是没法判读是否为更新的.
如果特别需要,可以定制一个接口判断 火车头有连接存储的,相同连接的东西不会采集的
回复 4楼 的帖子
是这样没错啦,但是它也会重新一条一条数据去判断的,这样和重新采集没什么分别吧,我要更新的就那一两条数据(一个页面),它要是重新一条一条分析判断是否存在数据库,很费时间的
页:
[1]