[求助]以前大大讨论过的同一页面内重复采集的方式解决了吗?
首先感觉大大免费提供如此优秀的软件。说正题
最近采集一个数据网站发现其某些页面的内容会随着数据变更,但并不是全部,如果采集一定要删除现在采集的地址重新全部收集吗?有没有办法实现只对改动过的数据进行收集入库?
能不能通过比对原来数据中的某一项实现更新呢? 这样写入数据库的话量就少多了。
还有个如果出现采集的某项内容项有空值,能不能使其跳过该页数据的采集写入?
求教各位了。谢谢:victory:
[ 本帖最后由 zl965 于 2007-3-21 09:58 编辑 ]
页:
[1]