zl965 发表于 2007-3-21 09:54:24

[求助]以前大大讨论过的同一页面内重复采集的方式解决了吗?

首先感觉大大免费提供如此优秀的软件。

说正题

最近采集一个数据网站发现其某些页面的内容会随着数据变更,但并不是全部,如果采集一定要删除现在采集的地址重新全部收集吗?有没有办法实现只对改动过的数据进行收集入库?

能不能通过比对原来数据中的某一项实现更新呢? 这样写入数据库的话量就少多了。


还有个如果出现采集的某项内容项有空值,能不能使其跳过该页数据的采集写入?

求教各位了。谢谢:victory:

[ 本帖最后由 zl965 于 2007-3-21 09:58 编辑 ]
页: [1]
查看完整版本: [求助]以前大大讨论过的同一页面内重复采集的方式解决了吗?