insun 发表于 2006-7-18 19:52:21

2.0的问题

1、清空数据库问题,我发现清空数据库一点,全部都清空 了,这样不合理。在发表之前肯定要多次测试规则任务,测试完了自然要清空。但是按现在的情况看肯定重复发贴。

2、重复发贴问题,感觉重复发贴挺严重的。

3、分页内容采集不到,这个之前反映过了,不过希望能尽快解决这个问题。

沦陷今生 发表于 2006-7-18 20:15:39

第一个的确很重要。要能分任务清空就好了

dr5d 发表于 2006-7-19 23:37:16

分任务,分时间段清空。
在我来说,我不想地址库保存太多,只要保证每天的地址不重复就行了。如果地址保存太多,会占太多空间,没必要。

insun 发表于 2006-7-20 19:40:39

原帖由 dr5d 于 2006-7-19 23:37 发表
分任务,分时间段清空。
在我来说,我不想地址库保存太多,只要保证每天的地址不重复就行了。如果地址保存太多,会占太多空间,没必要。


除非你是一天更新一次采集的网址,否则不可能清空了数据库而不重复,或者你是只采集首页,而首页每天都更新:lol
页: [1]
查看完整版本: 2.0的问题