2.0的问题
1、清空数据库问题,我发现清空数据库一点,全部都清空 了,这样不合理。在发表之前肯定要多次测试规则任务,测试完了自然要清空。但是按现在的情况看肯定重复发贴。2、重复发贴问题,感觉重复发贴挺严重的。
3、分页内容采集不到,这个之前反映过了,不过希望能尽快解决这个问题。 第一个的确很重要。要能分任务清空就好了 分任务,分时间段清空。
在我来说,我不想地址库保存太多,只要保证每天的地址不重复就行了。如果地址保存太多,会占太多空间,没必要。 原帖由 dr5d 于 2006-7-19 23:37 发表
分任务,分时间段清空。
在我来说,我不想地址库保存太多,只要保证每天的地址不重复就行了。如果地址保存太多,会占太多空间,没必要。
除非你是一天更新一次采集的网址,否则不可能清空了数据库而不重复,或者你是只采集首页,而首页每天都更新:lol
页:
[1]