macrossz 发表于 2009-7-6 18:08:54

重复采集网址和内容的问题

今天用火车头2009SP2采集任务的时候发现昨天采集过的数据重复采集了,而且无论采集多少次都会重复采集,DATA文件夹里的SpiderResult.mdb文件的修改日期没有变化过,也就是说火车头没有把采集的数据写入数据库文件中,请高人解答这是怎么回事儿?

jueshihaogongzi 发表于 2009-7-6 20:10:37

本帖最后由 jueshihaogongzi 于 2009-7-6 20:13 编辑

我也遇到同样的事情 同求解
告知一个方法 赞可临时解决下
把不得重复选上 就可以

补充下 就是标签里

macrossz 发表于 2009-7-7 09:46:05

这个方法只是把所有的网址都采集一次而已,并不能解决采集到的数据无法写入SpiderResult.mdb文件的问题。

macrossz 发表于 2009-7-7 17:46:11

请求高人解答

macrossz 发表于 2009-7-8 08:46:25

等待高人来解答

macrossz 发表于 2009-7-9 09:55:47

继续等待ali42ls
页: [1]
查看完整版本: 重复采集网址和内容的问题