重复采集网址和内容的问题
今天用火车头2009SP2采集任务的时候发现昨天采集过的数据重复采集了,而且无论采集多少次都会重复采集,DATA文件夹里的SpiderResult.mdb文件的修改日期没有变化过,也就是说火车头没有把采集的数据写入数据库文件中,请高人解答这是怎么回事儿? 本帖最后由 jueshihaogongzi 于 2009-7-6 20:13 编辑我也遇到同样的事情 同求解
告知一个方法 赞可临时解决下
把不得重复选上 就可以
补充下 就是标签里
这个方法只是把所有的网址都采集一次而已,并不能解决采集到的数据无法写入SpiderResult.mdb文件的问题。 请求高人解答 等待高人来解答 继续等待ali42ls
页:
[1]