火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3243|回复: 1

重复网址问题

[复制链接]
发表于 2011-2-6 19:46:45 | 显示全部楼层 |阅读模式
由于受网速及服务器响应慢等问题,导致采集分页数据时出现重复采集数据的问题。
如果在任务里开启《检测重复网址》选项那么会丢掉应该采集的数据。
在PageUrl文件夹下的access文件里保存的是加密的网址数据,而且也没有提示哪些数据是重复的,感觉PageUrl表的作用仅仅是用来判断采集的数据是否与已有的数据重复,所以建议增加能记录已重复网址的数据表,或者是Log文件。
发表于 2016-2-8 18:14:50 | 显示全部楼层
和你们一块学习。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-4-21 07:13

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表