导入文本采集网址10000条，实际采3400，绝无重复！ - 采集器基础使用讨论区 - 火车采集器软件交流官方论坛 - Powered by Discuz! Archiver

论坛 › 采集器基础使用讨论区 › 导入文本采集网址10000条，实际采3400，绝无重复！

blc1001 发表于 2009-10-8 21:37:04

导入文本采集网址10000条，实际采3400，绝无重复！

本帖最后由 blc1001 于 2009-10-8 21:38 编辑

啥也不说了。。。郁闷~~~大家说说是啥子原因。下面是我的详细描述

深度1，导入10000个一级网址，接着开始执行

采网址-下载并分析No.XXXXX页

本来是10000个网址嘛，正常就要采网址-下载并分析No.10000页啊。
但是实际上，有时候到No.800页就开始采内容。

刚才最好一次No.3400页。接着，就不管剩下的了，直接就开始采内容了。。。晕

检查了N次导入的一级网址文件，绝无问题。

blc1001 发表于 2009-10-8 21:44:41

算不算BUG？一级网址少的时候没发现问题，多了才发现的。

blc1001 发表于 2009-10-9 09:30:33

昨晚很晚的时候，再次用【开始测试网址采集】，发现程序来到一个网址的时候总是读取不到二级网址，也不跳到下一个一级网址。就卡在那里了。
不可能是网站服务器的问题，我采的是百度啊。。。咋回事？顺便请高人回答我的帖子的第一个问题。

页: [1]

查看完整版本: 导入文本采集网址10000条，实际采3400，绝无重复！