blc1001 发表于 2009-10-8 21:37:04

导入文本采集网址10000条,实际采3400,绝无重复!

本帖最后由 blc1001 于 2009-10-8 21:38 编辑

啥也不说了。。。郁闷~~~大家说说是啥子原因。下面是我的详细描述


深度1,导入10000个一级网址,接着开始执行

采网址-下载并分析No.XXXXX页

本来是10000个网址嘛,正常就要采网址-下载并分析No.10000页啊。
但是实际上,有时候到No.800页就开始采内容。

刚才最好一次No.3400页。接着,就不管剩下的了,直接就开始采内容了。。。晕

检查了N次导入的一级网址文件,绝无问题。

blc1001 发表于 2009-10-8 21:44:41

算不算BUG?一级网址少的时候没发现问题,多了才发现的。

blc1001 发表于 2009-10-9 09:30:33

昨晚很晚的时候,再次用 【开始测试网址采集】, 发现程序来到一个网址的时候总是读取不到二级网址,也不跳到下一个一级网址。就卡在那里了。
不可能是网站服务器的问题,我采的是百度啊。。。咋回事?顺便请高人回答我的帖子的第一个问题。
页: [1]
查看完整版本: 导入文本采集网址10000条,实际采3400,绝无重复!