导入文本采集网址10000条,实际采3400,绝无重复!
本帖最后由 blc1001 于 2009-10-8 21:38 编辑啥也不说了。。。郁闷~~~大家说说是啥子原因。下面是我的详细描述
深度1,导入10000个一级网址,接着开始执行
采网址-下载并分析No.XXXXX页
本来是10000个网址嘛,正常就要采网址-下载并分析No.10000页啊。
但是实际上,有时候到No.800页就开始采内容。
刚才最好一次No.3400页。接着,就不管剩下的了,直接就开始采内容了。。。晕
检查了N次导入的一级网址文件,绝无问题。 算不算BUG?一级网址少的时候没发现问题,多了才发现的。 昨晚很晚的时候,再次用 【开始测试网址采集】, 发现程序来到一个网址的时候总是读取不到二级网址,也不跳到下一个一级网址。就卡在那里了。
不可能是网站服务器的问题,我采的是百度啊。。。咋回事?顺便请高人回答我的帖子的第一个问题。
页:
[1]