|
本帖最后由 wb990 于 2009-8-1 15:13 编辑
首先 单独使用采网址功能时候 提示如下:
当前获取网址深度为1,线程池内所有线程线程空闲,采集网址工作全部完成,共采集网址50条,其中重复0实际50条...
直接跳过采集内容,进入发布内容步骤
无需发布内容,任务全部完成
无需发布内容,任务全部完成
接着使用采集内容功能时候 提示如下:
直接跳过采集网址,进入采集内容步骤
重新载入未采集内容的网址列表...
共找到需要重新采集网址0条
采集内容全部完成√ 共采集到有效内容0条;
考虑到防采集的因素,采集进程已经设置为1,时间设置为200000毫秒,效果还是同上.
比较一下 目标站成功采集时候的状态,发现 在成功采集的时候,采集列表的频率大概为2秒一个地址,而出错的时候大概为2秒10个地址
不知道是什么原因了.
在发完这个帖子后 突然想到 自己的任务是复制的,会不会是这个原因造成,试验了一下,在把复制的任务删除掉一个标签以后,采集正常了.
看来问题出在任务的复制上. |
|