|
火车老大,每次都希望等你好的SP修正过的3.2版出来,但出来后每次用时,都让我失望与 ,希望下个SP不会让我失望!
这是我第五次用你不光提速,还提价的火车采集器,头一次用见正式版第四个小报告,第二次用见正式版第五个小报告,第三次用见正式版第七个小报告,第四次见正式版第八个小报告,这次便是这个了.呵呵,到底是我水平不够,还是火车老大的软件设计的BUG太多.不得而知,望火车老大告知!
如果我提的每个BUG属实,建议火车老大奖励一个企业版3.2采集器!
SP2版(2007-9-26)BUG情况:
当采用SP2采集相关网站数据时,如果按所有标签都循环和每条循环当作新记录时,如下图:
将出现大量的空白采集行,数量是你所采集有内容的信息的一倍.如下图:
另外,在所采集的有内容的信息中,也存在大量的重复行.大概数量是有采集内容行的6%.如下图:
相比,SP1却不会出现这种情况.另外采相同的网站的内容,SP1的速度比SP2的快的多.这除了多采重复行和重复空行外.在算法上是不是也有原因.请老大答复一下.呵呵
[ 本帖最后由 whoami1731 于 2007-9-30 17:03 编辑 ] |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|