|
我今天用的时候。 发现采集的写的规则没有问题.但是采集到的数据里总有网址.而且是网页里根本没有的半节子网址.
在反复测试多次很多次之后. 没有找到原因(已排除是采集目标增加干扰的可能)
最后我把采集规则里的标签1条1条从下向上删除每删一个就测试一次. 当删到第9条时.之前发现的问题自动消失了(并没有把问题标签删除).
之后我又把记录增加到10个 随后又增加都个标签.也没出现问题.
随后我又从新做了几次测试 .用复制粘帖的办法将以前排在前面的标签排到后面去. 发现也有此问题.
测试地址 yyk.39.net/bj/zhuanke/1e330.html
没有删除标签前的状况. 注意 医院简介 和 摘要 两个标签
都带有网址
删除一部分标签之后.没有对标签里的规则做任何的修改,只是删除了其他部分标签. 注意 医院简介 和 摘要 两个标签
网址消失了
不知这是BUG还是免费版做了什么限制? 如果收费版不存在此问题我愿意购买.
我的操作系统是 windows2003 使用的 火车3.2sp5
我上传了我的规则. 请分析一下. 注意 医院简介 和 摘要 两个标签
[ 本帖最后由 jim.ma 于 2008-5-11 01:18 编辑 ] |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|