jim.ma 发表于 2008-5-11 00:32:19

标签数量多了以后使用同时采集页面的标签会带一段网址 [内详]

我今天用的时候。 发现采集的写的规则没有问题.但是采集到的数据里总有网址.而且是网页里根本没有的半节子网址.
在反复测试多次很多次之后. 没有找到原因(已排除是采集目标增加干扰的可能)

最后我把采集规则里的标签1条1条从下向上删除每删一个就测试一次. 当删到第9条时.之前发现的问题自动消失了(并没有把问题标签删除).
之后我又把记录增加到10个 随后又增加都个标签.也没出现问题.

随后我又从新做了几次测试 .用复制粘帖的办法将以前排在前面的标签排到后面去. 发现也有此问题.

测试地址 yyk.39.net/bj/zhuanke/1e330.html
没有删除标签前的状况. 注意 医院简介 和 摘要 两个标签





都带有网址

删除一部分标签之后.没有对标签里的规则做任何的修改,只是删除了其他部分标签. 注意 医院简介 和 摘要 两个标签



网址消失了

不知这是BUG还是免费版做了什么限制? 如果收费版不存在此问题我愿意购买.

我的操作系统是 windows2003 使用的 火车3.2sp5


我上传了我的规则. 请分析一下. 注意 医院简介 和 摘要 两个标签

[ 本帖最后由 jim.ma 于 2008-5-11 01:18 编辑 ]

c868 发表于 2008-5-11 03:30:39

jim.ma 发表于 2008-5-11 10:10:53

原帖由 c868 于 2008-5-11 03:30 发表 http://bbs.locoy.com/images/common/back.gif
问题标签是 医院简介 和 摘要 两个标签





刚测试了一下.规则问题咯.

规则和软件有不兼容问题


摘要   标签


摘要 用你这个是没问题但是 医院简介呢? 摘要是没有使用"同时采集页面"的标签.
但是按照你的规则方式修改医院简介标签简介<a name="i"></a></div>[参数]<div class="blockA">还是有网址的.你试试 . 不要单独建标签测试. 就在我这个规则里改 . 如果是一个BUG那么你单独建立标签就相当于我删其他标签错误消失的结果已经证实了。 但我提供的这个规则里确实存在着问题.

而且为什么没有对标签规则任何改动的情况下只是其他标签了问题就消失了.

问题到底在哪呢困惑.

[ 本帖最后由 jim.ma 于 2008-5-11 10:40 编辑 ]

孤魂 发表于 2008-5-11 10:50:36

偶尔会出现这个BUG

jim.ma 发表于 2008-5-11 11:07:58

ali27ls
是BUG ,我就心里有数了. 我就是怕是我自己的问题. 谢谢斑竹.
页: [1]
查看完整版本: 标签数量多了以后使用同时采集页面的标签会带一段网址 [内详]