采集"所属页面（多页）"的小bug很烦人

dlhe · 发表于 2009-11-26 10:40:49

如题

标签采集规则中设置了采集“所属页面（多页）”，正则匹配得到具体内容<a href='[参数]' target='_blank'>[参数]</a>。

页面地址，用的是“在默认页源代码内采集得到地址”默认页地址为A

当“组合结果”得到的地址简称B能够正常访问并采集时一切正常

当-B地址 -无法访问出现404错误时bug就出来了

系统好像会自动采集A地址页面的内容

B地址打不开或不存在时，该标签内容本应该为空
现在变成A地址上的一些内容

很烦人哦，还请下个版本改进一下

vus520 · 发表于 2009-11-26 10:47:23

感谢楼主提出，我去测试一下。

论坛政要 · 发表于 2009-11-26 11:02:18

楼主说的是。我还发现。如果把B地址设置采集规则为空时，标签名称为内容时，会采集A页面的全部内容。请查正。

帐号		自动登录	找回密码
密码			加入会员