dlhe 发表于 2009-11-26 10:40:49

采集"所属页面(多页)"的小bug很烦人

如题

标签采集规则中设置了采集“所属页面(多页)”,正则匹配得到具体内容<a href='[参数]' target='_blank'>[参数]</a>。

页面地址,用的是“在默认页源代码内采集得到地址”默认页地址为A

当“组合结果”得到的地址简称B能够正常访问并采集时一切正常

当-B地址 -无法访问出现404错误时bug就出来了

系统好像会自动采集A地址页面的内容

B地址打不开或不存在时,该标签内容本应该为空
现在变成A地址上的一些内容

很烦人哦,还请下个版本改进一下

vus520 发表于 2009-11-26 10:47:23

感谢楼主提出,我去测试一下。

论坛政要 发表于 2009-11-26 11:02:18

楼主说的是。我还发现。如果把B地址设置采集规则为空时,标签名称为内容时,会采集A页面的全部内容。请查正。
页: [1]
查看完整版本: 采集"所属页面(多页)"的小bug很烦人