火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1806|回复: 2

采集"所属页面(多页)"的小bug很烦人

[复制链接]
发表于 2009-11-26 10:40:49 | 显示全部楼层 |阅读模式
如题

标签采集规则中设置了采集“所属页面(多页)”,正则匹配得到具体内容<a href='[参数]' target='_blank'>[参数]</a>。

页面地址,用的是“在默认页源代码内采集得到地址”默认页地址为A

当“组合结果”得到的地址简称B能够正常访问并采集时一切正常

当-B地址 -无法访问出现404错误时bug就出来了

系统好像会自动采集A地址页面的内容

B地址打不开或不存在时,该标签内容本应该为空
现在变成A地址上的一些内容

很烦人哦,还请下个版本改进一下
发表于 2009-11-26 10:47:23 | 显示全部楼层
感谢楼主提出,我去测试一下。
发表于 2009-11-26 11:02:18 | 显示全部楼层
楼主说的是。我还发现。如果把B地址设置采集规则为空时,标签名称为内容时,会采集A页面的全部内容。请查正。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 02:23

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表