火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5067|回复: 5

求救 内容替换的通配符问题

[复制链接]
发表于 2011-9-1 20:00:17 | 显示全部楼层 |阅读模式
1火车车厢
<img src="/images/IA31-16_files/logo.jpg />
<img src="/images/IA31-16_files/111.jpg />
<img src="images/IA31-16_files/222.jpg />
<img src="/images/IA31-16_files/fangwei.jpg />


<img src="/images/IA32-19_files/logo.jpg />
<img src="/images/IA32-19_files/333.jpg />
<img src="images/IA32-19_files/444.jpg />
<img src="/images/IA32-19_files/fangwei.jpg />


<img src="/images/IA33-19_files/logo.jpg />
<img src="/images/IA33-19_files/555.jpg />
<img src="images/IA33-19_files/666.jpg />
<img src="/images/IA33-19_files/fangwei.jpg />

……

上面举例了三个页面的三组图片。由于最后一个fangwei.jpg都是同一张图片,不想采集的时候多次下载。

我的操作是:
1、在下载文件排除列表中,排除了 fangwei

2、在采集内容的时候,进行了内容替换。我写的规则是 /images/(*)_files/fangwei.jpg 替换为/images/goods/intro/fangwei.jpg

但是用了这个通配符后,每个页面的前面三个图片都直接被过滤掉了,采集出来的结果都是 <img src=="/images/goods/intro/fangwei.jpg" />

按照我的理解,应该这个规则不是到通配符就结束了的,怎么会把前面两个图片都过滤了呢,通配符后面还有其他内容需要匹配的啊?


如果我写的不对,那内容替换规则应该怎么写?

我预期的采集结果应该是下面的,只是最后的图片路径被改变了

<img src="/images/IA31-16_files/logo.jpg” />
<img src="/images/IA31-16_files/111.jpg” />
<img src="images/IA31-16_files/222.jpg” />
<img src="/images/goods/intro/fangwei.jpg“ />


<img src="/images/IA32-19_files/logo.jpg” />
<img src="/images/IA32-19_files/333.jpg” />
<img src="images/IA32-19_files/444.jpg” />
<img src="/images/goods/intro/fangwei.jpg“ />


<img src="/images/IA33-19_files/logo.jpg” />
<img src="/images/IA33-19_files/555.jpg” />
<img src="images/IA33-19_files/666.jpg” />
<img src="/images/goods/intro/fangwei.jpg“ />

 楼主| 发表于 2011-9-1 20:11:58 | 显示全部楼层
有没有人帮忙看看啊 谢谢咯
 楼主| 发表于 2011-9-1 20:25:52 | 显示全部楼层
只是用到了通配符 没有用到[参数] 的哦
发表于 2011-9-2 09:06:29 | 显示全部楼层

你这种写法肯定不对 ,/image 是以第一个这个为准啊,也就是第一张图片地址里的这个为准 所以前面的图片都被排除了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2011-9-2 09:08:34 | 显示全部楼层
<img src="/images/(*)/fangwei.jpg />替换为替换为<img src="images/goods/intro/fangwei.jpg"/>
 楼主| 发表于 2011-9-2 10:56:22 | 显示全部楼层
回复 5# 流浪侠女


斑竹你的 <img src="/images/(*)/fangwei.jpg /> 和我的<img src="/images/(*)_files/fangwei.jpg /> 没区别啊?

就是前面的图片也会被排除掉,不知道为什么哦

难道火车头程序有这个过滤的bug?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 15:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表