火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2728|回复: 2

求一个 匹配 src 里面 内容的正则

[复制链接]
发表于 2011-10-6 17:01:38 | 显示全部楼层 |阅读模式
如题

<div id="productMainImage" class="centeredContent back">(?<content>[\s\S]*?)</a>
(?<content>[\s\S]*?) 这个怎么改 才能匹配 开头字符串<div id="productMainImage" class="centeredContent back">  和结束字符串</a> 里面 src 的内容

下面是 开头字符串与结束字符串之间的内容
<script language="javascript" type="text/javascript">
<!--
document.write('<a href="javascript:popupWindow(\'http://www.chanelkings.com/index.php?main_page=popup_image&amp;pID=75\')">
<img src="images/Chanel Handbags Newest/36076-aqua-blue-gold-1.JPG" alt="Chanel Bags Newest Aqua Blue Gold 36070" title=" Chanel Bags Newest Aqua Blue Gold 36070 " width="250" height="167" />

我要的是 src里的内容
发表于 2011-10-6 23:11:46 | 显示全部楼层
可以试试这个正则:
  1. <div id="productMainImage" class="centeredContent back">[\s\S]*?<img src="(?<content>[\s\S]*?)"
复制代码
由于你没有提供网站地址,所以不能用火车头测试,不清楚能否匹配,不过我在php里测试是可以获得匹配的

一直不会用火车头里的正则,看了些资料,也大概知道了火车头正则的设置,(?<content>[\s\S]*?)是捕获,只有一个捕获,并且命名了捕获的键名content,用来识别,其他的和正则一样


php的正则匹配代码

  1. <?php
  2. $str='<div id="productMainImage" class="centeredContent back"><script language="javascript" type="text/javascript">
  3. <!--
  4. document.write(\'<a href="javascript:popupWindow(\'http://www.chanelkings.com/index.php?main_page=popup_image&amp;pID=75\')">
  5. <img src="images/Chanel Handbags Newest/36076-aqua-blue-gold-1.JPG" alt="Chanel Bags Newest Aqua Blue Gold 36070" title=" Chanel Bags Newest Aqua Blue Gold 36070 " width="250" height="167" />

  6. </a>';//目标字符串

  7. $exp='/<div id="productMainImage" class="centeredContent back">[\s\S]*?<img src="(?<content>[\s\S]*?)"/i';//正则表达式

  8. preg_match_all($exp,$str,$arr);//匹配全部满住条件的

  9. //print_r($arr);
  10. if(!empty($arr['content'])){//存在匹配
  11. echo '匹配存在:<br>';
  12. print_r($arr['content']);
  13. }

  14. else echo '没有匹配,检查正则<br>';//不存在匹配

  15. ?>
复制代码
 楼主| 发表于 2011-10-9 14:58:34 | 显示全部楼层
谢谢2楼 万分感谢
经2楼这么一指点
终于领悟到了 火车头 正则的用法了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-7 06:31

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表