火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4768|回复: 12

如何解决正则时的贪婪匹配问题啊??好烦啊!!

[复制链接]
发表于 2013-1-29 03:41:05 | 显示全部楼层 |阅读模式
本帖最后由 Aoron 于 2013-1-29 03:46 编辑

他从<html>标签开始的第一个IMG 一直匹配到最后正则结束“/><br />”,请问怎么解决贪婪匹配的问题?

我只想要正则中的图片地址!!!


源码:

  1.                                         <div><a href="###" onClick="ajaxget('thanks.php?tid=4769846', 'thanksdiv');"><img src="images/thanks.gif" border="0" alt="点此感谢支持作者!"></a><span id="thanksdiv"></span></div>                                       
  2.                                                                                 </span>
  3.                                                                                                         <h2>XXXXXXXXXXX</h2>
  4.                                                
  5.                                                
  6.                                                                                                                                                                                                                                                                         <div id="postmessage_88743238" class="t_msgfont"><img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/1.jpg" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /><br />
  7. <br />
  8. <img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/2.jpg" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /><br />
  9. <br />
  10. <img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/3.jpg" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /> <br />
  11. <br />
复制代码
正则:
  1. <img src="[参数]" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /><br />
复制代码
结果:
  1. <img src="/bbs/images/disbox/boximg.gif">搜索</a></li>
  2. </ul>
  3. ...............................................................

  4.                 </div>

  5.                 <div id="wrapper"><div>       

  6. <div id="menu2"><ul>
  7.                                         <div id="ad_thread2_0"></div>
  8.                                         <div class="postmessage defaultpost">
  9.                                                                                                 <div id="ad_thread3_0"></div><div id="ad_thread4_0"></div>
  10.                                                 <span class="postratings">
  11.                                                
  12.                                         <div><a href="###" onClick="ajaxget('thanks.php?tid=4769074', 'thanksdiv');"><img src="/images/thanks.gif" border="0" alt="点此感谢支持作者!"></a>本贴共获得感谢 X <b>20</b><span id="thanksdiv"></span></div>                                       
  13.                                                                                 </span>
  14.                                                                                                         <h2>xxxxxxxxxxxxxxx</h2>
  15.                                                
  16.                                                
  17.                                                                                                                                                                                                                                                                         <div id="postmessage_88728830" class="t_msgfont">
  18. <img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/1.jpg" />
  19. <img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/2.jpg" />
  20. <img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/3.jpg" />
复制代码
发表于 2013-1-29 08:32:38 | 显示全部楼层
如果只提取图片可以用循环匹配呢
 楼主| 发表于 2013-1-29 09:48:54 | 显示全部楼层
303718 发表于 2013-1-29 08:32
如果只提取图片可以用循环匹配呢

  上面就是循环匹配的结果 , 不行    前面多出一堆东西
发表于 2013-1-29 11:14:45 | 显示全部楼层
  1. 这个<img src="[参数]"
复制代码
 楼主| 发表于 2013-1-29 15:35:37 | 显示全部楼层
303718 发表于 2013-1-29 11:14

如果我想就提取图片地址 该怎么写呢?
发表于 2013-1-29 15:41:14 | 显示全部楼层
我发的那个就是提取图片地址
 楼主| 发表于 2013-1-29 15:57:25 | 显示全部楼层
303718 发表于 2013-1-29 15:41
我发的那个就是提取图片地址

这样的话,不是把所有的图片地址都给取出来了?我只想取出有 onclick="zoom(this)" onload="attachimg(this, 'load')" alt=""  这个的图片地址!

<img src="/4/tvynrugbfsdfalisydbcfugsdjhf-ioeyrcuewry47ry-oiucfju/3.jpg" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /> <br />
发表于 2013-1-30 17:07:21 | 显示全部楼层
请提供下具体的采集地址
发表于 2013-1-31 04:50:24 | 显示全部楼层


使劲替换即可{:soso_e120:}

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2013-2-3 14:12:56 | 显示全部楼层
用循环匹配

开始字符串

  1. <div id="postmessage_88743238" class="t_msgfont">(*)<img src="
复制代码
结束字符串:
  1. " border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /><br />
复制代码
试试看
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-15 14:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表