火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3011|回复: 3

请问这个正则匹配规则是怎没回事?明明写对了但是测试出来的结果还是错误

[复制链接]
发表于 2012-6-27 14:22:17 | 显示全部楼层 |阅读模式

想解析新浪的视频。多页管理里通过以上正则匹配规则来解析
比如吧 解析
http://video.sina.com.cn/v/b/44930990-1622669611.html
得出的结果应该是
http://v.iask.com/v_play.php?vid=44930990-1622669611.xml
但是现在解析出来却是
http://v.iask.com/v_play.php?vid=78674901-1622669611.xml
很奇怪这个78674901怎么出来的???
有人能我看看吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-6-27 14:34:08 | 显示全部楼层
  1. <div class="news n1" id="RUserListOne">

  2.                                                     最新上传:<a href="http://video.sina.com.cn/v/b/78674901-1622669611.html" title="因为爱情 爸爸和3岁女儿">因为爱情 爸爸和3岁女儿</a>

  3.                                             </div>
复制代码
因为你采集的源代码里  显示的这个 这个哦,所以匹配到 http://v.iask.com/v_play.php?vid=78674901-1622669611.xml这个网址
发表于 2012-6-27 14:35:59 | 显示全部楼层


这样设置试试
  1. http://video.sina.com.cn/v/b/(.*?).html
复制代码
  1. http://v.iask.com/v_play.php?vid=$1.xml
复制代码

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2012-6-27 14:41:14 | 显示全部楼层
可以了谢谢,为什么我之前用的正则匹配它会把源码里的那串XML匹配出来呀?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-24 23:10

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表