火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3420|回复: 3

[求助] 求一个正则 循环获取 表达式

[复制链接]
发表于 2013-7-26 11:45:54 | 显示全部楼层 |阅读模式
本帖最后由 xrdisk 于 2013-7-26 11:47 编辑

html源码


<tr><th>上市时间</th><td>2013年07月</td><td>2013年03月</td><td>2013年06月</td><td>2013年03月</td><td>2013年05月</td><td>2013年06月</td><td>2012年10月</td><td>2013年05月</td><td>2013年04月</td><td>2013年04月</td><td>2013年03月</td><td>2012年09月</td><td>2013年05月</td><td>2012年09月</td><td>2012年12月</td><td>2012年08月</td></tr>


获取<td>2013年07月</td>中的日期

要循环获取,但是网页中太多TD标签了

TD标签数量也是会变的

应该怎么获取呢 正则可以吗?

应该怎么写,这是参数对比里边的
原文 http://detail.zol.com.cn/series/16/32108/param_15180_0_1.html
发表于 2013-7-26 13:15:27 | 显示全部楼层
(?<content>(\d+)年(\d+)月)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-7-26 13:58:51 | 显示全部楼层
lmj243 发表于 2013-7-26 13:15
(?(\d+)年(\d+)月)

因为这个有年月能分清 可是比如 主板芯片组呢?其他参数呢?都是这种形式的,就只能从TD 和前边的前缀,比如
<tr class='same'><th>主板芯片组</th><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td><td>Intel HM77</td></tr>
我想从<tr class='same'><th>主板芯片组</th> 这个前缀 到</tr>这个后缀 之间的 所有TD标签内容 循环一下
发表于 2017-3-22 10:53:39 | 显示全部楼层
顶一个,二楼厉害
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 21:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表