xiongyujie37 发表于 2008-5-19 02:36:21

正则采集疑问

多模板网站 火车应该只能采用 正则了,遗憾的是我对正则理解很浅薄,现提供一个比较容易的案例请教各位

某网站内容页面

开始 采集部位一定定位为   

id="__content">

但是结束的时候可以定位为

</td>

也可以定位为
</div>



我对正则一窍不通,看了火车头写的正则说明,然后捣鼓了下面的正则表达式,可是什么都采集不到。。。


(id="__content">)(?<content>[\w\W]*?)</td>|</div>

[ 本帖最后由 xiongyujie37 于 2008-5-19 15:51 编辑 ]

火车头 发表于 2008-5-19 03:07:13

这样

id="__content">(?<content>[\w\W]*?)(</td>|</div>)

c868 发表于 2008-5-19 03:09:49

xiongyujie37 发表于 2008-5-19 15:50:16

大哥出手好正确噢修改为已解决!
页: [1]
查看完整版本: 正则采集疑问