正则采集疑问
多模板网站 火车应该只能采用 正则了,遗憾的是我对正则理解很浅薄,现提供一个比较容易的案例请教各位某网站内容页面
开始 采集部位一定定位为
id="__content">
但是结束的时候可以定位为
</td>
也可以定位为
</div>
我对正则一窍不通,看了火车头写的正则说明,然后捣鼓了下面的正则表达式,可是什么都采集不到。。。
(id="__content">)(?<content>[\w\W]*?)</td>|</div>
[ 本帖最后由 xiongyujie37 于 2008-5-19 15:51 编辑 ] 这样
id="__content">(?<content>[\w\W]*?)(</td>|</div>) 大哥出手好正确噢修改为已解决!
页:
[1]