火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3208|回复: 3

正则采集疑问

[复制链接]
发表于 2008-5-19 02:36:21 | 显示全部楼层 |阅读模式
多模板网站 火车应该只能采用 正则了,遗憾的是我对正则理解很浅薄,现提供一个比较容易的案例请教各位

某网站内容页面

开始 采集部位一定定位为   

id="__content">

但是结束的时候可以定位为

</td>

也可以定位为
</div>



我对正则一窍不通,看了火车头写的正则说明,然后捣鼓了下面的正则表达式,可是什么都采集不到。。。


(id="__content">)(?<content>[\w\W]*?)</td>|</div>

[ 本帖最后由 xiongyujie37 于 2008-5-19 15:51 编辑 ]
发表于 2008-5-19 03:07:13 | 显示全部楼层
这样

id="__content">(?<content>[\w\W]*?)(</td>|</div>)
头像被屏蔽
发表于 2008-5-19 03:09:49 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2008-5-19 15:50:16 | 显示全部楼层
大哥出手  好正确噢  修改为已解决!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 11:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表