火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2990|回复: 2

正则采集的个人学习体会(不懂正则也可以用)(高手就免进了)

[复制链接]
发表于 2008-3-10 18:13:38 | 显示全部楼层 |阅读模式
点击标签=>修改标签=>使用正则匹配内容,

正则匹配内容:开始代码[参数]结束代码
(注:这里填写需要采的内容的开始代码和结束代码,需要采的内容用[参数]表示)

组合结果:自定义添加的内容[参数1]自定义添加的内容
(注:采到的内容用[参数1]表示,[参数1]是和[参数]相对应的,还可以填写需要增添的内容,无则只需填写[参数1]即可)

这样就不需要懂正则表达式也可以用正则采了。当然也可以自己设置正则表达式,原理是一样的。

使用正则采集有时候效果很好,操作简单。特别是开始和结束代码很简短,却要替换添加一些新内容时。
例如:
用[内容1]标签采<h1>文章xxxxxx</h1>,需要改为<h1>2008年3月6日文章xxxxxx——编辑人火箭</h1>

不用正则采集:
开始代码:<h1>,还需要选择一部分代码替换为:<h1>2008年3月6日
结束代码:</h1>,还需要选择一部分代码替换为:——编辑人火箭</h1>
这就不好办了。

用正则采集:
正则匹配内容:<h1>[参数]</h1>
组合结果:<h1>2008年3月6日[参数1]——编辑人火箭</h1>
这样[内容1]标签采到的结果是<h1>2008年3月6日文章xxxxxx——编辑人火箭</h1>

[ 本帖最后由 ws123 于 2008-3-10 18:17 编辑 ]

评分

1

查看全部评分

发表于 2008-3-10 23:08:50 | 显示全部楼层
现在知道了正则是干什么用的了
 楼主| 发表于 2008-3-11 08:46:42 | 显示全部楼层
呵呵
谢谢加车厢和活跃度
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-15 18:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表