火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2840|回复: 3

如何保证采集的标题中含有特定内容?

[复制链接]
发表于 2008-1-18 21:39:17 | 显示全部楼层 |阅读模式
比如,我希望采集的所有文章的标题中都含有“火车头”或“locoy”,如何设置?能采集吗?谢谢
发表于 2008-1-18 23:19:57 | 显示全部楼层
我一般习惯用正则式,比如以下的title,需要采集包含有“啊”字的标题

<title>好冷啊</title>
<title>一点不冷</title>
<title>好热啊</title>
<title>一点不热</title>

就这么写正则好了
<title>(?<content>.*?啊)</title>


关键字多的话,比如必须包含有 啊 和 哈 的,如下:
<title>好冷啊哈</title>
<title>一点不冷</title>
<title>好热哈啊</title>
<title>一点不热</title>

那就这么写好了:<title>(?<content>.*?(?:啊|哈))</title>



括号里面的,就是你要采集的内容了

评分

1

查看全部评分

发表于 2008-1-19 00:31:00 | 显示全部楼层
楼上的正则使用相当正确!
 楼主| 发表于 2008-1-19 10:53:09 | 显示全部楼层
多谢,试试
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-15 21:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表