|
|
发表于 2008-1-18 23:19:57
|
显示全部楼层
我一般习惯用正则式,比如以下的title,需要采集包含有“啊”字的标题
<title>好冷啊</title>
<title>一点不冷</title>
<title>好热啊</title>
<title>一点不热</title>
就这么写正则好了
<title>(?<content>.*?啊)</title>
关键字多的话,比如必须包含有 啊 和 哈 的,如下:
<title>好冷啊哈</title>
<title>一点不冷</title>
<title>好热哈啊</title>
<title>一点不热</title>
那就这么写好了:<title>(?<content>.*?(?:啊|哈))</title>
括号里面的,就是你要采集的内容了 |
评分
-
1
查看全部评分
-
|