lion0512 发表于 2009-11-12 11:25:39

请问排除内容可以用正则表达式吗?

有些排除内容不规则,例如标题中加入随机数字,有没有办法用正则表达式排除?

afanfan2007 发表于 2009-11-12 11:39:04

肯定啊比如   标题为火车采集器&1212 后面的就是随机数字
想要提出就是[参数]&(*)这样就行了啊
这个方式的前提条件在于 标题和随机数中间有一个固定的东西隔开

论坛政要 发表于 2009-11-12 13:11:17

例如用/W /D 等也是可 的。

lion0512 发表于 2009-11-12 16:50:49

本帖最后由 lion0512 于 2009-11-12 17:10 编辑

标题和数字间没有任何东西间隔,版主的方法不行了哦。
/W /D是怎么用的?
我用了<div class="content_title">(?<content>\D+?)</div> 这样,采不到任何东西。 哪里出问题了?

标题代码:
<div class="content_title">1105229标题标题标题</div>

lion0512 发表于 2009-11-12 17:51:54

<div class="content_title">(?<content>(?!\d+))</div> 也不对。
<div class="content_title">(?<content>(?<=\d+))</div> 也不对。

论坛政要 发表于 2009-11-12 18:21:53

正则写的不对撒。你查下相应的正则

lion0512 发表于 2009-11-12 18:58:33

就是不会啊,现用现查也不行。哪位了解帮忙看一下怎么写?

afanfan2007 发表于 2009-11-12 20:03:23

用我告诉你的哪个试试麻

lion0512 发表于 2009-11-12 20:14:54

用我告诉你的哪个试试麻
afanfan2007 发表于 2009-11-12 20:03 http://bbs.locoy.com/images/common/back.gif

不行的,数字和字符间没有任何间隔,没办法分开。

lion0512 发表于 2009-11-13 14:06:29

标题代码:
<div class="content_title">1105229标题标题标题</div>

求能去掉数字的采集方法!!!!!!!!!!
页: [1]
查看完整版本: 请问排除内容可以用正则表达式吗?