火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3888|回复: 9

请问排除内容可以用正则表达式吗?

[复制链接]
发表于 2009-11-12 11:25:39 | 显示全部楼层 |阅读模式
有些排除内容不规则,例如标题中加入随机数字,有没有办法用正则表达式排除?
发表于 2009-11-12 11:39:04 | 显示全部楼层
肯定啊  比如   标题为  火车采集器&1212 后面的就是随机数字
  想要提出就是  [参数]&(*)  这样就行了啊  
  这个方式的前提条件在于 标题和随机数中间有一个固定的东西隔开
发表于 2009-11-12 13:11:17 | 显示全部楼层
例如用/W /D 等也是可 的。
 楼主| 发表于 2009-11-12 16:50:49 | 显示全部楼层
本帖最后由 lion0512 于 2009-11-12 17:10 编辑

标题和数字间没有任何东西间隔,版主的方法不行了哦。
/W /D是怎么用的?
我用了<div class="content_title">(?<content>\D+?)</div> 这样,采不到任何东西。 哪里出问题了?

标题代码:
<div class="content_title">1105229标题标题标题</div>
 楼主| 发表于 2009-11-12 17:51:54 | 显示全部楼层
<div class="content_title">(?<content>(?!\d+))</div> 也不对。
<div class="content_title">(?<content>(?<=\d+))</div> 也不对。
发表于 2009-11-12 18:21:53 | 显示全部楼层
正则写的不对撒。你查下相应的正则
 楼主| 发表于 2009-11-12 18:58:33 | 显示全部楼层
就是不会啊,现用现查也不行。哪位了解帮忙看一下怎么写?
发表于 2009-11-12 20:03:23 | 显示全部楼层
用我告诉你的哪个  试试麻
 楼主| 发表于 2009-11-12 20:14:54 | 显示全部楼层
用我告诉你的哪个  试试麻
afanfan2007 发表于 2009-11-12 20:03


不行的,数字和字符间没有任何间隔,没办法分开。
 楼主| 发表于 2009-11-13 14:06:29 | 显示全部楼层
标题代码:
<div class="content_title">1105229标题标题标题</div>

求能去掉数字的采集方法!!!!!!!!!!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-26 07:07

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表