火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2388|回复: 4

这个标题应该怎样采集

[复制链接]
发表于 2009-11-13 22:58:21 | 显示全部楼层 |阅读模式
标题代码:类似这样没有任何规律和间隔
<div class="content_title">1105229标题标题标题</div>

求能去掉数字的采集方法!如果用正则应该怎样写,试了多个都不行。
 楼主| 发表于 2009-11-13 23:38:10 | 显示全部楼层
哈哈,土法解决,分享一下。
用排除法,逐一排除1234567890
还希望有人写出正则表达式。
发表于 2009-11-14 08:39:14 | 显示全部楼层
这个还只能正则来解决了
发表于 2009-11-14 09:52:06 | 显示全部楼层
<div class="content_title">\d+(?<content>[^<]*?)</div>
发表于 2009-11-21 18:00:22 | 显示全部楼层
啥意思,麻烦楼上的解释一下!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-29 17:54

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表