火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: lmj243

免费帮大家写正则表达式~

[复制链接]
 楼主| 发表于 2013-5-10 09:30:57 | 显示全部楼层
place 发表于 2013-5-9 21:38
想付费请你编写规则,如何联系你呢?

哥的抠抠 134舞95恶肆

 楼主| 发表于 2013-5-15 17:57:34 | 显示全部楼层
叉,看来哥白操心了,没有几个人遇到纯正则问题的。
发表于 2013-5-18 22:47:07 | 显示全部楼层
好新人啊,我采集这个网址列表,不知道能不能帮忙下
http://data.eastmoney.com/notice/Noticelist.aspx?t=all&c=7

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-5-19 17:40:14 | 显示全部楼层
nnxxgkf 发表于 2013-5-18 22:47
好新人啊,我采集这个网址列表,不知道能不能帮忙下
http://data.eastmoney.com/notice/Noticelist.aspx?t ...

你这种不关正则表达式的事,用ASPX直接可以正常获取了、
发表于 2013-5-19 22:03:35 | 显示全部楼层
本帖最后由 waitan 于 2013-5-20 01:29 编辑

"ICVT_7_18289529999":[标签:XXX]}

或者

"ICVT_7_18289529999":[标签:XXX],

问题是最后一个符号要么是} 要么是, 

这个正则怎么写才能采集到标签呢。
其中标签XXX为数字。

  1. ICVT_7_\d+":(?<content>\d+)\D
复制代码
我用这个怎么取不到值呢。
 楼主| 发表于 2013-5-20 09:37:33 | 显示全部楼层
waitan 发表于 2013-5-19 22:03
"ICVT_7_18289529999":[标签:XXX]}

或者

ICVT_7_\d+"?<content>\d+)[^\d]
发表于 2013-7-6 10:02:55 | 显示全部楼层
我想采集电影的信息

<h1>标题</h1>
..
..
..
简 介<br />   或者
剧 情<br />   或者
剧情简介<br />

起始就是<h1>标签了,但结尾的这个字符是三种情况的一种,用普通替换只能判断一种情况
 楼主| 发表于 2013-7-6 11:37:06 | 显示全部楼层
doufuguolyl 发表于 2013-7-6 10:02
我想采集电影的信息

标题

<h1>标题</h1>(?<content>[\S\s]*?)((简介<br />)|(剧 情<br />)|(剧情简介<br />))
发表于 2013-7-6 15:54:24 | 显示全部楼层
想问下淘宝店铺 和天猫店铺 能同一个规则来采集不

不知道都用正则可以采集不
发表于 2013-7-6 16:02:20 | 显示全部楼层
2包,圆通,高端,3,k,我,亚麻,女装,夏装,2013,新款,热裤,四分短裤,休闲K,1224

想把【单个数字、汉字、英文】 正规则替换掉
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 07:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表