火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2916|回复: 2

跟纯正则替换对应的是不是应该有个纯正则循环匹配功能?希望加上。

[复制链接]
发表于 2014-1-2 23:39:19 | 显示全部楼层 |阅读模式
本帖最后由 caijihome 于 2014-1-2 23:46 编辑

跟纯正则替换对应的是不是应该有个纯正则循环匹配功能?希望加上。

某个源代码,我处理之后 。
可以再截取。
截取之后 我再纯正则循环匹配(循环截取)。
主要问题 就是2个 请支持纯正则匹配提取, 其次 请支持循环匹配。

举例一:
我想采集某一个网址 二级深层多页 下面 某个区域内 排除GIF以外的所有图片
举例二:
我想采集某一个网址 二级深层多页 下面 某个区域内 排除所有HTML以后 的 手机号(普通正则会把图片名字
也采集上<2013122652788453.JPG提取了13122652788>,难道是我做的问题?)

PHP很容易实现,老是火车头 不知道怎么弄方便!!!

http://bbs.locoy.com/spider-134612-1-1.html
http://bbs.locoy.com/spider-135761-1-1.html
 楼主| 发表于 2014-1-2 23:45:51 | 显示全部楼层
增次采集,在采集数据结果的基础上 增加处理深层。
 楼主| 发表于 2014-1-3 00:13:28 | 显示全部楼层
其实官方不加这个功能也无所谓。加不加都行。大多接口可以处理。无所谓吧,能加到商业版本高级功能里面,比如高级功能里面的编码转换,内置到软件里面好一些。傻瓜好一些,我们都喜欢傻瓜!!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 23:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表