跟纯正则替换对应的是不是应该有个纯正则循环匹配功能?希望加上。
本帖最后由 caijihome 于 2014-1-2 23:46 编辑跟纯正则替换对应的是不是应该有个纯正则循环匹配功能?希望加上。
某个源代码,我处理之后 。
可以再截取。
截取之后 我再纯正则循环匹配(循环截取)。
主要问题 就是2个 请支持纯正则匹配提取, 其次 请支持循环匹配。
举例一:
我想采集某一个网址 二级深层多页 下面 某个区域内 排除GIF以外的所有图片
举例二:
我想采集某一个网址 二级深层多页 下面 某个区域内 排除所有HTML以后 的 手机号(普通正则会把图片名字
也采集上<2013122652788453.JPG提取了13122652788>,难道是我做的问题?)
PHP很容易实现,老是火车头 不知道怎么弄方便!!!
http://bbs.locoy.com/spider-134612-1-1.html
http://bbs.locoy.com/spider-135761-1-1.html 增次采集,在采集数据结果的基础上 增加处理深层。 其实官方不加这个功能也无所谓。加不加都行。大多接口可以处理。无所谓吧,能加到商业版本高级功能里面,比如高级功能里面的编码转换,内置到软件里面好一些。傻瓜好一些,我们都喜欢傻瓜!!
页:
[1]