火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1708|回复: 2

请教采集当前页地址的问题(已解决)

[复制链接]
发表于 2008-12-2 01:25:26 | 显示全部楼层 |阅读模式
额 首先我有搜过帖子 上面给的办法是用采集页地址 用那个伪正则 然后写http://[参数].htm和http://[参数1].htm来获得地址

可我现在的问题是当前页地址尾部的字串是变量
例如 http://www.bearbuy.com.cn/my/product.php?id=16093

另外我写了个正则表达式
http\://www\.bearbuy\.com\.cn/\w+/product\.php\?id=\d+

可为啥啥都取不出?

额  还是用正则 我的表达式是(?<content>[\s\S]+) 这样就OK了

[ 本帖最后由 akato 于 2008-12-2 14:56 编辑 ]
发表于 2008-12-2 08:19:16 | 显示全部楼层
这个问题我也很困惑

解决的办法是 在  发布模块里面加个  采集页地址

但是需要处理一下的就没办法搞定了
发表于 2008-12-2 08:30:53 | 显示全部楼层
直接导出mdb文件吧
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 03:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表