火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2284|回复: 1

求去掉域名地址的正则表达式

[复制链接]
发表于 2011-4-5 00:26:11 | 显示全部楼层 |阅读模式
去掉域名后面的地址及文件名,域名后面的 / 也去掉,类似

www.google.com/about/any.html     --------->     www.google.com

www.baidu.com/go/index.html     --------->     www.baidu.com

www.baidu.com/?sldksldks.slkjle.llk     --------->     www.baidu.com


求这条正则表达式,谢谢
发表于 2011-4-6 09:21:25 | 显示全部楼层
PHP正则获取所有网址的一级域名
  1. [\w][\w-]*\.(?:com\.cn|com|cn|co|net|org|gov|cc|biz|info)(\/|$)
复制代码
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-12 08:00

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表