星星点灯 发表于 2009-10-21 11:12:17

正则过滤url

在火车头里设置一个采集内容规则
规则名为url
网站的详细产品页的地址是http://www.rainykr.com/goods-614-%E6%AD%A3%E5%93%81%E9%9F%A9%E5%9B%BD%E9%A5%B0%E5%93%81%E8%80%B3%E7%8E%AF.html
里面有很多干扰信息
如何用正则把这些干扰信息过滤掉?
请大侠们帮忙解决一下下~
谢谢~
页: [1]
查看完整版本: 正则过滤url