发新话题
打印

如何去掉页面中无用链接

如何去掉页面中无用链接

我想采集这里的文章
http://health.21cn.com/sexs/jingx/list1.shtml

可它每页都有其它链接如
http://health.21cn.com/sexs/jingx/2006/01/06/2427000.shtml


这里
<STRONG>&gt;&gt;&gt;</STRONG>
<A href="http://health.21cn.com/sexs/qingqu/2005/12/28/2417074.shtml" target=_blank>不同性爱风格让你爽到底!</A></P>

它每页夹着其它的链接都不一样如何去掉它呢

TOP

<A href=.*>.*</A></P>

TOP

我采集它还是不行,我在采集页测试时可见可发表时提示内容错误,老兄能指点一下它的规则应如何写吗

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.175691 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-3 01:49 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档