采集55BBS遇到的问题
http://bbs.55bbs.com/thread-2281598-2-1.html这个页面的签名信息不能去除,原文为
<div class="signatures" style="maxHeightIE: 150px;">
<strong><font color="red"><font size="3">可爱无敌萨摩宝宝预定中</font> </font></strong><br />
<a href="http://bbs.55bbs.com/viewthread.php?tid=2046602&pid=59074847&page=1&extra=page%3D1#pid59074847" target="_blank"><img src="http://images.55bbs.com/day_081220/20081220_76e096df8671631ed5acRY2InIfCRIim.jpg" border="0" onclick="zoom(this)" onload="attachimg(this, 'load')" alt="" /></a>
</div>
我规则设置为:
<div class="signatures" style="maxHeightIE: 150px;">(*)</div>
怎么不能去除这个内容呢? 没有人张我啊! 过滤是有次序的,如果以前你过滤掉一些代码导致后边的代码不全,也是无法过滤的
页:
[1]