这么神奇!!
vvvvvvvvvvv
过再结合我分享的规则,应该就学会看看看看,
看看是什么!!
先顶在支持!ali67ls
谢谢!分离!
我看了一下,在采集网址规则第一步时,排除有多余的地方:
<div class="f14list">
<div class="pages"><p><table><tr><td nowrap><a href='/jiankangyinshi.shtml'>首页</a>
修改后:
<div> class="f14list">
</div>
第二步采集内容规则时中的,内容标签中的排除html标签:
钩上Tat|换行
还有框架(iframe)也钩上,在内容排除可把<iframe width="350" height="59" marginwidth="0" marginheight="0" hspace="0" vspace="0" frameborder="0" scrolling="no" bordercolor="#000" src="http://images.sohu.com/bill/s2009/jinzhuxu/zhongshi/jufu.html"></iframe>
这个框架删除。
这样做可简化代码,和优化采集规则呵!
呵呵!支持一下!!
靠,怎么发i