这个规则该怎么写啊。
<ul class="clearfix"><li class="pa01"><atarget="_blank" title="资讯首页">资讯首页</a></li>
<li><atarget="_blank" title="即时">即时</a></li>
<li><atarget="_blank" title="大陆">大陆</a></li>
<li><atarget="_blank" title="国际">国际</a></li>
<li><atarget="_blank" title="台湾">台湾</a></li>
<li><atarget="_blank" title="港澳">港澳</a></li>
<li><atarget="_blank" title="军事">军事</a></li>
<li><atarget="_blank" title="社会">社会</a></li>
<li><atarget="_blank" title="图片">图片</a></li>
<li><atarget="_blank" title="评论">评论</a></li>
<li><atarget="_blank" title="深度">深度</a></li>
<li><atarget="_blank" title="历史">历史</a></li>
<li><atarget="_blank" title="文化">文化</a></li>
<li><atarget="_blank" title="专题">专题</a></li>
<li><atarget="_blank" title="排行">排行</a></li>
</ul>
中间六个分类怎么获取 比如用这种模式采集就可以采到了呢。111 222是栏目。<li><atarget="_blank" title="111">111</a></li>(*)<li><atarget="_blank" title="222">222</a></li>(*)<li><atarget="_blank" title="[参数]"
303718 发表于 2014-1-2 12:22 static/image/common/back.gif
比如用这种模式采集就可以采到了呢。111 222是栏目。
因该不好使吧,:( 303718 发表于 2014-1-2 12:22 static/image/common/back.gif
比如用这种模式采集就可以采到了呢。111 222是栏目。
就要中间的六个分类 全部采集 然后使用正则 或者 插件 来排除不需要部分
页:
[1]