djskyzhang 发表于 2014-1-2 12:00:27

这个规则该怎么写啊。

<ul class="clearfix">
        <li class="pa01"><atarget="_blank" title="资讯首页">资讯首页</a></li>
        <li><atarget="_blank" title="即时">即时</a></li>

        <li><atarget="_blank" title="大陆">大陆</a></li>
        <li><atarget="_blank" title="国际">国际</a></li>
        <li><atarget="_blank" title="台湾">台湾</a></li>
        <li><atarget="_blank" title="港澳">港澳</a></li>
        <li><atarget="_blank" title="军事">军事</a></li>
        <li><atarget="_blank" title="社会">社会</a></li>

        <li><atarget="_blank" title="图片">图片</a></li>
        <li><atarget="_blank" title="评论">评论</a></li>
        <li><atarget="_blank" title="深度">深度</a></li>
        <li><atarget="_blank" title="历史">历史</a></li>
        <li><atarget="_blank" title="文化">文化</a></li>
        <li><atarget="_blank" title="专题">专题</a></li>
        <li><atarget="_blank" title="排行">排行</a></li>
</ul>

中间六个分类怎么获取

303718 发表于 2014-1-2 12:22:37

比如用这种模式采集就可以采到了呢。111 222是栏目。<li><atarget="_blank" title="111">111</a></li>(*)<li><atarget="_blank" title="222">222</a></li>(*)<li><atarget="_blank" title="[参数]"

djskyzhang 发表于 2014-1-2 12:32:24

303718 发表于 2014-1-2 12:22 static/image/common/back.gif
比如用这种模式采集就可以采到了呢。111 222是栏目。

因该不好使吧,:(

djskyzhang 发表于 2014-1-2 12:32:59

303718 发表于 2014-1-2 12:22 static/image/common/back.gif
比如用这种模式采集就可以采到了呢。111 222是栏目。

就要中间的六个分类

yangsi 发表于 2014-1-2 14:26:02

全部采集 然后使用正则 或者 插件 来排除不需要部分
页: [1]
查看完整版本: 这个规则该怎么写啊。