guimou 发表于 2012-2-25 18:38:07

如何只采集网站列表的标题

本帖最后由 guimou 于 2012-2-25 18:41 编辑

我只想采集网站栏目列表里面的标题,后面的时间也不要,该如何采集,谢谢
采集站长网的站长新闻 http://www.admin5.com/browse/177/list_1.shtml<div class="box_bd">
                    <ul class="list">
                            <li class="">
                          <span>2012-02-24 16:37:22</span>
                        <a href="/article/20120224/410222.shtml" target="_blank"><b>应用推荐网站的春天到了吗?从苹果收购 chomp 开始</b></a>
                  </li><li class="">
                          <span>2012-02-23 15:00:50</span>
                        <a href="/article/20120223/409916.shtml" target="_blank"><b>美食网域名二三事:6大类包揽“众生各态”</b></a>
                  </li><li class="divg ">

                          <span>2012-02-11 10:43:16</span>
                        <a href="/article/20120211/407501.shtml" target="_blank"><b>天际网称拐点时刻到来 商务社交迎来爆发期</b></a>
                  </li><li class="">

                          <span>2012-02-10 11:38:32</span>
                        <a href="/article/20120210/407329.shtml" target="_blank"><b>38岁单身女硕士建贞操网倡守贞 曝处女鉴定</b></a>
                  </li>
                </ul>
                <ul class="clearfix page">

303718 发表于 2012-2-25 19:10:06

把采集列表设置成0级然后直接用循环采集即可
页: [1]
查看完整版本: 如何只采集网站列表的标题