luogq01 发表于 2011-9-21 11:05:25

头痛的问题请各位大虾帮忙看看

采集的时候总是把副分类也采集上了,发布是总是多发一条[成功学]标题,使用必须包含.html但有些文章是.PHP的,请问要如何隔开例如必须包含.html,.php      <li><span>2011-09-02 09:54:12</span> <a class=ulink href='/html/lc/zhiliao/'>[成功学]</a><a class="f14px" href="/html/lc/zhiliao/20110902/37872.html" target="_blank">123成功</a> 人气:0
      <div class="intro" ><a href="/html/lc/zhiliao/20110902/37872.html" target="_blank" alt="123成功学察"> </a>

wxl08 发表于 2011-9-21 16:55:55

使用手动填写链接地址模式采集,也就是正则循环匹配
页: [1]
查看完整版本: 头痛的问题请各位大虾帮忙看看