头痛的问题请各位大虾帮忙看看
采集的时候总是把副分类也采集上了,发布是总是多发一条[成功学]标题,使用必须包含.html但有些文章是.PHP的,请问要如何隔开例如必须包含.html,.php <li><span>2011-09-02 09:54:12</span> <a class=ulink href='/html/lc/zhiliao/'>[成功学]</a><a class="f14px" href="/html/lc/zhiliao/20110902/37872.html" target="_blank">123成功</a> 人气:0<div class="intro" ><a href="/html/lc/zhiliao/20110902/37872.html" target="_blank" alt="123成功学察"> </a>
使用手动填写链接地址模式采集,也就是正则循环匹配
页:
[1]