woaibaicai 发表于 2010-4-20 13:01:55

【求助】火车头2010版,关于采集列表页链接的问题。各位前辈请进。

本帖最后由 woaibaicai 于 2010-4-20 14:03 编辑

<!--列表内容开始-->
        <div id="lbnr_c">
<script src=/js/adjs/zhiding.js></script>

        <div id="news"><a href="/artttml/16558.html" target="_blank"><font color=""> 爱情的酸甜苦辣!</font></a></div>
        <div id="newsdate"></div>

        <div id="news"><a href="/artttml/16559.html" target="_blank"><font color=""> 全方位的展示</font></a></div>
        <div id="newsdate"></div>

        <div id="news"><a href="/artttml/16560.html" target="_blank"><font color=""> 全过程</font></a></div>
        <div id="newsdate"></div>

        <div id="news"><a href="/artttml/16561.html" target="_blank"><font color=""> 阿道夫</font></a></div>
                <div id="newsdate"></div>
               …………
         …………

         </div>

就是在连接的前面少了网站的网址,这个网址是带端口的,例如:http://woaini.com:81
用火车头的自动识别,识别不了。
类似上面这样的链接应该怎么采集呀?我今天自己弄了一个早上,也采集不到这些链接。请大家帮帮我,谢谢!

都市乞丐 发表于 2010-4-20 14:33:14

这个问题好像我帮你解决了    ali67ls
页: [1]
查看完整版本: 【求助】火车头2010版,关于采集列表页链接的问题。各位前辈请进。