【求助】火车头2010版,关于采集列表页链接的问题。各位前辈请进。
本帖最后由 woaibaicai 于 2010-4-20 14:03 编辑<!--列表内容开始-->
<div id="lbnr_c">
<script src=/js/adjs/zhiding.js></script>
<div id="news"><a href="/artttml/16558.html" target="_blank"><font color=""> 爱情的酸甜苦辣!</font></a></div>
<div id="newsdate"></div>
<div id="news"><a href="/artttml/16559.html" target="_blank"><font color=""> 全方位的展示</font></a></div>
<div id="newsdate"></div>
<div id="news"><a href="/artttml/16560.html" target="_blank"><font color=""> 全过程</font></a></div>
<div id="newsdate"></div>
<div id="news"><a href="/artttml/16561.html" target="_blank"><font color=""> 阿道夫</font></a></div>
<div id="newsdate"></div>
…………
…………
</div>
就是在连接的前面少了网站的网址,这个网址是带端口的,例如:http://woaini.com:81
用火车头的自动识别,识别不了。
类似上面这样的链接应该怎么采集呀?我今天自己弄了一个早上,也采集不到这些链接。请大家帮帮我,谢谢! 这个问题好像我帮你解决了 ali67ls
页:
[1]