如何采集相对路径的网址?
本帖最后由 xauywl 于 2015-5-26 09:57 编辑在做第一步的时候,我要采集的页面,里面的链接地址都是相对路径,试过很多方法都采集不了?求大侠解救.
页面内容如下
<table border="0" cellpadding="0" cellspacing="0" id="ListView">
<tr>
<td style="background-color: #ffffff">
<a id="ctl00_ContentPlaceHolder1_mylist_ctl00_JobName" title="网店运营" class="a01" href="/jw/showjob_3122783.aspx?keyword=电商" target="_blank">网店运营</a>
</td>
</tr>
<tr>
<td style="background-color: #FAFAFA">
<a id="ctl00_ContentPlaceHolder1_mylist_ctl01_JobName" title="平面设计" class="a01" href="/jw/showjob_3032204.aspx?keyword=电商" target="_blank">平面设计</a>
</td>
</tr>
<tr>
<td style="background-color: #ffffff">
<a id="ctl00_ContentPlaceHolder1_mylist_ctl02_JobName" title="电子商务讲师" class="a01" href="/jw/showjob_3102258.aspx?keyword=电商" target="_blank">电子商务讲师</a>
</td>
</tr>
</table>
需要采集里面的这些相对路径网址,并输出绝对路径的网址,例如:http://jobs.gd.cn/jw/showjob_3122783.aspx?keyword=电商
我使用这种手动方法,但是不能获取这个相对路径网址
本帖最后由 xauywl 于 2015-5-26 11:14 编辑
kuhabe 发表于 2015-5-26 10:32
谢谢,找到问题原因了,采集源地址有中文,然后已经编译过的地址不能采集,要放没编译过的地址才能正常采集
例如:http://jobs.gd.cn/search.php?keyword=%u7535%u5546 这个不能采集
http://jobs.gd.cn/search.php?keyword=客服要换成这样才能采集 学习了,:(:lol:lol:lol:lol 谢谢~~~~~~
页:
[1]