xauywl 发表于 2015-5-26 09:48:17

如何采集相对路径的网址?

本帖最后由 xauywl 于 2015-5-26 09:57 编辑

在做第一步的时候,我要采集的页面,里面的链接地址都是相对路径,试过很多方法都采集不了?求大侠解救.
页面内容如下
<table border="0" cellpadding="0" cellspacing="0" id="ListView">
        <tr>
            <td style="background-color: #ffffff">
                   <a id="ctl00_ContentPlaceHolder1_mylist_ctl00_JobName" title="网店运营" class="a01" href="/jw/showjob_3122783.aspx?keyword=电商" target="_blank">网店运营</a>
                        </td>
                  </tr>
        <tr>
                <td style="background-color: #FAFAFA">
                            <a id="ctl00_ContentPlaceHolder1_mylist_ctl01_JobName" title="平面设计" class="a01" href="/jw/showjob_3032204.aspx?keyword=电商" target="_blank">平面设计</a>
                           
                        </td>
        </tr>
        <tr>
                <td style="background-color: #ffffff">
                           
                            <a id="ctl00_ContentPlaceHolder1_mylist_ctl02_JobName" title="电子商务讲师" class="a01" href="/jw/showjob_3102258.aspx?keyword=电商" target="_blank">电子商务讲师</a>
                           
                        </td>
        </tr>
</table>

需要采集里面的这些相对路径网址,并输出绝对路径的网址,例如:http://jobs.gd.cn/jw/showjob_3122783.aspx?keyword=电商

我使用这种手动方法,但是不能获取这个相对路径网址

kuhabe 发表于 2015-5-26 10:32:31

xauywl 发表于 2015-5-26 11:10:48

本帖最后由 xauywl 于 2015-5-26 11:14 编辑

kuhabe 发表于 2015-5-26 10:32


谢谢,找到问题原因了,采集源地址有中文,然后已经编译过的地址不能采集,要放没编译过的地址才能正常采集
例如:http://jobs.gd.cn/search.php?keyword=%u7535%u5546   这个不能采集
http://jobs.gd.cn/search.php?keyword=客服要换成这样才能采集

kaka060 发表于 2015-5-27 14:39:19

学习了,:(:lol:lol:lol:lol

zsxzsxzsx 发表于 2015-5-27 23:30:34

谢谢~~~~~~
页: [1]
查看完整版本: 如何采集相对路径的网址?