martin100 发表于 2010-5-31 11:31:00

高难度采集地址提取,一般人做不了,高手请进!

本帖最后由 martin100 于 2010-5-31 14:14 编辑

    <div class="pager">
    <table cellpadding="3" cellspacing="1" border="0" class="PagerContainerTable">
        <tr>
                <td class="PagerCurrentPageCell"><span class="PagerHyperlinkStyle"title="Showing Results 1 到 12 总条数 237" >
<strong> 1 </strong></span>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','2')"title="显示结果 13 到 24 总条数 237" > 2 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','3')"title="显示结果 25 到 36 总条数 237" > 3 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','4')"title="显示结果 37 到 48 总条数 237" > 4 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','5')"title="显示结果 49 到 60 总条数 237" > 5 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','6')"title="显示结果 61 到 72 总条数 237" > 6 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','7')"title="显示结果 73 到 84 总条数 237" > 7 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','8')"title="显示结果 85 到 96 总条数 237" > 8 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','9')"title="显示结果 97 到 108 总条数 237" > 9 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','10')"title="显示结果 109 到 120 总条数 237" > 10 </a>
</td>
<td class="PagerOtherPageCells">
<a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','2')" title=" 下一页 2"> 下一页 </a>
</td>
        </tr>
</table>
    </div>这个网站是采用js分页,采集地址不变化,一般的提取肯定不行,我想是不是正则可以,希望高手指点一下,给个可行思路!谢谢!采集原址:http://www.ysjiage.com/q.aspx?city=7&pos=&printService=

月白 发表于 2010-5-31 11:55:03

ali8ls
用POST方式来采

martin100 发表于 2010-5-31 12:10:31

用POST方式来采
月白 发表于 2010-5-31 11:55 http://bbs.locoy.com/images/common/back.gif
首先谢谢你,不过我不太明白用POST怎么采集,你有成功采集过此类网站吗?

zjyk1984 发表于 2010-5-31 13:53:50

用POST方式获取分页就可以了,论坛好像有教程

martin100 发表于 2010-5-31 14:12:27

大功告成,在这里万分感谢aven的[新教程] Post列表页采集超详细教程(附工具)教程:http://bbs.locoy.com/viewthread.php?tid=30555&highlight=

martin100 发表于 2010-5-31 14:12:55

回复 4# zjyk1984


    谢谢!搞定了!

aven 发表于 2010-5-31 16:08:51

{:4_180:}呵呵,不客气

只要肯学,一切都变得容易


http://bbs.locoy.com/spider-50802-1-1.html

wensrrr 发表于 2010-6-1 04:36:30

谢谢楼主分享``不错`!{:4_180:}
页: [1]
查看完整版本: 高难度采集地址提取,一般人做不了,高手请进!