如果分页是用js实现的,如何采集?
本帖最后由 60. 于 2012-3-20 11:08 编辑分页是用js实现的,并没有具体的地址栏参数等东西.
如何实现分页采集哇?
比如
<div class="EL_page pt15" id="pageDivDown" >
<ul class="right">
<li class="page_btn grey" method="first"><atitle="首页">首页</a></li>
<li class="page_btn grey" method="prev"><atitle="上一页"><上一页</a></li>
<li class="page_on">1</li>
<li class="page_on" method="unWorkPage"><a href="#">2</a></li>
<li class="page_on" method="unWorkPage"><a href="#">3</a></li>
<li class="page_on" method="unWorkPage"><a href="#">4</a></li>
<li class="page_on" method="unWorkPage"><a href="#">5</a></li>
<li>...</li>
<li class="page_btn" method="next"><atitle="下一页">下一页></a></li>
<li id="li_pagedown">共12页</li>
</ul>
</div>
这个是分页源码.
地址是http://hotel.elong.com/search/list_cn_0601.html?semid=bidu&semtcid=682b5bc0-89f1-41f5-9ff2-36abffec99e8#?
麻烦各位好心的人来帮忙看看. 网址发不了。真实列表内容见附件 本地下载安装一个抓包工具,分析实际js地址
http://hotel.elong.com/isajax/HotelListNew/Search?RankType=0&CityId=0601&CityName=%E5%A4%AA%E5%8E%9F&HotelName=&Keywords=&KeywordsType=None&AreaId=&AreaType=0&PoiId=0&LowPrice=0&HighPrice=0&StarLevel=None&BrandId=0&Distance=5&StartLat=0&StartLng=0&EndLat=0&EndLng=0&IsBigBed=false&IsDoubleBed=false&IsFreeBreakfast=false&IsFreeNet=false&IsCoupon=false&IsCashback=false&IsNoGuarantee=false&IsPrePay=false&HotelSort=ByDefault&PageIndex=4&PageSize=15&HotelCount=168
其中PageIndex表示分页数
页:
[1]