分页采集始终只能采第一页的内容,求高手指点迷津
http://www.iautos.cn/city-hangzhou/我要采的信息如下图所示:,我采集使用的方法如下两图所示:,采集的结果如下图所示:,请问我的这种方法有什么问题吗,为什么采到的一直都只是第一个页面的内容? 本帖最后由 leejunji 于 2012-9-17 17:43 编辑抓包发现地址是这个 http://www.iautos.cn/city/car_list.asp
被转义了你可以发到内容页那里把内容转义下看下 是要采集的地址
<div class='carListCx'><p><b><a href='/usedcar/usedcar_detail.asp?uploadid=2471318' target='_blank' style='height:14px;line-height:14px;overflow:hidden;display:block;' >宝马530Li-3.0-A/MT领先型(国Ⅳ)</a></b> <p>张照片 <a href='http://www.iautos.cn/shop/shop_b.asp?shopid=6880' target='_blank'>杭州海联精品车行</a></p> <p>信用度:<img src='http://img4.iautos.cn/new_images/new_common/diamond33.gif' width='46' height='14' border='0' /></p></div> <div class='carListdj'>2008年05月</div> <div class='carListlc'>0万公里</div> <div class='carListSj'>31.50万元</div> <div class='carListSc'><p>1分钟前</p><p>浏览0次</p></div> </div><div class='carListCon'> <div class='carListZp'><a href='/usedcar/usedcar_detail.asp?uploadid=2470777' style='display:block;' target='_blank'><img src='http://photo.iautos.cn/carupload/photo/2012/0917/small/20120917154338730.jpg' width='80' height='60' border='0' /></a></div> <div class='carListCx'><p><b><a href='/usedcar/usedcar_detail.asp?uploadid=2470777' target='_blank' style='height:14px;line-height:14px;overflow:hidden;display:block;' >悦动1.8-AT豪华型(国Ⅲ)</a></b> <p>4张照片 <a href='http://jiahe.iautos.cn/' target='_blank'>嘉和汇汽车(原嘉禾二手车</a></p> <p>信用度:<img src='http://img4.iautos.cn/new_images/new_common/diamond42.gif' width='30' height='14' border='0' /><img
用urldecode
页:
[1]