关于分页列表问题
好多网站我采集时都出现过这种情况,举个例子:我要采集一呼百应http://gongsi.youboy.com/bz/#1页面的各个公司页面里的信息,然后成功采集了。
但开始采集后几页时发现采集的页面都是第一页,网址是http://gongsi.youboy.com/bz/#<0,2,50,1,False,False>,我把后几页网址输入浏览器的网址栏,打开的都是第一页。
问题就是怎么获取后几页的网址,抓包还是怎么解析的,大体说说思路,然后给个关于这块的教程链接。
刚开始用火车头,大家多帮助。 抓包解决 很有风格。。。。
页:
[1]