网站抓取连接的问题,可能是cookie引起的
目标网站www.24quan.com目的,采集到每个城市下面【往期推荐】每一页的数据,分页,标签都做好了。但是在采集的时候出现问题网站是按城市来分类
比如我首先的登陆北京的首页,地址是 http://www.24quan.com/bj.html
北京的往期推荐,地址是 http://www.24quan.com/bj/deals.html
如果这时候我要换成看上海的往期推荐数据,直接输入 http://www.24quan.com/sh/deals.html
显示出来的是北京的往期推荐的数据
必须要在浏览器上先执行一次 http://www.24quan.com/sh.html
再执行 http://www.24quan.com/sh/deals.html
这样才能正常跳转到sh的往期推荐页面。。
查看cookie,发现里面有个city的ID在变化。。。现在不知道这在火车头上要怎么操作,才能正常采集到我要的数据
求教论坛各位大大。。。help~~~~~~~~~~~
2010sp3
页:
[1]