【东哥福利】火车浏览器百度地图商家信息采集详细讲解
哈哈,本周两个福利,给大家加个菜,换换口味,这一次的福利是火车浏览器的脚本,虽然很多人会误以为火车浏览器是一款浏览器软件,但其实它是一款能模拟人来操作浏览器的web操作工具,也就是说可以模拟人的登录、点击,翻页……因此可以用来实现网页采集,消息群发,自动打码,甚至还支持生成我们自己编写的程序。可视化的火车浏览器软件操作起来像我们使用浏览器一样,所见即所得~下面就讲解一下使用火车浏览器来采集百度地图关键词的操作吧~
1、打开百度地图,以推拿为关键词采集一个城市的所有推拿店的信息,包括名称、地址、电话、坐标。2、进入火车浏览器的操作界面,开始脚本的编写。3、新建百度推拿脚本并逐一添加步骤。①首先是打开百度地图网页网址输入:http://api.map.baidu.com/lbsapi/getpoint/index.html
②然后输入城市
(1)这里注意,复杂的提取可能会用到xpath,(对xpath感兴趣的话可以看看这个深入学习一下,http://www.w3school.com.cn/ )对于一些简单的直接用浏览器的点选按钮在页面上点击选取即可拾取对应的xpath了。
(2)另外需要注意对变量的管理。我们找到输入框,接下来就是添加变量,写入城市、关键词。
③设置变量的值——北京(可单步测试运行,测试能否输入城市名称)
④点击“百度一下”,及右键点击暂停等待——元素操作——点击
⑤同理,输入城市后,我们需要输入推拿并再次点击百度,就可以找到有关推拿的商家了。
4、上面是模拟访问,接下来是采集:把页面右方出现的信息采集下来,由于右方的信息有很多页,所以我们要进行分页采集。⑥先来采集首页,设置一个循环并对页面进行一个条件判断,即判断有无数据:如有,则判断为真,单次取值;如判断为假,结束当前循环。
⑦这是采集其他页(分页),加了一个点击。
⑧最后一步,就是把采集的数据进行处理,如果有本地运行环境的话是可以导入数据库,没有的话,可以直接导入到本地。
完成后,可查看运行日志,检查每一步骤有没有成功。
火车浏览器的功能还是比较强大的,除了采集之外,群发、批量注册、自动打码等一系列复杂的网页操作都可以轻松实现。
火车浏览器软件介绍:http://www.locoyposter.com/locoyposter.html
火车浏览器软件购买:http://www.locoy.com/index/buy_detail/id/2
火车浏览器及火车采集器组合套餐购买:http://www.locoy.com/index/buy_detail/id/3
欢迎关注官方微信公众号,及时了解最新信息
http://bbs.locoy.com/data/attachment/portal/201505/18/164446siqdlhdzszq1ttte.gif
【往期福利】
【东哥福利】火车采集器V9知乎采集规则分享【东哥福利】火车采集器V9微信公众号文章采集规则分享【东哥福利】火车采集器V9优酷视频电视剧采集规则分享【东哥福利】火车采集器V9版JSon功能讲解及示例规则分享【东哥福利-新手必看】最新最全火车采集器V9版学习资料【东哥福利】火车采集器V9财富网业绩预告信息采集规则分享【东哥福利】火车采集器V9住哪儿网酒店信息采集规则分享
【东哥福利】火车采集器V9安居客小区信息采集规则分享
【东哥福利】豆瓣电影采集规则及发布到本地CSV格式文件
【东哥福利】美女图片采集规则及DZ3.X门户发布规则分享
【东哥福利】火车采集器58同城招聘信息采集规则分享
【东哥福利】火车采集器软件-今日头条娱乐新闻采集规则
【东哥福利】火车采集器V9携程景点采集规则分享
【东哥福利】火车采集器V9京东商城商品信息采集规则分享
联系我们
客服QQ:800019423
客服电话:400-8757-060
二分法规的规范和法规和更好 66666666666666666666666666666666 东哥好人啊大大的 很强很强很强很强很强很强很强很强很强很强很强很强很强很强 学习一下:lol 东哥出品,必属精品 6666666666666666666666666666666666666 顶起~~~~~~ :lol:lol:lol:lol:lol:lol:lol:lol:lol:lol:lol:lol:lol