lsd2015 发表于 2017-9-22 17:20:12

【东哥福利】火车浏览器微信公众号文章采集脚本分享

【往期福利】

火车采集器
【东哥福利】火车采集器版本选择攻略
【东哥福利-新手必看】最新最全火车采集器V9版学习资料

【东哥福利】火车采集器V9天猫店铺信息采集规则分享
【东哥福利】火车采集器V9搜狐社会新闻采集规则分享
【东哥福利】火车采集器V9表格类型采集规则分享
【东哥福利】火车采集器V9网易社会新闻采集规则分享
【东哥福利】火车采集器V9规则58同城租房信息采集分享
【东哥福利】火车采集器V9 unicode汉字编码转换案例规则分享
【东哥福利】火车采集器V9澎湃新闻网站信息采集规则分享【东哥福利】火车采集器V9智联招聘信息采集规则分享【东哥福利】火车采集器V9知乎采集规则分享【东哥福利】火车采集器V9微信公众号文章采集规则分享【东哥福利】火车采集器V9优酷视频电视剧采集规则分享【东哥福利】火车采集器V9版JSon功能讲解及示例规则分享【东哥福利】火车采集器V9财富网业绩预告信息采集规则分享【东哥福利】火车采集器V9住哪儿网酒店信息采集规则分享
【东哥福利】火车采集器V9安居客小区信息采集规则分享
【东哥福利】豆瓣电影采集规则及发布到本地CSV格式文件
【东哥福利】美女图片采集规则及DZ3.X门户发布规则分享
【东哥福利】火车采集器58同城招聘信息采集规则分享
【东哥福利】火车采集器软件-今日头条娱乐新闻采集规则
【东哥福利】火车采集器V9携程景点采集规则分享
【东哥福利】火车采集器V9京东商城商品信息采集规则分享【东可福利】火车采集器V9大众点评餐饮全国商家采集规则
火车浏览器
【东哥福利】火车浏览器采集百度搜索相关词及下拉词脚本
【东哥福利】火车浏览器管理dede后台页面自动更新脚本分享
【东哥福利】火车浏览器阿里巴巴商家采集脚本分享
【东哥福利】火车浏览器百度地图商家信息采集详细讲解
-----------------------------------------------------------------------------
东哥微信号tony_lsd,添加请注明:东哥福利
------------------------------------------------------------------------------

【东哥福利】火车浏览器微信公众号文章采集脚本分享


之前给大家分享过火车采集器的微信公众号文章采集规则,今天分享的是火车浏览器采集微信公众号文章


第一步:创建脚本
打开火车浏览器脚本编辑器,新建脚本,起个名字,点击保存


第二步:编辑脚本流程

1、创建数据存储目录,右键选择“文件操作”—>选择目录操作



填写目录名称并保存



2、创建数据库,右键选择“数据库操作”—>选择执行Sql语句



填写Sql语句并保存



3、打开网页
我们是采集搜狗微信http://weixin.sogou.com/ ,先创建打开网页步骤,同样是右键选“浏览器”—>“打开网页”



右侧上网可以输入网址http://weixin.sogou.com/ 进行预览,下方填入网址:http://weixin.sogou.com/ 并保存


这里加一个暂停等待,给一定时间让网页加载


4、条件判断,打开网页后,要进行一下判断,网页是否已经完全加载完,所以这里另一个条件判断


判断流程如上图,判断条件如下图,这里是通过Xpath元素来判断的,就是如果在源码中找到应该路径“//form[@id='searchForm']/div/input”表示网页加载成功,那条件为True 结束循环,如果没有找到条件为False 继续等待。


5、输入关键词,我们在搜狗微信中通过关键词来搜索文章,这里我们也是按此步骤。

首页左侧我们要创建一个元素写值步骤,然后右侧A处是找到搜索框的Xpath 位置元素,B处是添加一个关键词变量,参照下图



创建变量,起个名称,写一个变量值



6、点击搜索,输入关键词后,我们需要点击一下才能执行搜索,如下图:

然后我们要创建一个点击的步骤,然后右侧 通过Xpath定位“搜文章”的按钮


然后还是要有个等待,并且有个判断,和上面的等待和判断一个意思



7、获取文章网址,创建一个单次取值


通过Xpath获取文章网址


对文章地址做一个变量存储


8、获取文章页内容
首先是对文章网址进行请求以获取页面


然后是获取文章标题、依次是时间、作者、内容,获取的方法原理和火车采集器一样,通过前后代码截取内容。



9、将获取到的内容进行存储
通过Sql语句存储


然后这里是保存的目录和变量



10、流程结束


以下是整个脚本流程的截图

最后测试运行,都是绿色的就OK了。



东哥对浏览器的讲解有点粗略,仅供大家学习参考,大家可以观看官方的视频教程或者咨询官方客服。

本脚本为火车浏览器脚本,可以直接导入使用,非火车采集器规则。免费版火车浏览器可以导入学习测试本脚本以采集搜狗微信信息为例,本脚本以通过关键词搜索采集微信公众号文章信息。本脚本仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此脚本造成的任何法律问题承担责任。商业版用户有问题或付费定制脚本请联系官方客服QQ:800019423 服务热线:400-8757-060


欢迎关注官方微信公众号,及时了解最新信息
http://bbs.locoy.com/data/attachment/portal/201505/18/164446siqdlhdzszq1ttte.gif

联系我们
客服QQ:800019423
客服电话:400-8757-060

软件购买:http://www.locoy.com/buy

feifanl 发表于 2017-9-25 10:46:55

支持!牛!!!

jfjb@2016 发表于 2017-9-25 21:08:03

东哥,你真帅

luring 发表于 2017-9-25 22:45:46

现在的微信数据对新站来说已经意义不大了

nyadmin 发表于 2017-9-29 15:31:47

太牛逼了,好人啊,谢谢了,。。

daxia110 发表于 2017-10-9 16:01:52

如何采集某个公众号 ?

新日安 发表于 2017-10-12 14:17:08

感觉很复杂,不好操作。。

z695472477 发表于 2017-10-14 10:17:18

好东西,学习学习~~

12518371 发表于 2017-10-21 09:02:43

大大大大大大大大大大大大大

wx_iqK3tUuH 发表于 2017-10-29 15:01:34

不错看下 学习啦啊
页: [1] 2
查看完整版本: 【东哥福利】火车浏览器微信公众号文章采集脚本分享