找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 29043|回复: 19

【东哥福利】火车浏览器微信公众号文章采集脚本分享

[复制链接]
发表于 2017-9-22 17:20:12 | 显示全部楼层 |阅读模式
【往期福利】

火车采集器

【东哥福利】火车采集器版本选择攻略
【东哥福利-新手必看】最新最全火车采集器V9版学习资料

【东哥福利】火车采集器V9天猫店铺信息采集规则分享

【东哥福利】火车采集器V9搜狐社会新闻采集规则分享
【东哥福利】火车采集器V9表格类型采集规则分享
【东哥福利】火车采集器V9网易社会新闻采集规则分享
【东哥福利】火车采集器V9规则58同城租房信息采集分享
【东哥福利】火车采集器V9 unicode汉字编码转换案例规则分享
东哥福利】火车采集器V9澎湃新闻网站信息采集规则分享
火车浏览器
【东哥福利】火车浏览器采集百度搜索相关词及下拉词脚本
【东哥福利】火车浏览器管理dede后台页面自动更新脚本分享
【东哥福利】火车浏览器阿里巴巴商家采集脚本分享

【东哥福利】火车浏览器百度地图商家信息采集详细讲解
-----------------------------------------------------------------------------
东哥微信号tony_lsd,添加请注明:东哥福利
------------------------------------------------------------------------------

【东哥福利】火车浏览器微信公众号文章采集脚本分享


之前给大家分享过火车采集器的微信公众号文章采集规则,今天分享的是火车浏览器采集微信公众号文章


第一步:创建脚本
打开火车浏览器脚本编辑器,新建脚本,起个名字,点击保存


第二步:编辑脚本流程

1、创建数据存储目录,右键选择“文件操作”—>选择目录操作



填写目录名称并保存



2、创建数据库,右键选择“数据库操作”—>选择执行Sql语句



填写Sql语句并保存



3、打开网页
我们是采集搜狗微信http://weixin.sogou.com/ ,先创建打开网页步骤,同样是右键选“浏览器”—>“打开网页”



右侧上网可以输入网址http://weixin.sogou.com/ 进行预览,下方填入网址:http://weixin.sogou.com/ 并保存


这里加一个暂停等待,给一定时间让网页加载


4、条件判断,打开网页后,要进行一下判断,网页是否已经完全加载完,所以这里另一个条件判断


判断流程如上图,判断条件如下图,这里是通过Xpath元素来判断的,就是如果在源码中找到应该路径“//form[@id='searchForm']/div/input[3]”表示网页加载成功,那条件为True 结束循环,如果没有找到条件为False 继续等待。


5、输入关键词,我们在搜狗微信中通过关键词来搜索文章,这里我们也是按此步骤。

首页左侧我们要创建一个元素写值步骤,然后右侧A处是找到搜索框的Xpath 位置元素,B处是添加一个关键词变量,参照下图



创建变量,起个名称,写一个变量值



6、点击搜索,输入关键词后,我们需要点击一下才能执行搜索,如下图:

然后我们要创建一个点击的步骤,然后右侧 通过Xpath定位“搜文章”的按钮


然后还是要有个等待,并且有个判断,和上面的等待和判断一个意思



7、获取文章网址,创建一个单次取值


通过Xpath获取文章网址


对文章地址做一个变量存储


8、获取文章页内容
首先是对文章网址进行请求以获取页面


然后是获取文章标题、依次是时间、作者、内容,获取的方法原理和火车采集器一样,通过前后代码截取内容。



9、将获取到的内容进行存储
通过Sql语句存储


然后这里是保存的目录和变量



10、流程结束


以下是整个脚本流程的截图

最后测试运行,都是绿色的就OK了。



东哥对浏览器的讲解有点粗略,仅供大家学习参考,大家可以观看官方的视频教程或者咨询官方客服。

本脚本为火车浏览器脚本,可以直接导入使用,非火车采集器规则。
免费版火车浏览器可以导入学习测试
本脚本以采集搜狗微信信息为例,本脚本以通过关键词搜索采集微信公众号文章信息。
本脚本仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此脚本造成的任何法律问题承担责任。
商业版用户有问题或付费定制脚本请联系官方客服QQ800019423 服务热线:400-8757-060



欢迎关注官方微信公众号,及时了解最新信息


联系我们
客服QQ:800019423
客服电话:400-8757-060



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2017-9-25 21:08:03 | 显示全部楼层
东哥,你真帅
发表于 2017-9-25 22:45:46 | 显示全部楼层
现在的微信数据对新站来说已经意义不大了
发表于 2017-9-29 15:31:47 | 显示全部楼层
太牛逼了,好人啊,谢谢了,。。
发表于 2017-10-9 16:01:52 | 显示全部楼层
如何采集某个公众号 ?
发表于 2017-10-12 14:17:08 | 显示全部楼层
感觉很复杂,不好操作。。
发表于 2017-10-14 10:17:18 | 显示全部楼层
好东西,学习学习~~
发表于 2017-10-21 09:02:43 | 显示全部楼层
大大大大大大大大大大大大大
发表于 2017-10-29 15:01:34 | 显示全部楼层
不错看下 学习啦啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表