火车采集器软件交流官方论坛

标题: 【东哥福利】火车浏览器微信公众号文章采集脚本分享 [打印本页]

作者: lsd2015    时间: 2017-9-22 17:20
标题: 【东哥福利】火车浏览器微信公众号文章采集脚本分享
【往期福利】

火车采集器

【东哥福利】火车采集器版本选择攻略
【东哥福利-新手必看】最新最全火车采集器V9版学习资料

【东哥福利】火车采集器V9天猫店铺信息采集规则分享

【东哥福利】火车采集器V9搜狐社会新闻采集规则分享
【东哥福利】火车采集器V9表格类型采集规则分享
【东哥福利】火车采集器V9网易社会新闻采集规则分享
【东哥福利】火车采集器V9规则58同城租房信息采集分享
【东哥福利】火车采集器V9 unicode汉字编码转换案例规则分享
东哥福利】火车采集器V9澎湃新闻网站信息采集规则分享
【东哥福利】火车采集器V9智联招聘信息采集规则分享
【东哥福利】火车采集器V9知乎采集规则分享
【东哥福利】火车采集器V9微信公众号文章采集规则分享
【东哥福利】火车采集器V9优酷视频电视剧采集规则分享
【东哥福利】火车采集器V9版JSon功能讲解及示例规则分享
【东哥福利】火车采集器V9财富网业绩预告信息采集规则分享
【东哥福利】火车采集器V9住哪儿网酒店信息采集规则分享
【东哥福利】火车采集器V9安居客小区信息采集规则分享
【东哥福利】豆瓣电影采集规则及发布到本地CSV格式文件
【东哥福利】美女图片采集规则及DZ3.X门户发布规则分享
【东哥福利】火车采集器58同城招聘信息采集规则分享

【东哥福利】火车采集器软件-今日头条娱乐新闻采集规则
【东哥福利】火车采集器V9携程景点采集规则分享
【东哥福利】火车采集器V9京东商城商品信息采集规则分享
【东可福利】火车采集器V9大众点评餐饮全国商家采集规则

火车浏览器
【东哥福利】火车浏览器采集百度搜索相关词及下拉词脚本
【东哥福利】火车浏览器管理dede后台页面自动更新脚本分享
【东哥福利】火车浏览器阿里巴巴商家采集脚本分享

【东哥福利】火车浏览器百度地图商家信息采集详细讲解
-----------------------------------------------------------------------------
东哥微信号tony_lsd,添加请注明:东哥福利
------------------------------------------------------------------------------

【东哥福利】火车浏览器微信公众号文章采集脚本分享


之前给大家分享过火车采集器的微信公众号文章采集规则,今天分享的是火车浏览器采集微信公众号文章


第一步:创建脚本
打开火车浏览器脚本编辑器,新建脚本,起个名字,点击保存
[attach]35020[/attach]

第二步:编辑脚本流程

1、创建数据存储目录,右键选择“文件操作”—>选择目录操作

[attach]34999[/attach]

填写目录名称并保存

[attach]35000[/attach]

2、创建数据库,右键选择“数据库操作”—>选择执行Sql语句

[attach]35001[/attach]

填写Sql语句并保存

[attach]35021[/attach]

3、打开网页
我们是采集搜狗微信http://weixin.sogou.com/ ,先创建打开网页步骤,同样是右键选“浏览器”—>“打开网页”

[attach]35022[/attach]

右侧上网可以输入网址http://weixin.sogou.com/ 进行预览,下方填入网址:http://weixin.sogou.com/ 并保存
[attach]35002[/attach]

这里加一个暂停等待,给一定时间让网页加载
[attach]35003[/attach]

4、条件判断,打开网页后,要进行一下判断,网页是否已经完全加载完,所以这里另一个条件判断

[attach]35004[/attach]
判断流程如上图,判断条件如下图,这里是通过Xpath元素来判断的,就是如果在源码中找到应该路径“//form[@id='searchForm']/div/input[3]”表示网页加载成功,那条件为True 结束循环,如果没有找到条件为False 继续等待。
[attach]35005[/attach]

5、输入关键词,我们在搜狗微信中通过关键词来搜索文章,这里我们也是按此步骤。

首页左侧我们要创建一个元素写值步骤,然后右侧A处是找到搜索框的Xpath 位置元素,B处是添加一个关键词变量,参照下图

[attach]35023[/attach]

创建变量,起个名称,写一个变量值

[attach]35007[/attach]

6、点击搜索,输入关键词后,我们需要点击一下才能执行搜索,如下图:
[attach]35006[/attach]
然后我们要创建一个点击的步骤,然后右侧 通过Xpath定位“搜文章”的按钮
[attach]35008[/attach]

然后还是要有个等待,并且有个判断,和上面的等待和判断一个意思

[attach]35009[/attach]

7、获取文章网址,创建一个单次取值

[attach]35010[/attach]
通过Xpath获取文章网址
[attach]35011[/attach]

对文章地址做一个变量存储
[attach]35012[/attach]

8、获取文章页内容
首先是对文章网址进行请求以获取页面
[attach]35013[/attach]

然后是获取文章标题、依次是时间、作者、内容,获取的方法原理和火车采集器一样,通过前后代码截取内容。

[attach]35014[/attach]

9、将获取到的内容进行存储
通过Sql语句存储
[attach]35015[/attach]

然后这里是保存的目录和变量

[attach]35016[/attach]

10、流程结束
[attach]35017[/attach]

以下是整个脚本流程的截图
[attach]35018[/attach]
最后测试运行,都是绿色的就OK了。

[attach]35019[/attach]

东哥对浏览器的讲解有点粗略,仅供大家学习参考,大家可以观看官方的视频教程或者咨询官方客服。

本脚本为火车浏览器脚本,可以直接导入使用,非火车采集器规则。
免费版火车浏览器可以导入学习测试
本脚本以采集搜狗微信信息为例,本脚本以通过关键词搜索采集微信公众号文章信息。
本脚本仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此脚本造成的任何法律问题承担责任。
商业版用户有问题或付费定制脚本请联系官方客服QQ800019423 服务热线:400-8757-060


[attach]35024[/attach]

欢迎关注官方微信公众号,及时了解最新信息


联系我们
客服QQ:800019423
客服电话:400-8757-060


软件购买:http://www.locoy.com/buy


作者: feifanl    时间: 2017-9-25 10:46
支持!牛!!!
作者: jfjb@2016    时间: 2017-9-25 21:08
东哥,你真帅
作者: luring    时间: 2017-9-25 22:45
现在的微信数据对新站来说已经意义不大了
作者: nyadmin    时间: 2017-9-29 15:31
太牛逼了,好人啊,谢谢了,。。
作者: daxia110    时间: 2017-10-9 16:01
如何采集某个公众号 ?
作者: 新日安    时间: 2017-10-12 14:17
感觉很复杂,不好操作。。
作者: z695472477    时间: 2017-10-14 10:17
好东西,学习学习~~
作者: 12518371    时间: 2017-10-21 09:02
大大大大大大大大大大大大大
作者: wx_iqK3tUuH    时间: 2017-10-29 15:01
不错看下 学习啦啊
作者: mailtobob    时间: 2018-1-10 17:54
一些网站通过采集海量微信文章赚大发了
作者: 超人也爱萌    时间: 2018-4-24 17:32
太牛逼了,好人啊,谢谢了,。。
作者: lisxy    时间: 2018-6-26 14:02
厉害,看的我云里雾里!
作者: 1004796711    时间: 2019-4-22 09:34
楼主真的厉害
作者: zjnuwy    时间: 2019-11-26 08:33
东哥,能否再分享个app类的采集

作者: leweizxl    时间: 2019-11-26 10:30
zjnuwy 发表于 2019-11-26 08:33
东哥,能否再分享个app类的采集

您好,目前移动端APP的采集,可以使用我们的新款软件"触控精灵"
http://locoyphone.com/index.html
触控精灵官方大群1:108697617
作者: lililala6868    时间: 2019-12-26 11:20
太牛逼了 好东西,学习学习~~
作者: lc4148700    时间: 2020-1-3 17:04
不错看下 学习啦啊

作者: tjutarts    时间: 2022-5-16 16:39
好东西,学习学习~~

作者: 77084638@qq.com    时间: 2024-3-1 13:54
好东西,学习学习~~





欢迎光临 火车采集器软件交流官方论坛 (http://bbs.locoy.com/) Powered by Discuz! X3.4