火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3684|回复: 0

火车头什么都能采集吗?能对接dedecms吗?

[复制链接]
发表于 2017-5-9 14:56:32 | 显示全部楼层 |阅读模式
  简介
  火车头采集器是一个很强大的网络采集工具,很多网络从业者都用来采集信息和新闻,通常一个规则只能采集一个网站的页面,如何做到一个规则采集不同网站页面的信息内容呢,今天小编在就在给不会的同学讲一下,如何利用火车头采集器采集不同新闻网站的信息内容
  工具/原料
  火车头采集器一个,这里以火车头采集器v8.4为例
  方法/步骤
  打开火车头采集器,添加一个新建任务,起名为新闻泛采集,采集地址设为http://news.baidu.com/ns?cl=2&rn=20&tn=news&ie=utf-8&word=news,这里就以新闻两个字为搜索关键词了,多级提取那块我就不详细解释了,因为咱们今天主要讲的是泛采集标题和内容






  测试采集网址,好的,不同内容的新闻网址出来了,接下来我们可以想办法泛采集标题和内容了


  点击第二步设置采集规则,添加标题字段,并设置为正文提取,提取标题


  内容提取也一样,添加内容字段,并设置为正文提取,提取内容,在这里我选择的是完全模式,不熟悉的朋友可以自己切换下看下效果


  返回第一步获取的采集地址中选择一条双击打测试,就可以看到我们想要的采集结果都出来了




  注意事项
  火车头的泛采集主要是应用于新闻网页,不是新闻页面的采集可能会有些提取错误
  采集是门艺术,练的时间长了,你也可以成为大师
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 19:19

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表