火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 31527|回复: 20

火车头如何实现采集百度搜索结果

[复制链接]
发表于 2011-4-16 15:11:51 | 显示全部楼层 |阅读模式
本帖最后由 hchsh 于 2011-4-16 15:16 编辑

如何实现采集百度搜索结果,有点像万能网站信息采集器里面的采集百度搜索结果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,当然,不能只采集结果第一页的,要采集整个关键字下的所有页,url只能是首页,并防止重复。
不知道用火车头能不能实现,如果能的话,怎么设置?附上具体采集规则,那些说能又不附上设置采集规则的就别吹了!
网站万能信息采集器的采集效果如下:(附图)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-4-18 14:58:36 | 显示全部楼层
本帖最后由 hchsh 于 2011-4-19 16:59 编辑

已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友!
发表于 2011-4-16 15:13:19 | 显示全部楼层
可以的。你写个采集规则就OK了。
发表于 2011-4-17 11:50:49 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2011-4-17 15:12:31 | 显示全部楼层
我也很想要这种效果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,不知道楼主搞定没呢?
 楼主| 发表于 2011-4-18 11:01:41 | 显示全部楼层
本帖最后由 hchsh 于 2011-4-18 11:04 编辑

三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来不知道!
显示:
采集内容全部完成√ ,载入网址106条,采集到有效内容944条,保存失败51条
该任务您没有选择发内容,程序将跳过发内容
任务成功完成
发表于 2011-4-18 14:28:35 | 显示全部楼层
三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来 ...
hchsh 发表于 2011-4-18 11:01



    选发布成CSV格式就行
发表于 2011-4-18 14:42:11 | 显示全部楼层
什么 也不懂前来学习啊
发表于 2011-4-19 21:30:16 | 显示全部楼层
已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友!
hchsh 发表于 2011-4-18 14:58


虽然我也是新手菜鸟,但是所谓的“基本技术”只能怪自己没有耐心看帮助文档吧?咱也不能指望着遇到问题了随意发个帖就获得贴心的答案吧。
发表于 2011-6-21 11:47:11 | 显示全部楼层
回帖是美德,规则有共享不?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 16:58

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表