hchsh 发表于 2011-4-16 15:11:51

火车头如何实现采集百度搜索结果

本帖最后由 hchsh 于 2011-4-16 15:16 编辑

如何实现采集百度搜索结果,有点像万能网站信息采集器里面的采集百度搜索结果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,当然,不能只采集结果第一页的,要采集整个关键字下的所有页,url只能是首页,并防止重复。
不知道用火车头能不能实现,如果能的话,怎么设置?附上具体采集规则,那些说能又不附上设置采集规则的就别吹了!
网站万能信息采集器的采集效果如下:(附图)

hchsh 发表于 2011-4-18 14:58:36

本帖最后由 hchsh 于 2011-4-19 16:59 编辑

已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友!

303718 发表于 2011-4-16 15:13:19

可以的。你写个采集规则就OK了。

kang3bao 发表于 2011-4-17 11:50:49

itzkw.com 发表于 2011-4-17 15:12:31

我也很想要这种效果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,不知道楼主搞定没呢?

hchsh 发表于 2011-4-18 11:01:41

本帖最后由 hchsh 于 2011-4-18 11:04 编辑

三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来不知道!
显示:
采集内容全部完成√ ,载入网址106条,采集到有效内容944条,保存失败51条
该任务您没有选择发内容,程序将跳过发内容
任务成功完成

303718 发表于 2011-4-18 14:28:35

三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来 ...
hchsh 发表于 2011-4-18 11:01 http://bbs.locoy.com/images/common/back.gif


    选发布成CSV格式就行

wangonglei 发表于 2011-4-18 14:42:11

什么 也不懂前来学习啊

天大地大 发表于 2011-4-19 21:30:16

已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友!
hchsh 发表于 2011-4-18 14:58 http://bbs.locoy.com/images/common/back.gif

虽然我也是新手菜鸟,但是所谓的“基本技术”只能怪自己没有耐心看帮助文档吧?咱也不能指望着遇到问题了随意发个帖就获得贴心的答案吧。

8900 发表于 2011-6-21 11:47:11

回帖是美德,规则有共享不?
页: [1] 2 3
查看完整版本: 火车头如何实现采集百度搜索结果