火车头如何实现采集百度搜索结果
本帖最后由 hchsh 于 2011-4-16 15:16 编辑如何实现采集百度搜索结果,有点像万能网站信息采集器里面的采集百度搜索结果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,当然,不能只采集结果第一页的,要采集整个关键字下的所有页,url只能是首页,并防止重复。
不知道用火车头能不能实现,如果能的话,怎么设置?附上具体采集规则,那些说能又不附上设置采集规则的就别吹了!
网站万能信息采集器的采集效果如下:(附图)
本帖最后由 hchsh 于 2011-4-19 16:59 编辑
已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友! 可以的。你写个采集规则就OK了。 我也很想要这种效果,比如:在百度中搜索环保2个字,出现很多的带环保的结果,然后只抽取这些网站标题和url及网站简介,不知道楼主搞定没呢? 本帖最后由 hchsh 于 2011-4-18 11:04 编辑
三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来不知道!
显示:
采集内容全部完成√ ,载入网址106条,采集到有效内容944条,保存失败51条
该任务您没有选择发内容,程序将跳过发内容
任务成功完成 三楼的,你用的是火车头吗?
火车头采集百度搜索结果的规则我现在搞定了,唯一一点郁闷的,怎么导出数据来 ...
hchsh 发表于 2011-4-18 11:01 http://bbs.locoy.com/images/common/back.gif
选发布成CSV格式就行 什么 也不懂前来学习啊 已经完全搞定,鄙视一切连基本技术都不共享的火车头坛友!
hchsh 发表于 2011-4-18 14:58 http://bbs.locoy.com/images/common/back.gif
虽然我也是新手菜鸟,但是所谓的“基本技术”只能怪自己没有耐心看帮助文档吧?咱也不能指望着遇到问题了随意发个帖就获得贴心的答案吧。 回帖是美德,规则有共享不?