seozy 发表于 2008-10-18 14:50:54

百度搜索结果的采集

需要采集的是:百度搜索结果

具体页面如下
http://news.baidu.com/ns?kw=&sc=news&cl=2&tn=news&ct=0&rn=20&lm=&ie=&rs2=&myselectvalue=&f=&pv=&z=&from=news&word=%C0%ED%B2%C6

需要的就是这个页面的内容。

从<div id="r">开始的20条新闻信息。

信息后面的(“8条相同新闻”)这里的文字和链接不要
百度搜索结果每页标题都是相同,需要解决(我用的是dede,相同标题不能入库)

再说明一下,

需要的就是这个页面的内容。再进去的站的内容不需要。应该明白?

加我qq27496274

(已经会采集,但是百度的这个采不了。。。。郁闷中,求解)

zengfenghua 发表于 2008-10-18 17:48:16

可以采集的!

afanfan2007 发表于 2008-10-20 13:07:40

采不了 好把!
   除非写一个插件就可以!

solotraveler 发表于 2011-8-13 13:57:24

不用插件,直接采集即可。
页: [1]
查看完整版本: 百度搜索结果的采集