百度搜索结果的采集
需要采集的是:百度搜索结果具体页面如下
http://news.baidu.com/ns?kw=&sc=news&cl=2&tn=news&ct=0&rn=20&lm=&ie=&rs2=&myselectvalue=&f=&pv=&z=&from=news&word=%C0%ED%B2%C6
需要的就是这个页面的内容。
从<div id="r">开始的20条新闻信息。
信息后面的(“8条相同新闻”)这里的文字和链接不要
百度搜索结果每页标题都是相同,需要解决(我用的是dede,相同标题不能入库)
再说明一下,
需要的就是这个页面的内容。再进去的站的内容不需要。应该明白?
加我qq27496274
(已经会采集,但是百度的这个采不了。。。。郁闷中,求解) 可以采集的! 采不了 好把!
除非写一个插件就可以! 不用插件,直接采集即可。
页:
[1]