congcongsun 发表于 2010-6-28 13:30:46

求助,2010版中,根据关键字采集问题

想问下各位大虾,如果我要在某个指定网站采集带有某个关键字的信息,要怎么操作呢?

比如,我要在www.locoy.com这里搜集所有文章里涉及到”采集“两字的文章我,我该怎么设置和采集呢?

先在这里谢谢各位啦

rq204 发表于 2010-6-28 14:44:35

目前这种的搜索,您可以在百度或gg里先查询某个网站的某个关键字,然后用采集器去抓取搜索引擎返回的链接,最后对链接的内容进行抓取即可.

如该站点有搜索功能,您也可以用它的搜索获取符合条件的链接,再去抓取.

congcongsun 发表于 2010-6-30 13:32:07

呵呵,谢谢ls ali77ls

你说的从一个论坛抓取的方法,我试过,还行,但是从搜索引擎抓取的话,由于不同论坛的结构不同,所以很难统一采集到标题和内容,是不是有这个问题呢?大侠是怎么解决这个问题的呢?

minlab 发表于 2010-7-1 18:34:53

对啊 楼上提的问题尖锐ali81ls
管理回答问题太馬虎 ali62ls

mm30 发表于 2010-8-7 13:02:54

我也一直在找这个答案

scc_166 发表于 2010-8-7 15:51:25

管理员已经说的很清楚了,只是你不理解(太笨了)

site: bbs.locoy.com 采集
页: [1]
查看完整版本: 求助,2010版中,根据关键字采集问题