henbo 发表于 2007-6-5 20:09:09

三个节点,能不能从二级节点采集特定内容,再从第三级的内容页里采集内容?

如题,求高人回答!

rq204 发表于 2007-6-5 21:05:30

只要第三级的网址有规律就可以呀。。

henbo 发表于 2007-6-5 21:19:53

http://www.pf168.com/pifa_smallsort_content-20-122.html

这是二级的,三级的就是内容页了.我要二级的批发市场的名称+内容页的公司名+内容页的公司介绍.

能介绍下实现方法吗?好像只能采集到内容页的内容啊.

henbo 发表于 2007-6-5 21:40:41

三级内容页我倒是没看到什么可以做为依据的特征.没戏了??

研究了一天,基本上不可能跨级采集.

如果专门新建个任务的话,采回来的分类又不能分配到之前的数据库里.

henbo 发表于 2007-6-6 10:18:45

版主?你说的是什么规律?

rq204 发表于 2007-6-7 09:28:42

网址规律。。

semirmyway 发表于 2007-6-8 10:01:32

比如,我通过http://search.51job.com/sc/search_result.php?begin=begin 这个地址的数据,然后我要采集里面的招聘公司的详细信息,和招聘的岗位,如何才能采到呢?

semirmyway 发表于 2007-6-9 00:03:35

怎么没人顶啊。。。

mtryer 发表于 2007-8-3 05:59:16

我也需要这个方法。。。。郁闷

采三级页面的方法。。。


哪有没?
页: [1]
查看完整版本: 三个节点,能不能从二级节点采集特定内容,再从第三级的内容页里采集内容?