三个节点,能不能从二级节点采集特定内容,再从第三级的内容页里采集内容?
如题,求高人回答! 只要第三级的网址有规律就可以呀。。 http://www.pf168.com/pifa_smallsort_content-20-122.html这是二级的,三级的就是内容页了.我要二级的批发市场的名称+内容页的公司名+内容页的公司介绍.
能介绍下实现方法吗?好像只能采集到内容页的内容啊. 三级内容页我倒是没看到什么可以做为依据的特征.没戏了??
研究了一天,基本上不可能跨级采集.
如果专门新建个任务的话,采回来的分类又不能分配到之前的数据库里. 版主?你说的是什么规律? 网址规律。。 比如,我通过http://search.51job.com/sc/search_result.php?begin=begin 这个地址的数据,然后我要采集里面的招聘公司的详细信息,和招聘的岗位,如何才能采到呢? 怎么没人顶啊。。。 我也需要这个方法。。。。郁闷
采三级页面的方法。。。
哪有没?
页:
[1]