xhat 发表于 2010-6-3 13:58:32

0601版 多页采集功能无效

情况如下

内容页的入口为 A ,然后通过分页的方式 到内容页B , 在B页面进行多页面采集C 。

我现在需要获取到C 的内容,同一个规则, 2009VIP 没有问题,但是 2010VIP 无法采集到。

1、同一个规则,从2009 导出,再导入2010,采集不到
2、直接在2010上重新编写,也采集不到

xhat 发表于 2010-6-3 14:01:42

刚刚看到 同样规则2009sp4可以实现 2010无法实现http://bbs.locoy.com/spider-50917-1-1.html

跟我是一样的问题

JinGui 发表于 2010-6-3 14:02:51

本帖最后由 JinGui 于 2010-6-3 14:16 编辑

2009的规则直接导入到2010是不行的,重新编写也不行?这个也看看具体的采集规则才知道,09可以的话,10一般情况也是可以的,你可以把两个规则都发上了,大家一起看看

xhat 发表于 2010-6-3 14:04:57

已经有2个人同时报告此bug了

rq204 发表于 2010-6-3 17:49:05

经测试,该规则是利用2009版的一个小bug来实现多页地址的获取,以分页方式获取多页,然后从分页中获取到详细信息的多页代码,从而实现了三级页面的采集(2009中如有分页,多页地址是从最后一个页面获取,此为一小bug).为了兼容此规则并提供变相的三级页面的获取功能,新版将对这块进行修改.即多页的地址是从所有的分页里获取.当然,这会牺牲一些性能,但能完成更多功能.
页: [1]
查看完整版本: 0601版 多页采集功能无效