0601版 多页采集功能无效
情况如下内容页的入口为 A ,然后通过分页的方式 到内容页B , 在B页面进行多页面采集C 。
我现在需要获取到C 的内容,同一个规则, 2009VIP 没有问题,但是 2010VIP 无法采集到。
1、同一个规则,从2009 导出,再导入2010,采集不到
2、直接在2010上重新编写,也采集不到 刚刚看到 同样规则2009sp4可以实现 2010无法实现http://bbs.locoy.com/spider-50917-1-1.html
跟我是一样的问题 本帖最后由 JinGui 于 2010-6-3 14:16 编辑
2009的规则直接导入到2010是不行的,重新编写也不行?这个也看看具体的采集规则才知道,09可以的话,10一般情况也是可以的,你可以把两个规则都发上了,大家一起看看 已经有2个人同时报告此bug了 经测试,该规则是利用2009版的一个小bug来实现多页地址的获取,以分页方式获取多页,然后从分页中获取到详细信息的多页代码,从而实现了三级页面的采集(2009中如有分页,多页地址是从最后一个页面获取,此为一小bug).为了兼容此规则并提供变相的三级页面的获取功能,新版将对这块进行修改.即多页的地址是从所有的分页里获取.当然,这会牺牲一些性能,但能完成更多功能.
页:
[1]