7.0 test 0117版 多级网址获取建议
版本:7.0 test 0117版采集网址规则-->多级网址获取-->列表分页获取
加一个排除功能。
这个问题我是在采集一个ECSHOP v2.7.2发现的,就是列表分页的第一页会出现重复。
画红线的两个页面实际是一个页面,采集出来两个一样来也没错。希望能加个排除参数,排除第2个第一页。 感谢您的建议,但这种列表样式很少见到,建议可以使用组合的方式来排除,比如只获取到id和page,然后组合网址。 建议可以使用组合的方式来排除,比如只获取到id和page,然后组合网址。
不明白,怎么弄~!
我只能搞成这样:
这个不是过滤的吗
这是结果网址过滤,不是分页网址过滤
参看下面的具体说明
http://bbs.locoy.com/spider-69617-1-1.html 历史帖子回顾中。
页:
[1]