haifding 发表于 2012-1-30 22:38:22

7.0 test 0117版 多级网址获取建议

版本:7.0 test 0117版

采集网址规则-->多级网址获取-->列表分页获取

加一个排除功能。

这个问题我是在采集一个ECSHOP v2.7.2发现的,就是列表分页的第一页会出现重复。

画红线的两个页面实际是一个页面,采集出来两个一样来也没错。希望能加个排除参数,排除第2个第一页。

rq204 发表于 2012-1-31 17:08:23

感谢您的建议,但这种列表样式很少见到,建议可以使用组合的方式来排除,比如只获取到id和page,然后组合网址。

haifding 发表于 2012-1-31 19:06:01

建议可以使用组合的方式来排除,比如只获取到id和page,然后组合网址。

不明白,怎么弄~!

我只能搞成这样:

liquangw 发表于 2012-2-22 03:47:12

这个不是过滤的吗

haifding 发表于 2012-2-24 12:08:12

这是结果网址过滤,不是分页网址过滤

参看下面的具体说明
http://bbs.locoy.com/spider-69617-1-1.html

lbjyuer 发表于 2016-2-10 21:39:18

历史帖子回顾中。
页: [1]
查看完整版本: 7.0 test 0117版 多级网址获取建议