天性 发表于 2013-10-29 20:09:03

【v8.x建议】建议改进地址采集,增加循环匹配功能。

本帖最后由 天性 于 2015-3-5 10:55 编辑

现在的地址采集好像只能匹配一次,无法多次匹配,导致很多采集的时候造成不方便,甚至有些地址完全采不到……

建议加强【采集网址】功能,可以像内容采集一样,能选择【单次匹配】或者【多次循环匹配】。

kuhabe 发表于 2013-10-30 10:05:39

采集网址部分 默认就是循环匹配的呢。请检测下是不是网址规则定义的不精确 导致 采集不到网址的。

天性 发表于 2013-10-30 14:16:50

kuhabe 发表于 2013-10-30 10:05 static/image/common/back.gif
采集网址部分 默认就是循环匹配的呢。请检测下是不是网址规则定义的不精确 导致 采集不到网址的。

您所说的循环匹配是规则内的链接循环匹配,不是规则循环匹配。

例如说:<div YYY>
<div 123>
<a href="444" />
<a href="555" />
<a href="666" />
</div>
</div>

<div XXX>
<div 123>
<a href="777" />
<a href="888" />
<a href="999" />
</div>
</div>规则是从第一个【<div 123>】到【</div>】,
如果不能规则循环的话,就只能采集到前面三个链接了吧!!!

lbjyuer 发表于 2016-2-10 12:03:50

爪,以后学习下。。
页: [1]
查看完整版本: 【v8.x建议】建议改进地址采集,增加循环匹配功能。