【v8.x建议】建议改进地址采集,增加循环匹配功能。
本帖最后由 天性 于 2015-3-5 10:55 编辑现在的地址采集好像只能匹配一次,无法多次匹配,导致很多采集的时候造成不方便,甚至有些地址完全采不到……
建议加强【采集网址】功能,可以像内容采集一样,能选择【单次匹配】或者【多次循环匹配】。 采集网址部分 默认就是循环匹配的呢。请检测下是不是网址规则定义的不精确 导致 采集不到网址的。 kuhabe 发表于 2013-10-30 10:05 static/image/common/back.gif
采集网址部分 默认就是循环匹配的呢。请检测下是不是网址规则定义的不精确 导致 采集不到网址的。
您所说的循环匹配是规则内的链接循环匹配,不是规则循环匹配。
例如说:<div YYY>
<div 123>
<a href="444" />
<a href="555" />
<a href="666" />
</div>
</div>
<div XXX>
<div 123>
<a href="777" />
<a href="888" />
<a href="999" />
</div>
</div>规则是从第一个【<div 123>】到【</div>】,
如果不能规则循环的话,就只能采集到前面三个链接了吧!!! 爪,以后学习下。。
页:
[1]