Reaper 发表于 2013-10-17 14:30:19

所有的网址不管是否采集过都会被抓取内容并分析?

我注意到常出现类似的结果:
采网址成功46条,重复1条,采内容成功4条,失败185条,发内容成功4条,失败0条,
我设置了内容过滤。
显然,“失败185条”指的是不符合内容过滤条件的有185条。但是这次采集只采到了46条网址,加上重复的也才47条,那这多出来的100多条是什么呢?

303718 发表于 2013-10-19 14:18:13

多出来的就是不符合你设置的条件的呢

Reaper 发表于 2013-10-19 21:01:11

303718 发表于 2013-10-19 14:18 static/image/common/back.gif
多出来的就是不符合你设置的条件的呢

但是同前面提示总共才“采网址成功46条”,后面怎么失败了185条呢?比总数还多得多

303718 发表于 2013-10-20 12:15:59

是不是弄了什么循环采集之类的.一条网址会有很多结果的

Reaper 发表于 2013-10-20 15:03:43

也不是,因为不管是否设置“该标签循环匹配”,都存在这个现象

沦陷今生 发表于 2013-10-20 15:13:09

楼主可以把规则里的测试页面截图上来看看

Reaper 发表于 2013-10-23 14:07:03

测试页面只有截取内容的结果,不能说明问题呀

沦陷今生 发表于 2013-10-25 08:03:20

楼主可能设置了循环采集

Reaper 发表于 2013-10-26 12:57:56

我在5楼说了的:不管是否设置“该标签循环匹配”,都存在这个现象

沦陷今生 发表于 2013-10-27 23:40:08

规则测试获取页面 可以贴上来,也许能找出问题
页: [1] 2
查看完整版本: 所有的网址不管是否采集过都会被抓取内容并分析?