所有的网址不管是否采集过都会被抓取内容并分析?
我注意到常出现类似的结果:采网址成功46条,重复1条,采内容成功4条,失败185条,发内容成功4条,失败0条,
我设置了内容过滤。
显然,“失败185条”指的是不符合内容过滤条件的有185条。但是这次采集只采到了46条网址,加上重复的也才47条,那这多出来的100多条是什么呢? 多出来的就是不符合你设置的条件的呢 303718 发表于 2013-10-19 14:18 static/image/common/back.gif
多出来的就是不符合你设置的条件的呢
但是同前面提示总共才“采网址成功46条”,后面怎么失败了185条呢?比总数还多得多 是不是弄了什么循环采集之类的.一条网址会有很多结果的 也不是,因为不管是否设置“该标签循环匹配”,都存在这个现象 楼主可以把规则里的测试页面截图上来看看 测试页面只有截取内容的结果,不能说明问题呀 楼主可能设置了循环采集 我在5楼说了的:不管是否设置“该标签循环匹配”,都存在这个现象 规则测试获取页面 可以贴上来,也许能找出问题
页:
[1]
2