火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3227|回复: 10

所有的网址不管是否采集过都会被抓取内容并分析?

[复制链接]
发表于 2013-10-17 14:30:19 | 显示全部楼层 |阅读模式
我注意到常出现类似的结果:
采网址成功46条,重复1条,采内容成功4条,失败185条,发内容成功4条,失败0条,

我设置了内容过滤。
显然,“失败185条”指的是不符合内容过滤条件的有185条。但是这次采集只采到了46条网址,加上重复的也才47条,那这多出来的100多条是什么呢?
发表于 2013-10-19 14:18:13 | 显示全部楼层
多出来的就是不符合你设置的条件的呢
 楼主| 发表于 2013-10-19 21:01:11 | 显示全部楼层
303718 发表于 2013-10-19 14:18
多出来的就是不符合你设置的条件的呢

但是同前面提示总共才“采网址成功46条”,后面怎么失败了185条呢?比总数还多得多
发表于 2013-10-20 12:15:59 | 显示全部楼层
是不是弄了什么循环采集之类的.一条网址会有很多结果的
 楼主| 发表于 2013-10-20 15:03:43 | 显示全部楼层
也不是,因为不管是否设置“该标签循环匹配”,都存在这个现象
发表于 2013-10-20 15:13:09 | 显示全部楼层
楼主可以把规则里的测试页面截图上来看看
 楼主| 发表于 2013-10-23 14:07:03 | 显示全部楼层
测试页面只有截取内容的结果,不能说明问题呀
发表于 2013-10-25 08:03:20 | 显示全部楼层
楼主可能设置了循环采集
 楼主| 发表于 2013-10-26 12:57:56 | 显示全部楼层
我在5楼说了的:不管是否设置“该标签循环匹配”,都存在这个现象
发表于 2013-10-27 23:40:08 | 显示全部楼层
规则测试获取页面 可以贴上来,也许能找出问题
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 14:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表