火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2215|回复: 3

为什么测试采集到二级网址1W多 而导出二级目录 只有600 多呢?

[复制链接]
发表于 2008-12-8 01:01:37 | 显示全部楼层 |阅读模式
为什么测试采集到二级网址1W多 而导出二级目录 只有600 多呢?
发表于 2008-12-8 12:22:40 | 显示全部楼层
可能是重复所致。

比如某一个文章既在分类1中,也在分类2中。你测试的时候,他在两个中都有的,但在采集的时候火车自动过滤后面一个。
发表于 2008-12-9 06:44:45 | 显示全部楼层
我也遇到这个问题,测试出1万多条,实际导出只有6千多条。
但是不像是重复造成的呀?因为实际原始网址是9万多条,测试的时候已经选了筛选重复,所以测试出只剩1万多条了,那么导出的时候变得更少就不知是什么原因了呀
发表于 2008-12-9 15:20:58 | 显示全部楼层
绝对是重复的问题
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 17:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表