火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2491|回复: 5

请问一下,在编辑任务里面的测试抓取和实际抓取怎么差那么多?

[复制链接]
发表于 2010-9-3 16:21:56 | 显示全部楼层 |阅读模式
请问一下,在编辑任务里面的测试抓取的是时候就是好使的,到实际抓取内容的时候怎么少了那么多内容?
我抓取一个网站,在测试的时候有5000多信息!怎么才能抓200多个?
发表于 2010-9-3 19:15:48 | 显示全部楼层
采集控制数据 比较复杂,可以用必须包含 或 不得包含 来控制
可以这样,首先把5000千数据采集下来 然后设置发布的时候 控制只发布200条 在第三步 可以设置
 楼主| 发表于 2010-9-3 20:28:23 | 显示全部楼层
我不是发布的时候出问题,是在正式采集的时候出问题
 楼主| 发表于 2010-9-3 20:29:01 | 显示全部楼层
我如果只采集网址的话就好使!采集内容就会出现这样的问题!
发表于 2010-9-3 21:19:42 | 显示全部楼层
应该是你规则问题,可能是标题或内容设置不能为空过滤了,或者别的原因
发表于 2010-9-3 22:58:46 | 显示全部楼层
那些没有采集到的内容,你拿到内容那,测试一下,看能采集到不?

应该是你的规则包含度差吧,可那网站模版多
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-18 20:26

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表