ft3085658 发表于 2010-9-3 16:21:56

请问一下,在编辑任务里面的测试抓取和实际抓取怎么差那么多?

请问一下,在编辑任务里面的测试抓取的是时候就是好使的,到实际抓取内容的时候怎么少了那么多内容?
我抓取一个网站,在测试的时候有5000多信息!怎么才能抓200多个?

afanfan2007 发表于 2010-9-3 19:15:48

采集控制数据 比较复杂,可以用必须包含 或 不得包含 来控制
可以这样,首先把5000千数据采集下来 然后设置发布的时候 控制只发布200条 在第三步 可以设置

ft3085658 发表于 2010-9-3 20:28:23

我不是发布的时候出问题,是在正式采集的时候出问题

ft3085658 发表于 2010-9-3 20:29:01

我如果只采集网址的话就好使!采集内容就会出现这样的问题!

zjyk1984 发表于 2010-9-3 21:19:42

应该是你规则问题,可能是标题或内容设置不能为空过滤了,或者别的原因

9o8i7u 发表于 2010-9-3 22:58:46

那些没有采集到的内容,你拿到内容那,测试一下,看能采集到不?

应该是你的规则包含度差吧,可那网站模版多
页: [1]
查看完整版本: 请问一下,在编辑任务里面的测试抓取和实际抓取怎么差那么多?