请问一下,在编辑任务里面的测试抓取和实际抓取怎么差那么多?
请问一下,在编辑任务里面的测试抓取的是时候就是好使的,到实际抓取内容的时候怎么少了那么多内容?我抓取一个网站,在测试的时候有5000多信息!怎么才能抓200多个? 采集控制数据 比较复杂,可以用必须包含 或 不得包含 来控制
可以这样,首先把5000千数据采集下来 然后设置发布的时候 控制只发布200条 在第三步 可以设置 我不是发布的时候出问题,是在正式采集的时候出问题 我如果只采集网址的话就好使!采集内容就会出现这样的问题! 应该是你规则问题,可能是标题或内容设置不能为空过滤了,或者别的原因 那些没有采集到的内容,你拿到内容那,测试一下,看能采集到不?
应该是你的规则包含度差吧,可那网站模版多
页:
[1]