GlobeTour 发表于 2011-4-24 21:51:13

标签为空跳过后如何重新采集

昨天采集时,发现原来的规则不能用了,有几百篇文章内容为空给直接跳过去了,我后来把规则修改一下,如何才能把那些跳过去的重新采集一下

wxl08 发表于 2011-4-25 08:59:21

采集器目前还不能实现采集的内容为空可以重新再采集一遍的,因为它的内容网址已经入库了,再次采集只会检测重复,从而排除采集。但可以通过以下两种方法采集到您要的数据:1。是右击任务清除该任务的地址库与本地采集的所有数据,重新采集 2.是打开本地编辑数据,将内容为空的记录删除后,再采集一遍
页: [1]
查看完整版本: 标签为空跳过后如何重新采集