xiongyujie37 发表于 2008-10-26 11:42:40

我怎么发现 标签标记不能为空的 第二次运行的时候仍然会采集一下

比如 设置 为 标题 和 内容不能为空



再比如 每天自动跟踪 搜狐IT

第一天出现10个 标题 和内容为空的 自动过滤


第二天仍然会把这10个采集一下,当然是仍然为空


然后一个月下来多了,火车会把这个月为空都重新采集一下。。。


越来越多,最后不得不清空地址,提高效率


不知道 ,大家是不是也有这种情况哦

ghostscat 发表于 2008-10-26 12:36:59

为空的,火车是不标记已采的,所以会重复重采

xiongyujie37 发表于 2008-10-26 12:58:03

强烈建议 火车标记 不能为空的   为已采

chenfy 发表于 2008-10-26 14:45:44

呵呵,没有碰到过。
页: [1]
查看完整版本: 我怎么发现 标签标记不能为空的 第二次运行的时候仍然会采集一下