84542649 发表于 2009-3-22 15:26:23

规则不匹配进入死循环 假死

在规则中验证的时候 ,可能有规则错误 那个猴子就一直敲鼓,假死,,实际上有的页面有不同的地方,造成采集规则的不匹配,,,如果这个时候去发布,,,那就没救了 机器在能过的条目上过,,,不能过的地方就完全假死

可能是算法有问题,,,或者是算法上分配的太多时间没给限制,,,建议规则测试这里增加一个出错等待时间设置..避免假死,,,现在我只能一个字段一个字段的加,慢慢调试,,,这还有个前提,,找到导致出错那个页面,,,郁闷死了
今天机器已经重启n次了,,,,,,

vus520 发表于 2009-3-22 15:58:43

这个采集规则很重要,特别是正则采集和多个参数组合,特别容易造成逻辑和计算错误。
任何程序和计算机都怕出现这样的问题。

建设你从规则中找问题。

84542649 发表于 2009-3-23 19:33:20

确定原因了
发现可能是新版算法问题

如果规则

<a href="javascript:;" title="插入图片" class="tb_*" <----前规则
这里为假设为要截取内容
...    /td>后半部分规则<----后规则

如果规则中用了通配符就会变得很忙,用2个必死
页: [1]
查看完整版本: 规则不匹配进入死循环 假死