A deriva que o BMS calculou como média.
O BMS a calculou como média. A entrada do rack não.
O BMS reporta a temperatura média ao nível da sala como normal. O DCIM faz polling a cada 5 minutos — também normal. Mas a temperatura de fornecimento do CRAH-7 subiu 2,1°C acima da linha de base por 45 minutos em três janelas de 15 minutos. Os racks de inferência de ML que ele esfria principalmente estão se aproximando do limite superior ASHRAE A1. Penalidade de SLA do locatário: $14K por hora se o envelope for ultrapassado.
Causa raiz: o rebalanceamento do chiller deixou um CRAH com fornecimento insuficiente.
O pilar de Resfriamento correlaciona a deriva de fornecimento do CRAH-7 com o log de balanceamento de carga da planta de chiller. Causa raiz: um rebalanceamento da planta às 04:12 deixou o CRAH-7 com fornecimento insuficiente. Runbook de intervenção anexado: dois ajustes de válvula, tempo estimado de execução 10 minutos. O envelope previsto permanece dentro de ASHRAE A1 se corrigido em 20 minutos.
Corrigido em 6 minutos. O locatário nunca percebe.
O operador aprova o runbook. Ajustes de válvula executados. CRAH-7 retorna à linha de base em 6 minutos. Dois racks de inferência de ML nunca ultrapassam o envelope A1. Entrada do log operacional EN 50600 selada automaticamente. O relatório da instalação Q3 adiciona mais uma entrada na coluna de «detectado e resolvido antes da exposição do locatário».