Operações TowerCo

Por que 60% das visitas de caminhão em torres não encontram nada — e o que fazer sobre isso

Operações TowerCo5 min de leitura

Alarmes de leitura única, sem correlação cruzada, limitações do RMS do fornecedor. Os três falhas estruturais por trás dos despachos sem falha encontrada — e como a correlação adequada de alarmes resolve isso.

Pergunte a qualquer diretor de operações de TowerCo onde encontrariam mais economias amanhã, e uma parcela considerável vai citar a mesma coisa: despachos sem falha encontrada. O caminhão vai, o técnico dirige, o site se resolve em vinte minutos sem nada substituído, o ticket fecha com disposição «não foi possível duplicar» ou «transitório resolvido». Pesquisas com operadores consistentemente colocam isso acima de 60% de todas as visitas de caminhão em torres.

O custo é simples de calcular: meio dia de um técnico sênior, combustível, desgaste do veículo, a oportunidade perdida do trabalho que esse técnico não está fazendo em outro lugar. O custo que não aparece na planilha é o custo de fadiga de alarmes: os operadores aprendem a dispensar certos tipos de alarme porque eles se resolvem tão confiavelmente por conta própria, o que significa que também dispensam a rara vez que aquele tipo de alarme realmente importava.

Três falhas estruturais explicam a maior parte da população de despachos sem falha encontrada. Primeiro: alarmes de leitura única. Um sensor reporta um valor, o valor cruza um limiar, o alarme dispara. Nenhuma segunda leitura é necessária para confirmar. Se o sensor estava momentaneamente com falha, se a leitura foi um artefato de digitalização, se o valor oscilou em torno do limiar por trinta segundos e então se estabilizou, o caminhão ainda vai. A maioria dos sistemas RMS de fornecedores não exige deriva sustentada antes de disparar.

Um caminhão despachado por um alarme de leitura única é uma viagem de 4 horas para olhar para um sensor que não estava bem preso.

Segundo: sem correlação com telemetria adjacente. Um alarme de transferência de genset às 02:17 deveria ser avaliado em relação a: a alimentação de utilitária realmente caiu, o ATS agiu, o agregador BTS se manteve ativo, algum site adjacente no mesmo loop de utilitária reportou o mesmo evento? Se a utilitária não caiu e o ATS não agiu, o alarme de transferência é um evento de ruído de sensor, não uma transferência real. A maioria dos sistemas RMS de fornecedores não tem acesso à telemetria de múltiplas fontes necessária para tomar essa decisão.

Terceiro: limitações do RMS do fornecedor. A maioria dos sistemas RMS de fornecedores é otimizada para sinalizar qualquer coisa que possa ser um problema, com base no princípio de que o custo de perder uma falha real é maior do que o custo de um despacho sem falha. Do ponto de vista de responsabilidade do fornecedor isso faz sentido. Do ponto de vista de um operador TowerCo, produz uma fila de alarmes dominada por ruído transitório.

O padrão que distingue uma falha real de um transitório é quase sempre deriva sustentada em múltiplas leituras consecutivas. Uma pressão de combustível que cruza o limiar em uma amostra e volta é ruído de sensor. Uma pressão de combustível que se mantém abaixo do limiar em 12 amostras consecutivas de 30 minutos é uma falha real. A primeira não deveria despachar um caminhão. A segunda deveria.

A correlação com telemetria adjacente adiciona um segundo filtro. Um alarme de transferência de genset sem uma perda de utilitária correspondente é quase certamente um evento de ruído de sensor. Uma queda de pressão de combustível em um genset cujo tempo de funcionamento desde o último reabastecimento está abaixo de 30% do tanque quase certamente não é um estado real de combustível baixo. Os despachos que deveriam acontecer se tornam mais fáceis de ver quando o ruído é filtrado.

Há um problema composto. Quando os operadores aprendem que 6 em cada 10 despachos não vão encontrar nada, a central L1 começa a agrupar, adiar e rebaixar alarmes de formas que são individualmente defensáveis mas cumulativamente perigosas. O raro alarme que era um verdadeiro precursor de um incidente grave fica parado por três horas porque o operador foi enganado seis vezes esta semana por alarmes de leitura única que se resolveram sozinhos.

A solução não é «treinar os operadores para levarem cada alarme mais a sério». Os operadores estão fazendo a coisa certa em relação à qualidade dos alarmes que estão recebendo. A solução é elevar a qualidade dos alarmes — menos alarmes, mais significativos — para que quando a fila diz que algo está errado, valha a pena um caminhão.

Uma fila de alarmes de alta qualidade tem três propriedades: cada alarme representa deriva sustentada, cada alarme é correlacionado de forma cruzada com telemetria adjacente que apoia ou refuta a hipótese de falha, e cada alarme carrega uma próxima ação recomendada calibrada ao nível de confiança. Um P3 («incluir no próximo ciclo de manutenção, sem caminhão necessário») é uma classe de alarme diferente de um P1 («despachar em 2 horas, com impacto no locatário se não for tratado»). Alarmes devidamente escalonados também produzem melhores evidências — quando o L1 fecha um P3 adiando-o, o adiamento é registrado. Quando a próxima ronda de manutenção encontra a falha prevista e a corrige, o ciclo fechado é visível para o diretor de operações.

Veja ao vivo

Explore isso
em nosso sandbox.

30 minutos. Vamos trazer o operador que viveu este cenário.