Operazioni TowerCo

Perché il 60% degli interventi su torre non trovano nulla — e cosa fare al riguardo

Operazioni TowerCo5 min di lettura

Allarmi da singola lettura, nessuna correlazione incrociata, limitazioni del RMS del fornitore. I tre fallimenti strutturali dietro i dispatch senza guasto trovato — e come la corretta correlazione degli allarmi li risolve.

Chieda a qualsiasi direttore operativo di una TowerCo dove troverebbero i maggiori risparmi domani, e una parte considerevole nominerà la stessa cosa: dispatch senza guasto trovato. Il camion parte, il tecnico guida, il sito si risolve in venti minuti senza nulla di sostituito, il ticket si chiude con disposizione «impossibile da replicare» o «transitorio risolto». I sondaggi tra operatori collocano costantemente questo sopra il 60% di tutti gli interventi su torri.

Il costo è semplice da calcolare: mezza giornata di un tecnico senior, carburante, usura del veicolo, l'opportunità persa del lavoro che quel tecnico non sta facendo altrove. Il costo che non appare nel foglio di calcolo è il costo dell'alarm fatigue: gli operatori imparano a ignorare certi tipi di allarme perché si risolvono così sistematicamente da soli, il che significa che ignorano anche il raro caso in cui quel tipo di allarme contava davvero.

Tre fallimenti strutturali spiegano la maggior parte della popolazione di dispatch senza guasto trovato. Primo: allarmi da singola lettura. Un sensore riporta un valore, il valore supera una soglia, l'allarme scatta. Non è richiesta una seconda lettura per confermare. Se il sensore era momentaneamente in errore, se la lettura era un artefatto di digitalizzazione, se il valore oscillava attorno alla soglia per trenta secondi e poi si è stabilizzato, il camion parte comunque. La maggior parte dei sistemi RMS dei fornitori non richiede una deriva sostenuta prima di scattare.

Un camion inviato su un allarme da singola lettura è un viaggio di 4 ore per guardare un sensore che non era del tutto bloccato.

Secondo: nessuna correlazione con la telemetria adiacente. Un allarme di trasferimento genset alle 02:17 dovrebbe essere valutato rispetto a: l'alimentazione utility è davvero caduta, l'ATS ha agito, l'aggregatore BTS è rimasto attivo, qualche sito adiacente sullo stesso loop utility ha segnalato lo stesso evento? Se l'utility non è caduta e l'ATS non ha agito, l'allarme di trasferimento è un evento di rumore del sensore, non un vero trasferimento. La maggior parte dei sistemi RMS dei fornitori non ha accesso alla telemetria cross-source necessaria per prendere questa decisione.

Terzo: limitazioni del RMS del fornitore. La maggior parte dei sistemi RMS dei fornitori è ottimizzata per segnalare qualsiasi cosa che potrebbe essere un problema, sul principio che il costo di perdere un guasto reale è maggiore del costo di un dispatch senza guasto. Dal punto di vista della responsabilità del fornitore questo ha senso. Dal punto di vista di un operatore TowerCo produce una coda di allarmi dominata da rumore transitorio.

Il pattern che distingue un guasto reale da un transitorio è quasi sempre una deriva sostenuta su più letture consecutive. Una pressione carburante che supera la soglia per un campione e torna indietro è rumore del sensore. Una pressione carburante che rimane sotto soglia su 12 campioni consecutivi da 30 minuti è un guasto reale. Il primo non dovrebbe far partire un camion. Il secondo sì.

La correlazione con la telemetria adiacente aggiunge un secondo filtro. Un allarme di trasferimento genset senza una corrispondente perdita utility è quasi certamente un evento di rumore del sensore. Un calo di pressione carburante su un genset il cui runtime dall'ultimo rifornimento è inferiore al 30% del serbatoio quasi certamente non è un vero stato di carburante basso. I dispatch che dovrebbero avvenire diventano più facili da vedere quando il rumore è filtrato.

C'è un problema che si accumula. Quando gli operatori imparano che 6 interventi su 10 non troveranno nulla, il desk L1 inizia a raggruppare, rinviare e declassare gli allarmi in modi che sono individualmente difendibili ma cumulativamente pericolosi. Il raro allarme che era un vero precursore di un incidente grave viene messo da parte per tre ore perché l'operatore è stato deluso sei volte questa settimana da allarmi da singola lettura che si sono risolti da soli.

La soluzione non è «formare gli operatori a prendere più sul serio ogni allarme». Gli operatori stanno facendo la cosa giusta rispetto alla qualità degli allarmi che vengono loro forniti. La soluzione è aumentare la qualità degli allarmi — meno allarmi, più significativi — in modo che quando la coda dice che qualcosa non va, vale la pena di un camion.

Una coda di allarmi di alta qualità ha tre proprietà: ogni allarme rappresenta una deriva sostenuta, ogni allarme è correlato in modo incrociato con la telemetria adiacente che supporta o confuta l'ipotesi di guasto, e ogni allarme porta un'azione successiva raccomandata calibrata al livello di confidenza. Un P3 («includere nel prossimo ciclo di manutenzione, nessun camion necessario») è una classe di allarme diversa da un P1 («inviare entro 2 ore, impatto tenant se non indirizzato»). Allarmi correttamente graduati producono anche prove migliori — quando il desk L1 chiude un P3 rinviandolo, il rinvio è registrato. Quando il prossimo giro di manutenzione trova il guasto previsto e lo corregge, il ciclo chiuso è visibile al direttore operativo.

Lo veda live

Esplori questo scenario
nella nostra sandbox.

30 minuti. Portiamo l'operatore che ha vissuto questo scenario.