Чому 60% виїздів на вежі не знаходять несправностей — і що з цим робити
Сповіщення на основі одного показника, відсутність перехресної кореляції, обмеження RMS постачальника. Три структурних збої, що стоять за виїздами без виявлення несправностей — і як правильна кореляція сповіщень це виправляє.
Запитайте будь-якого директора з операцій TowerCo, де б вони знайшли найбільшу економію завтра, і значна частина назве одне й те саме: виїзди без виявлення несправностей. Вантажівка виїжджає, технік їде, об'єкт перевіряється за двадцять хвилин без жодної заміни, квиток закривається з диспозицією «не вдалося відтворити» або «тимчасово, вирішено». Опитування операторів постійно показують, що це становить понад 60% всіх виїздів на вежі.
Витрати прості для підрахунку: пів дня старшого техніка, паливо, знос транспортного засобу, втрачена можливість роботи, яку технік не виконує деінде. Витрати, що не відображаються в таблиці, — це витрати на втому від сповіщень: оператори навчаються відхиляти певні типи сповіщень, тому що вони так надійно вирішуються самі, а це означає, що вони також відхиляють рідкісний випадок, коли цей тип сповіщення дійсно мав значення.
Три структурних збої відповідають за більшість популяції виїздів без виявлення несправностей. По-перше: сповіщення на основі одного показника. Датчик повідомляє значення, значення перетинає поріг, сповіщення спрацьовує. Жоден другий показник не потрібен для підтвердження. Якщо датчик був тимчасово несправним, якщо показник був артефактом оцифрування, якщо значення коливалося навколо порогу тридцять секунд, а потім стабілізувалося, вантажівка все одно виїжджає. Більшість систем RMS постачальників не вимагають стійкого дрейфу перед спрацьовуванням.
Виїзд на техобслуговування, ініційований сповіщенням від одного показника, — це 4-годинна поїздка, щоб подивитися на датчик, який був не зовсім застряглим.
По-друге: відсутність кореляції з суміжною телеметрією. Сповіщення про передачу генсету о 02:17 слід оцінювати щодо: чи дійсно впало живлення мережі, чи спрацював ATS, чи залишився агрегатор BTS активним, чи будь-який сусідній об'єкт на тій самій петлі мережі повідомив про ту саму подію. Якщо живлення не впало і ATS не спрацював, сповіщення про передачу є шумовою подією датчика, а не реальною передачею. Більшість систем RMS постачальників не мають доступу до перехресної телеметрії, необхідної для такого висновку.
По-третє: обмеження RMS постачальника. Більшість систем RMS постачальників оптимізовані для позначення всього, що може бути проблемою, на принципі, що вартість пропустити реальну несправність вища за вартість виїзду без виявлення несправності. З точки зору відповідальності постачальника це має сенс. З точки зору оператора TowerCo це створює чергу сповіщень, що домінується тимчасовим шумом.
Закономірність, що відрізняє реальну несправність від тимчасової, майже завжди є стійким дрейфом протягом кількох послідовних показників. Тиск пального, що перетинає поріг один раз і повертається, — це шум датчика. Тиск пального, що тримається нижче порогу протягом 12 послідовних 30-хвилинних зразків, — це реальна несправність. Перший не повинен відправляти вантажівку. Другий повинен.
Кореляція з суміжною телеметрією додає другий фільтр. Сповіщення про передачу генсету без відповідної втрати живлення — майже напевно шумова подія датчика. Падіння тиску пального в генсеті, час роботи якого з моменту останньої заправки нижче 30% ємності бака, — майже напевно не реальний стан низького рівня пального. Виїзди, які повинні відбутися, стає легше помітити, коли шум відфільтровано.
Є складова проблема. Коли оператори дізнаються, що 6 з 10 виїздів нічого не виявлять, стіл L1 починає групувати, відкладати та знижувати пріоритети сповіщень у спосіб, який є індивідуально обґрунтованим, але сукупно небезпечним. Рідкісне сповіщення, що було справжнім провісником серйозного інциденту, ігнорується три години, бо оператора обпекло шість разів цього тижня односигнальними сповіщеннями, які вирішились самі.
Виправлення — не «навчати операторів серйозніше ставитися до кожного сповіщення». Оператори роблять правильну річ відносно якості сповіщень, які їм дають. Виправлення — підвищити якість сповіщень — менше, більш значущих сповіщень — щоб коли черга каже, що щось не так, це варте виїзду.
Черга сповіщень високої якості має три властивості: кожне сповіщення представляє стійкий дрейф, кожне сповіщення перехресно корелює із суміжною телеметрією, що або підтверджує, або спростовує гіпотезу несправності, і кожне сповіщення несе рекомендовану наступну дію, відкалібровану до рівня впевненості. P3 («включити до наступної петлі обслуговування, виїзд не потрібен») — це інший клас сповіщення, ніж P1 («відправити протягом 2 годин, вплив на орендаря якщо не вирішено»). Правильно розбиті на рівні сповіщення також дають кращі докази — коли L1 закриває P3, відкладаючи його, відкладення реєструється. Коли наступний технічний огляд знаходить передбачену несправність та виправляє її, замкнений цикл видно директору з операцій.
Ознайомтесь із цим
у нашій пісочниці.
30 хвилин. Ми залучимо оператора, який пережив цей сценарій.