MNO-SLA-Streitfälle: Warum Nachweise gewinnen und Screenshots verlieren
Screenshots aus dem Hersteller-RMS verlieren SLA-Streitfälle. Hash-chained, Ed25519-signierte Ereignisströme gewinnen sie. Warum die Lücke zwischen Aussage und Nachweis größer ist, als die meisten Betreiber erkennen.
Jeder TowerCo, jeder Colo-Betreiber, jeder CPO mit einem kreditgebenden SLA hat dieses Gespräch durchlebt. Der Mieter reicht einen Streitfall ein. Der Mieter hat Screenshots von seiner eigenen Überwachung, die den Ausfall auf seiner Seite zeigen. Der Betreiber hat Dashboards, die den Standort als verfügbar zeigen. Beide Seiten schauen auf echte Daten. Beide Seiten sind überzeugt, dass die Daten der anderen Seite falsch sind. Der Streitfall schließt mit einem ausgehandelten Kompromiss, der wahrscheinlich nicht das widerspiegelt, was tatsächlich passiert ist.
Ausgehandelte Kompromisse sind ein strukturelles Versagen. Sie bedeuten, dass die Nachweise keiner der beiden Seiten stark genug waren, die Frage zu klären, was bedeutet, dass der nächste Streitfall genauso aussehen wird. Der Ausweg ist nicht bessere Verhandlung — es sind Nachweise, die kryptographisch streitfalltauglich sind. Und die Lücke zwischen einem Screenshot und streitfalltauglichen Nachweisen ist größer, als die meisten Betreiber erkennen.
Zwei Parteien mit zwei verschiedenen Überwachungs-Stacks, die dieselbe physische Infrastruktur beobachten, werden zwei verschiedene Zeitleisten erzeugen. Das ist kein Fehler. Es ist das erwartete Verhalten jedes Systems, bei dem die Überwachung asynchron ist, die Netzwerkpfade unterschiedlich sind, die Zählmethodik unterschiedlich ist und die Zeitbasen möglicherweise nicht präzise synchronisiert sind.
Ein Screenshot aus einem Hersteller-RMS ist eine Behauptung über den Zustand. Ein hash-chained Ereignisstrom ist eine Aufzeichnung des Zustands. SLA-Streitfälle werden auf Basis von Aufzeichnungen entschieden, nicht Behauptungen.
Das Hersteller-RMS eines TowerCo kann einen Standort als "verfügbar" zählen, solange der Standortcontroller erreichbar ist und der BTS-Aggregator Power-Good meldet. Das NOC des MNO-Mieters kann denselben Standort als "ausgefallen" zählen, wenn sein Kernnetz seit 90 Sekunden keinen Verkehr von den Zellsektoren empfangen hat. Beide Definitionen sind vertretbar. Sie messen verschiedene Dinge. Kein Team ist unehrlich.
Ein Screenshot einer Hersteller-RMS-Konsole ist grundlegend eine Behauptung darüber, wie das System zu einem Zeitpunkt aussah. Es gibt nichts im Screenshot selbst, das sagt: Dieses Rendering wurde aus einem spezifischen Satz zugrunde liegender Telemetrie-Ereignisse generiert; diese Ereignisse traten zu diesen spezifischen Zeiten auf; die Ereignisse wurden seit ihrer Aufzeichnung nicht verändert; das Rendering hat diese spezifische Methodik angewendet.
Wenn ein Streitfall eskaliert und ein Dritter — ein Rechtsteam, ein Schlichter, ein Prüfer — versucht, den Screenshot als Nachweis zu bewerten, beantwortet der Screenshot ungefähr null der relevanten Fragen. Was waren die zugrunde liegenden Daten? Waren sie vollständig? Hätte jemand sie zwischen dem Ereignis und dem Rendering bearbeiten können? Hat das Dashboard dieselbe Methodik angewendet, die das SLA definiert? Die meisten Hersteller-RMS-Systeme können diese Fragen nicht beantworten, weil sie nicht dafür konzipiert wurden.
Ein streitfalltauglicher Ereignisstrom hat vier Eigenschaften, die ein Screenshot nicht hat. Vollständigkeit: Jeder Zustandsübergang im System wird aufgezeichnet — Netzverlust, ATS-Schaltung, BTS-Power-Good, Sektor-RF-Wiederherstellung — zum Zeitpunkt des Übergangs, nicht als zusammengefasster Rollup. Manipulationssicherheit: Jedes Ereignis ist hash-chained mit dem vorherigen und kryptographisch beim Schreiben signiert. INSERT-only-Persistenz: Das zugrunde liegende Speichersystem verbietet UPDATE- und DELETE-Operationen. Und methodikbewusstes Rendering: Die Pro-Mieter-Verfügbarkeitszahl wird gegen die im SLA definierte Methodik berechnet, nicht das bevorzugte Zählverfahren des Herstellers.
Mit streitfalltauglichen Nachweisen ändert sich die Form des Gesprächs mit dem Mieter vollständig. Der Mieter behauptet 47 Minuten Ausfallzeit. Der Betreiber öffnet den versiegelten Ereignisstrom für dieses Fenster, wendet die SLA-Methodik an und erzeugt eine 4-Minuten-Zahl mit den zugrunde liegenden Übergängen als Anlage. Das NOC des Mieters kann die Berechnung gegen seine eigene Telemetrie validieren, sehen, wo die beiden Stacks divergierten — typischerweise in der Kernnetz-Rekonvergenzzeit, auf der Mieterseite der Demarkation — und den strittigen Anteil zurückziehen.
Betreiber, die versiegelte Nachweisströme verwenden, berichten regelmäßig, dass das vom Mieter initiierte Streitfallvolumen im Laufe des ersten Jahres sinkt, weil das NOC des Mieters lernt, dass die Nachweise des Betreibers standhalten werden. Die verbleibenden Streitfälle sind echte Grenzfälle, die es wert sind, nach ihren Verdiensten gelöst zu werden.
Die andere Konsequenz versiegelter Nachweise ist regulatorisch. SOC 2, ISO 27001, NIS 2 und die verschiedenen sektoralen Standards verlangen zunehmend prüftaugliche Ereignisaufzeichnungen mit Aufbewahrungsfristen in Jahren. Ein Screenshot kann diese Anforderungen nicht erfüllen. Ein Hersteller-RMS mit monatlichen Rollups kann sie nicht erfüllen. Ein hash-chained versiegelter Ereignisstrom kann es. Das Prüfprotokoll von Anfang an in die Plattform einzubauen ist deutlich günstiger als es später nachzurüsten — und die gewonnenen Streitfälle sind ein Nebeneffekt des Betriebs, kein separates Projekt.
Durchlaufen Sie das
in unserer Sandbox.
30 Minuten. Wir bringen den Betreiber, der dieses Szenario erlebt hat.