Data Center Colo · Étude de cas

Centre de données colo — train de puissance & SLA.

Deux scénarios d'un colo de 14 MW à Atlanta — une dérive CRAH détectée avant que le locataire phare ne le remarque, et une réclamation SLA de 48 000 $ résolue en cinq jours ouvrés.

Un centre de données colo de 14 MW à Atlanta avec des locataires hyperscale et colo d'entreprise. Le BMS moyenne la température de la salle. Le DCIM interroge toutes les 5 minutes. Pendant ce temps, la température de soufflage d'un CRAH seul monte de 2°C et un rack commence à dériver dans la limite supérieure ASHRAE A1. Deux scénarios : un thermique, un litige SLA.

6 minrétablissement référence CRAH — sans exposition du locataire
$48Kréclamation SLA retirée sur preuves par prise
5 daysjusqu'à la résolution du litige
Scénarios opérateurs

Comment ça se passe sur le terrain.

01

La dérive que le BMS a moyennée.

ATL-DC-3 · CRAH-7 supply temp · +2.1°C above baseline · sustained 45 min
01
ATL-DC-3 · CRAH-7 supply temp · +2.1°C above baseline · 45 min

Le BMS l'a moyennée. L'admission du rack non.

Le BMS signale la température moyenne de la salle comme correcte. Le DCIM interroge toutes les 5 minutes — également correct. Mais la température de soufflage du CRAH-7 grimpe de 2,1°C au-dessus de la référence depuis 45 minutes sur trois fenêtres de 15 minutes. Les racks ML inférés qu'il refroidit principalement dérivent vers la limite supérieure ASHRAE A1. Pénalité SLA locataire : 14 000 $ par heure si l'enveloppe est dépassée.

02
correlation engine · chiller plant rebalance at 04:12 · CRAH-7 under-fed

Cause racine : le rééquilibrage du groupe froid a laissé un CRAH sous-alimenté.

Le pilier Refroidissement corrèle la dérive de soufflage du CRAH-7 avec le journal d'équilibrage de charge du groupe froid. Cause racine : un rééquilibrage du groupe à 04:12 a laissé CRAH-7 sous-alimenté. Manuel opératoire joint : deux ajustements de vannes, durée estimée 10 minutes. L'enveloppe prévue reste dans ASHRAE A1 si correction dans les 20 minutes.

03
EN 50600 · operations log sealed · ASHRAE A1 maintained

Corrigé en 6 minutes. Le locataire ne s'en aperçoit jamais.

L'opérateur approuve le manuel opératoire. Ajustements des vannes exécutés. CRAH-7 revient à la référence en 6 minutes. Les deux racks d'inférence ML ne dépassent jamais l'enveloppe A1. Entrée du journal d'exploitation EN 50600 scellée automatiquement. Le rapport T3 ajoute une entrée supplémentaire dans la colonne « détecté et résolu avant exposition du locataire ».

6 min
jusqu'au rétablissement de la référence
De l'approbation du manuel opératoire au retour de la température de soufflage CRAH-7 dans l'enveloppe ASHRAE A1.
A1
enveloppe ASHRAE — maintenue
Les racks d'inférence ML n'ont jamais dépassé le plafond de température d'admission de classe A1. Pas d'exposition du locataire.
ASHRAE TC 9.9EN 50600
02

La surveillance du locataire disait une chose. La vôtre en disait une autre. La vôtre était scellée.

DAL-DC-1 · tenant T-09 · SLA dispute · 22-min power event · cabinet C-44
01
DAL-DC-1 · tenant T-09 · SLA dispute · 22-min power event · cabinet C-44

Le locataire revendique 22 minutes d'exposition à une coupure d'alimentation.

Un locataire colo dépose un litige SLA trimestriel revendiquant un événement d'alimentation de 22 minutes dans l'armoire C-44. La surveillance interne affiche une boucle de redémarrage serveur dans la fenêtre. Le BMS de l'installation affiche l'alimentation UPS au niveau de la salle comme correcte. Réclamation litige : 48 000 $ de crédit SLA. Renouvellement du locataire dans quatre mois.

02
Power pillar · per-outlet continuity · C-44 · ±0.4% · sealed

Continuité par prise : continue à ±0,4 %.

Le pilier Power d'ObservOne a suivi l'alimentation depuis l'arrivée réseau jusqu'à chaque prise de chaque PDU alimentant C-44. Le journal hash-chained a capturé chaque relevé : alimentation réseau stable, ATS non déclenché, batterie UPS stable, prises d'armoire délivrant une alimentation continue à ±0,4 % pendant toute la fenêtre contestée.

03
dispute packet · sealed · claim withdrawn in 5 business days

Réclamation de 48 000 $ retirée. Panique noyau, pas alimentation installation.

Le pilier Conformité rédige la réponse au litige : chronologie de continuité par prise pour C-44, scellée avec la clé locataire de l'opérateur, flux d'événements brut en pièce jointe. L'équipe IT du locataire examine. Leurs redémarrages serveurs ont été retracés à une panique noyau interne lors d'un correctif de cluster. Réclamation retirée en cinq jours ouvrés.

$48K
réclamation SLA retirée
Les preuves de continuité par prise ont résolu ce qu'une capture d'écran BMS ne pouvait pas.
5 days
jusqu'à la résolution du litige
L'équipe IT du locataire a retracé les redémarrages à une panique noyau, pas à l'alimentation de l'installation.
SOC 2EN 50600Uptime Institute Tier
Prenez en main

Reproduisez ce scénario
dans notre sandbox.

30 minutes avec un ingénieur solutions. Nous préchargerons un tenant avec des sites anonymisés correspondant à votre topologie. Compatible NDA.