

조직(또는 조직) 경계와 일치하지 않는 장애 도메인은 인프라 구성 요소나 공유 데이터 센터, 클라우드 존 또는 타사 DNS와 같은 논리적 서비스를 나타내며, 슬롯사이트 장애가 발생하면 여러 관리, 기능 또는 비즈니스 단위에 걸쳐 동시에 서비스에 영향을 미칩니다. 이러한 교차 경계 장애는 종종 물리적 인프라 공유, 타사 공급업체 공유 또는 일관성 없는 논리적 구성으로 인해 발생합니다.
국경 간 장애 도메인의 주요 예:
공유 물리/가상 인프라: 여러 부서나 애플리케이션을 지원하는 단일 물리적 호스트(하이퍼바이저), 네트워크 스위치 또는 스토리지 어레이(SAN)로, 어느 팀이 소유하든 상관없이 구성 요소 고장으로 모든 부서가 충돌합니다.
클라우드 지역/가용 가능 구역: 클라우드 제공자의 구역(예: us-east1-b)이 실패하여 해당 지역 내에서 호스팅되는 여러 조직, 애플리케이션 또는 서비스 워크로드에 영향을 미칠 수 있습니다.
타사 종속성: SaaS 공급업체, DNS 제공업체 또는 API가 실패할 경우 관련이 없는 여러 비즈니스 유닛에 '블랙아웃'이 발생할 수 있습니다.
논리적 네트워크/보안 경계: 부적절하게 공유된 네트워크 세그먼트, IAM 정책 또는 인증 시스템이 조직 경계와 일치하지 않고 조직 경계 전반에 걸쳐 있습니다.
도전과 완화:
위험 식별: 모든 종속성을 매핑하는 것은 어렵기 때문에 특정 장애 도메인에 연결된 조직 단위를 예측하기 어렵습니다.
완화 위험: 중복성(예: 다중 지역 배포)을 구현하면 새롭고 더 복잡하며 때로는 관리하기 어려운 장애 모드를 도입할 수 있습니다.
솔루션: IBM 웹사이트에서 언급한 바와 같이 "인프라를 코드로"(IaC)를 채택하여 리소스를 일관되게 정의하고 격리하는 것과 조직 단위 전반에 걸친 엄격한 재해 복구 테스트를 결합하면 이러한 영향을 최소화하는 데 도움이 됩니다.





