본문 바로가기

시스템 장애의 유형 DU vs. DL

Management/일 잘하기 2023. 3. 9.

Storage 벤더의 관점에서 시스템의 장애 상황은 크게 두 가지로 나누어 접근합니다. DU와 DL.

DU - Data Unavailable

DU는 Data Unavailable의 약자로서 데이터에 접근할 수 없어 데이터 서비스가 정지된 사항입니다.

이유는 여러 가지가 있을 수 있습니다. 스토리지 시스템의 문제일 수도 있고, 서버의 하드웨어 장애 또는 애플리케이션 서비스의 장애일 수도 있습니다. 아무튼 데이터 서비스가 가용(可用) 하지 않은 장애입니다.

DL - Data Lost

DL은 Data Lost의 약자로서 데이터의 일부 또는 전체가 상실된 상태입니다.

데이터를 잃어버린 것입니다. 디스크나 SSD 등의 저장 미디어가 사용할 수 없게 되었을 수도 있습니다.

이런 경우를 위해 하드 디스크는 RAID 구성을 하기도 하고, archive 복제본을 만들어 놓기도 합니다. 따라서 DL이 DU보다 심각한 장애 상황이라고 볼 수 있습니다.

DU/DL 예시

요즘 chatGPT가 전 세계적인 boom이 되면서 OpenAI 서비스 상태가 매우 중요해졌습니다.

아래 그림은 어제부터 개인별 prompt history 패널의 데이터가 전혀 보이지 않는 '기능 장애' 상황에 대해 OpenAI에서 제게 보내온 메일입니다.

제 이력이 보이지 않는 것은 맞지만 (DU) 데이터가 모두 사라진 것은 아니니 (DL은 아님) '기능'이 복구될 때까지 기다려 달라는 메시지입니다.

이제 문제는 그 과도적 기간 동안에 제가 작성하는 prompt들은 향후 기능이 복구되었을 때 포함될 수 있느냐입니다. 아마도 어려울 것이기 때문에 개인적으로 필요한 내용은 별도 에디터에 저장을 하려 합니다.

댓글