← 전체 글 보기
상태 페이지 · 8분 분량

고객이 실제로 신뢰하는 상태 페이지를 만드는 방법

A laptop screen showing a clean dashboard with green status indicators.

대부분의 상태 페이지는 존재할 뿐 신뢰받지 못합니다. 장애 중에도 항상 초록불인 페이지는 페이지가 없느니만 못합니다. 고객이 더 이상 들여다보지 않게 만들기 때문입니다. 신뢰받는 상태 페이지에는 네 가지 속성이 있습니다. 무엇이 망가졌는지 정직하게 밝히고, 인시던트를 신속히 인정하며, 영향 범위를 세심하게 한정하고, 독자가 직접 찾아 헤매지 않고도 «이게 나에게 영향이 있나?»라는 질문에 답해줍니다. 이 가이드는 그런 페이지를 어떻게 설계하는지를 다룹니다.

고객이 상태 페이지에서 실제로 원하는 것

상태 페이지 방문에는 두 가지 질문이 동기로 작용합니다. 고객은 자신이 신경 쓰는 것이 망가졌는지, 그리고 누군가 그것을 인지하고 있는지를 알고 싶어 합니다. 그 외의 모든 것은 장식에 불과합니다.

페이지가 첫눈에 두 질문에 모두 답하면 고객은 페이지를 신뢰하고 지원팀에 연락하는 것을 멈춥니다. 둘 다 답하지 못하면, 모든 인시던트마다 추가 지원 티켓이 다섯 건씩 발생하고 신뢰는 서서히 무너집니다. 시각 디자인보다 첫 화면에 보이는 내용의 구조가 더 중요합니다.

신뢰받는 페이지의 네 가지 속성

네 가지 속성이 유용한 상태 페이지와 허울뿐인 페이지를 가릅니다. 네 가지 모두를 제대로 갖추면, 실제 인시던트 상황에서도 고객이 페이지를 신뢰합니다.

  • 정직성. 망가진 것은 망가졌다고 표시합니다. 아직 모르는 상황이라면 페이지에 조사 중이라고 명시합니다. 실제 인시던트 중에 초록불은 신뢰를 영원히 무너뜨립니다.
  • 속도. 인시던트는 감지 후 몇 분 안에 게시합니다. 실제 장애보다 한 시간 늦은 상태 업데이트는 마케팅 문구로 취급됩니다.
  • 범위 명확성. 고객이 몇 초 안에 해당 인시던트가 자신이 사용하는 영역에 영향을 주는지 판단할 수 있어야 합니다. 라벨링할 세 가지 차원은 리전, 제품 영역, 심각도입니다.
  • 평이한 언어. 업데이트는 친구에게 사고를 설명하듯이 작성합니다. 수동태 위주의 사무적 산문이 아닙니다.

효과적인 인시던트 업데이트

대부분의 상태 페이지 템플릿은 수동적이고 회피적인 어조를 기본으로 합니다. «지연 시간 증가에 대한 보고를 조사 중입니다.» 이는 책임을 회피하는 것으로 읽힙니다. 신뢰를 쌓는 패턴은 그 반대입니다. 무엇이 망가졌는지, 사용자 영향은 무엇인지, 어떤 조치를 취하고 있는지를 명시하는 것입니다.

좋은 첫 업데이트는 이런 식입니다. «EU 리전 고객의 약 30%가 로그인에 실패하고 있습니다. 데이터베이스 페일오버가 진행 중이며, 예상 소요 시간은 10분입니다.» 좋은 해결 메시지는 이런 식입니다. «로그인이 복구되었습니다. 근본 원인은 멈춘 페일오버 스크립트였습니다. 다시는 조용히 멈출 수 없도록 와치독을 추가했습니다.» 둘 다 짧습니다. 둘 다 영향, 조치, 후속 조치를 명시합니다.

영향 범위를 정확히 한정하기

제품 라인이나 리전이 둘 이상이 되는 순간, 모든 것을 통합한 단일 상태 페이지는 잘못된 추상화가 됩니다. 미국 전용으로 배포한 고객은 EU 리전의 지연 시간 증가에 관심이 없습니다.

  • 페이지를 구성요소별로 나누세요. API, 대시보드, 인제스션, 결제 등. 단일 글로벌 지표가 아니라 구성요소별 상태를 표시합니다.
  • 적용 가능한 경우 리전 또는 환경 차원을 추가하세요. 인시던트 발생 시 영향받은 리전을 명시적으로 표기합니다.
  • 라이브 상태 아래에 최근 90일간의 인시던트를 보여주세요. 방문자는 이 과거 이력을 보고 귀사가 의존할 만큼 신뢰할 수 있는지 판단합니다.
  • 제공 가능하다면 RSS 또는 JSON 피드를 노출해, 관심 있는 고객이 자체 도구로 구독할 수 있게 하세요.

침묵 없는 정기 점검

정기 점검은 상태 페이지에서 가장 쉽게 잘할 수 있는 부분이면서도 가장 자주 누락되는 영역입니다. 점검 시간대는 48시간 전에 게시하고, 무엇이 영향받고 무엇이 영향받지 않는지를 요약하며, 완료를 확인하는 후속 글을 게시하세요.

정기 점검은 인시던트 업데이트와 동일한 어조로 다루세요. 점검 시간대를 명시합니다. 영향받는 서비스를 명시합니다. 영향 범위를 명시합니다. 깔끔한 점검 공지는 지원 티켓을 사전에 차단합니다. 모호한 공지는 십여 개의 티켓을 만들어냅니다.

상태 페이지 자체의 안정성

상태 페이지는 메인 인프라와 독립된 곳에 호스팅하세요. 데이터베이스 장애 중에 상태 페이지가 대시보드와 동일한 데이터베이스 오류를 반환한다면, 페이지 자체가 인시던트의 일부가 됩니다. 별도의 제공업체, 별도의 리전, 또는 정적 CDN에서 로드되는 상태 페이지는, 실제 장애가 처음 발생했을 때 그 가치를 입증하는 작지만 중요한 아키텍처적 원칙입니다. 대부분의 팀은 이를 호되게 겪고서야 깨닫습니다.

MonitorAH 무료로 사용해 보세요

모니터 3개, 1분 이내 알림 설정, 신용카드 불필요. 이 문단을 읽는 시간 안에 웹사이트 하나와 cron 작업 하나를 보호할 수 있습니다.

모니터링 시작하기