← 所有文章
状态页面 · 8 分钟阅读

如何构建客户真正信任的状态页

A laptop screen showing a clean dashboard with green status indicators.

大多数状态页都存在,但少有人信任。在故障期间永远显示绿色的页面比没有页面更糟,因为它教会客户不再去查看。受信任的状态页具有四个特性:诚实地说明故障、迅速承认事件、谨慎地界定影响范围,并能让读者无需费力寻找就能回答「这是否影响到我?」这个问题。本指南介绍如何设计这样一个页面。

客户真正想从状态页获得什么

每次访问状态页背后都有两个驱动问题。客户想知道他们关心的东西是否出了问题,以及是否有人注意到了。其他一切都只是装饰。

如果页面在第一眼就能回答这两个问题,客户就会信任它,停止致电支持团队。如果两个都答不上来,每次事件都会带来五张额外的支持工单,并慢慢侵蚀可信度。视觉设计的重要性远不如首屏所展示内容的结构。

可信赖页面的四个特性

四个特性将实用的状态页与虚荣的状态页区分开来。四个全部做对,客户就会在真实事件期间信任该页面。

  • 诚实。如果出了问题,就显示为故障。如果尚未确定,页面就说明正在调查中。在真实事件期间显示绿色会永久摧毁信任。
  • 速度。事件应在检测到后几分钟内发布。比真实故障滞后一小时的状态更新会被视为营销文案。
  • 范围清晰。客户应能在几秒内判断事件是否影响到他们所使用的内容。区域、产品领域和严重程度是需要标注的三个维度。
  • 朴素的语言。更新应以您向朋友解释事件时所用的口吻撰写,而非被动语态的企业腔。

行之有效的事件更新

大多数状态页模板默认采用被动、含糊的语气。「我们正在调查关于延迟升高的报告。」这听起来像是推脱。建立信任的模式恰恰相反:说明什么出了问题、说明对用户的影响、说明您正在采取什么措施。

一份好的初次更新应该这样写:「欧盟区域约 30% 的客户登录失败。我们的数据库故障转移正在进行中,预计 10 分钟内完成。」一份好的解决说明应该这样写:「登录已恢复。根本原因是故障转移脚本卡住。我们已增加看门狗机制,确保此类问题不会再静默停滞。」两者都很简短。两者都说明了影响、行动和后续措施。

正确界定影响范围

一旦您拥有多个产品线或区域,单一的全局状态页就成了错误的抽象。仅在美国部署的客户并不关心您的欧盟区域延迟升高。

  • 组件拆分页面:API、仪表板、数据接入、计费等。显示按组件划分的状态,而非单一的全局指示器。
  • 在适用的地方添加区域或环境维度。在事件期间明确标记受影响的区域。
  • 在实时状态下方显示最近 90 天的事件。访客通过历史视图来判断您是否足够可靠值得托付。
  • 如果您提供该功能,公开RSS 或 JSON 订阅源,以便有需要的客户在自己的工具中订阅。

不再沉默的计划维护

计划维护是状态页中最容易做对、却又最常被忽略的部分。提前 48 小时发布维护窗口,概述将受影响和不受影响的内容,并发布后续说明确认完成。

对待计划维护应采用与事件更新相同的语气。说明维护窗口。说明受影响的服务。说明影响范围。一份清晰的维护通告可以预防一张支持工单。一份含糊的通告则会催生十几张。

状态页本身的可靠性

将状态页托管在独立于主要基础设施的地方。如果在数据库故障期间,您的状态页返回的数据库错误与仪表板相同,那么页面本身就成了事件的一部分。从独立提供商、独立区域或静态 CDN 加载的状态页,是一项小小的架构纪律,在您第一次真正遭遇故障时就会得到回报。大多数团队都是通过惨痛教训才意识到这一点。

免费试用 MonitorAH

三个监控、不到一分钟即可设置告警、无需信用卡。在您阅读这段文字的时间内,即可覆盖一个网站和一个定时任务。

开始监控