Training Scenario

On-call Handoff

頻出キーワード

このシナリオでよく使われる 15 個の重要フレーズ

on-call shift

オンコールのシフト

障害対応のために待機する交代制の当番。

incident report

インシデント報告書

発生した障害の内容や対応経過を記録した文書。

unresolved

未解決の

まだ修正や対応が終わっていない状態。

false alarm

誤報

実際には問題がないのに発せられたアラート。

paging

ポケベル呼び出し、通知

システムから担当者へ緊急連絡が飛ぶこと。

severity

深刻度

インシデントの影響範囲や緊急性のレベル。

escalation

エスカレーション

自分だけで解決できない場合に、上位者に報告すること。

runbook

手順書

特定の障害が発生した際の対処手順をまとめたもの。

system health

システムの健全性

システムが正常に動作しているかどうかの状態。

flaky

不安定な

原因不明で時々失敗したり成功したりするテストやアラート。

downtime

ダウンタイム

サービスが停止していた時間。

monitoring

監視

リソース使用率やエラー率を継続的に見守ること。

log analysis

ログ分析

ログを調べて異常の原因を特定すること。

root cause

根本原因

障害の真の理由。

silence

サイレンス、静音化

特定のメンテナンス中などにアラート通知を一時的に止めること。

頻出する質問文

会話でよく登場する 5 個の質問と返答例

Q1

Were there any major incidents during your shift?

Q2

Is there any ongoing issue I should keep an eye on?

Q3

Did you update the incident report for the API outage?

Q4

Are all the alerts properly configured?

Q5

Has the escalation policy changed recently?