頻出キーワード
このシナリオでよく使われる 15 個の重要フレーズ
on-call shift
オンコールのシフト
障害対応のために待機する交代制の当番。
incident report
インシデント報告書
発生した障害の内容や対応経過を記録した文書。
unresolved
未解決の
まだ修正や対応が終わっていない状態。
false alarm
誤報
実際には問題がないのに発せられたアラート。
paging
ポケベル呼び出し、通知
システムから担当者へ緊急連絡が飛ぶこと。
severity
深刻度
インシデントの影響範囲や緊急性のレベル。
escalation
エスカレーション
自分だけで解決できない場合に、上位者に報告すること。
runbook
手順書
特定の障害が発生した際の対処手順をまとめたもの。
system health
システムの健全性
システムが正常に動作しているかどうかの状態。
flaky
不安定な
原因不明で時々失敗したり成功したりするテストやアラート。
downtime
ダウンタイム
サービスが停止していた時間。
monitoring
監視
リソース使用率やエラー率を継続的に見守ること。
log analysis
ログ分析
ログを調べて異常の原因を特定すること。
root cause
根本原因
障害の真の理由。
silence
サイレンス、静音化
特定のメンテナンス中などにアラート通知を一時的に止めること。
頻出する質問文
会話でよく登場する 5 個の質問と返答例
Q1
Were there any major incidents during your shift?
Q2
Is there any ongoing issue I should keep an eye on?
Q3
Did you update the incident report for the API outage?
Q4
Are all the alerts properly configured?
Q5