頻出キーワード
このシナリオでよく使われる 15 個の重要フレーズ
observability
オブザーバビリティ、可観測性
システムの内部状態を外部からの出力(ログ、メトリクスなど)で把握できること。
metrics
メトリクス、指標
CPU使用率やエラー率など、定量的に測定された数値。
dashboard
ダッシュボード
主要なグラフや数値を一画面で見られるようにまとめたもの。
log aggregation
ログ集約
分散したサーバーからログを集め、検索や分析をしやすくすること。
anomaly detection
異常検知
普段とは違う不自然な動きを自動で見つけ出すこと。
threshold
しきい値
アラートを飛ばすかどうかの境界となる数値。
latency
レイテンシ、遅延
処理にかかる時間。リリース後に悪化していないか確認する。
error rate
エラー率
リクエスト全体のうち、エラーになった割合。
traffic pattern
トラフィックパターン
ユーザーのアクセス数の増減の傾向。
health check
ヘルスチェック
システムが正常に動作しているか定期的に確認する仕組み。
alerting
アラート通知
異常を検知した際にSlackやメールで通知すること。
resource utilization
リソース使用率
メモリやディスクなどの使用状況。
canary release
カナリアリリース
一部のユーザーにだけ新しいバージョンを公開して様子を見ること。
real-time monitoring
リアルタイム監視
現在の状況を遅延なく監視すること。
post-deployment
デプロイ後
リリース作業が終わった直後の時間帯。
頻出する質問文
会話でよく登場する 5 個の質問と返答例
Q1
Are we seeing any spike in error rates after the release?
Q2
How is the CPU usage on the new instances?
Q3
Did the canary release show any issues?
Q4
Can you check the logs for any database connection timeouts?
Q5