ダウンタイム予算計画: SLA内でのメンテナンスウィンドウ配分

SLAのダウンタイム予算内でメンテナンスウィンドウとデプロイメントスケジュールを計画します。月・週・スプリントあたりの計画ダウンタイム許容量を計算します。

SRE Practices

詳細な説明

SLA内でのダウンタイム計画

すべてのSLAには有限のダウンタイムバジェットがあります。賢い運用チームは、計画メンテナンス、デプロイメント、インフラ変更のためにこのバジェットの一部を事前に配分し、予期しないインシデントへの予備を残します。

70/30ルール

一般的な慣行は、計画活動にエラーバジェットの70%以下を使用し、30%を予期しないインシデントのバッファとして残すことです:

SLA 月間バジェット 計画(70%) 予備(30%)
99% 438分 306.6分 131.4分
99.9% 43.8分 30.7分 13.1分
99.95% 21.9分 15.3分 6.6分
99.99% 4.38分 3.1分 1.3分

デプロイメント頻度への影響

デプロイメント戦略がダウンタイムバジェットに直接影響します:

戦略 デプロイあたりの典型的ダウンタイム 99.9%での最大デプロイ数
フルリスタート 2-5分 月6-15回
ローリングアップデート 10-30秒 月60-180回
ブルーグリーン 1-5秒 月360回以上
カナリア/プログレッシブ 0秒 無制限

スプリントベースの計画

2週間スプリントを使用するチームの場合:

スプリントダウンタイムバジェット = 月間バジェット / 2

99.9% SLAの場合:
  スプリント合計バジェット:21.9分
  スプリント計画バジェット(70%):15.3分
  スプリント予備:6.6分

ユースケース

インフラメンテナンスのスケジューリング、データベース移行の計画、デプロイメント戦略のサイジング、ステークホルダーや顧客へのメンテナンス予定の伝達時にダウンタイム予算計画を使用します。

試してみる — Uptime Calculator

フルツールを開く