ダウンタイム予算計画: SLA内でのメンテナンスウィンドウ配分
SLAのダウンタイム予算内でメンテナンスウィンドウとデプロイメントスケジュールを計画します。月・週・スプリントあたりの計画ダウンタイム許容量を計算します。
SRE Practices
詳細な説明
SLA内でのダウンタイム計画
すべてのSLAには有限のダウンタイムバジェットがあります。賢い運用チームは、計画メンテナンス、デプロイメント、インフラ変更のためにこのバジェットの一部を事前に配分し、予期しないインシデントへの予備を残します。
70/30ルール
一般的な慣行は、計画活動にエラーバジェットの70%以下を使用し、30%を予期しないインシデントのバッファとして残すことです:
| SLA | 月間バジェット | 計画(70%) | 予備(30%) |
|---|---|---|---|
| 99% | 438分 | 306.6分 | 131.4分 |
| 99.9% | 43.8分 | 30.7分 | 13.1分 |
| 99.95% | 21.9分 | 15.3分 | 6.6分 |
| 99.99% | 4.38分 | 3.1分 | 1.3分 |
デプロイメント頻度への影響
デプロイメント戦略がダウンタイムバジェットに直接影響します:
| 戦略 | デプロイあたりの典型的ダウンタイム | 99.9%での最大デプロイ数 |
|---|---|---|
| フルリスタート | 2-5分 | 月6-15回 |
| ローリングアップデート | 10-30秒 | 月60-180回 |
| ブルーグリーン | 1-5秒 | 月360回以上 |
| カナリア/プログレッシブ | 0秒 | 無制限 |
スプリントベースの計画
2週間スプリントを使用するチームの場合:
スプリントダウンタイムバジェット = 月間バジェット / 2
99.9% SLAの場合:
スプリント合計バジェット:21.9分
スプリント計画バジェット(70%):15.3分
スプリント予備:6.6分
ユースケース
インフラメンテナンスのスケジューリング、データベース移行の計画、デプロイメント戦略のサイジング、ステークホルダーや顧客へのメンテナンス予定の伝達時にダウンタイム予算計画を使用します。