サービス提供者と利用者の間で、提供する品質水準を取り決めた合意。
SLA(Service Level Agreement、サービスレベル合意)とは、サービスの提供者と利用者が、提供する品質の水準を事前に合意した取り決めのことです。サービスレベル(=サービスの品質)について、あらかじめ約束を交わすものと考えると分かりやすいです。
「だいたい安定して使えます」といったあいまいな約束では、トラブルが起きたときにどちらが悪いか分かりません。そこで品質を具体的な数字で文書にしておくことで、提供者と利用者の認識をそろえます。
身近な例で考えると、宅配便の「翌日お届け」に似ています。「いつか届く」ではなく「翌日までに届ける」と具体的に約束しているからこそ、利用者は安心して頼めます。上の図解でも、提供者と利用者が品質水準を文書で合意しています。
SLAでは、サービスの品質を表す項目を具体的な数字や条件で合意します。代表的な項目は次のとおりです。
・稼働率:システムが正常に動いている時間の割合(例 99.9%)
・応答時間・復旧時間:処理にかかる時間や、障害が起きてから直すまでの時間
・サポート対応時間:問い合わせを受け付ける時間帯(例 平日9〜18時)
・障害発生時の連絡体制:トラブルが起きたとき、誰がどう連絡するかの取り決め
たとえば稼働率99.9%とは、1年のうち停止が許されるのは合計でおよそ8.8時間まで、という意味になります。このように数字で約束しておくことで、達成できたかどうかを後から客観的に判断できます。
結論:SLAがなければ「期待通りだったか」を誰も判断できません。「安定して使えます」という口約束では、止まったときに「想定の範囲」か「約束違反」かが分かりません。トラブルが起きてから言い争いになってしまいます。
なぜ文書にするのか。品質を数字と文書で決めておけば、後から「この数字に達したか・達しなかったか」を客観的に判断できます。判断基準が明確なので、提供者も利用者も認識がそろい、トラブル時の対応が速くなります。
身近な例では、引越し業者との契約書に近いです。「ていねいに運びます」という口約束だけでは、傷がついたときに補償されるか曖昧です。しかし「破損があれば弁償する」と書面にしておけば、利用者は安心でき、業者も丁寧に扱おうとする動機が生まれます。SLAはまさにそのITサービス版です。
合意した水準を満たせなかった場合に備えて、SLAにはあらかじめ違反時の対応を定めておきます。一般的なのは次のような取り決めです。
・返金や利用料の減額(ペナルティ):約束した稼働率を下回ったら、その月の料金を一部返す、など
・報告と再発防止:原因を調べて報告し、同じ問題を起こさないよう改善する
ペナルティを決めておくことで、提供者には品質を守ろうとする動機が生まれ、利用者は万一のときに守られます。あらかじめ罰則を決めておくのは、契約をきちんと守らせる仕組みと言えます。
さらに、SLAで決めた水準を実際に守れているかは、SLM(サービスレベル管理)という活動で継続的に測定・改善します。合意して終わりではなく、測って・直して・また合意を見直すというサイクルを回していくのです。
稼働率(=アベイラビリティ)とは、システムが正常に動いている時間の割合です。SLAでは「稼働率 99.9%」のように具体的な数字で約束します。
なぜ%だけでなく時間に換算するのか。「99.9%」と聞いてもどのくらい止まるかイメージしにくいからです。実際に計算すると:
・1年 = 8760時間
・8760 × (1 − 0.999) ≒ 8.76時間の停止
つまり99.9%の稼働率でも、年間に約8.8時間まで停止が許容されるという意味です。
さらにイメージしやすくすると:
・99.9%:年間約8.8時間(月に約44分)
・99.99%(「フォーナイン」と呼ぶ):年間約53分
・99.999%(「ファイブナイン」):年間約5.3分
9が一つ増えるごとに許容停止時間が10分の1になります。9の個数が多いほど高い品質を意味し、その分コストも上がります。サービスの重要度に応じて合意する稼働率を決めることがSLAの設計の核心です。
Q1. SLA(サービスレベル合意)の説明として最も適切なものはどれですか。
Q2. SLAで合意する項目として適切でないものはどれですか。
Q3. SLAで合意した水準を満たせなかった場合の対応として一般的なものはどれですか。