バックアップ運用がもたらす復旧への影響
復旧させるための準備1
今回は、バックアップ運用がもたらす業務への影響、特に災害時での復旧の側面から、その影響について考えてみます。有事が実際に起こることを想定して、どのくらいの影響が出るのかを、非常にシンプルな考え方を取り入れて、IT-BCPの策定、見直しをする上での参考としていきたいと思います。
前回、IT-BCPに関わる指標として、RTO(復旧時間目標)とRPO(復旧時点目標)についての記述をしました。いずれも時間軸の目標です。RPOはどの時点に戻すかを表すもので、昨日の時点に戻れば良いのか、1時間前の状態に戻れば良いのか、あるいは、止まった瞬間に戻さなければならないのかといった時間枠を考える必要があります。これは、そのシステムが担う業務の重要性に依存するものがあり、また復旧させる仕組みについてもそれぞれの要求に応じて仕組みが変わります。
RTOは、RPOで決められた復旧時点に、どれくらいの時間を使って復旧させるかを表す指標です。復旧に掛かる時間は、データの量、復旧の仕組み、復旧の手順や環境に依存するものになり、かつ重要なファクターになります。
RTO、RPOはどちらも復旧対象、つまりはバックアップの仕組みから見ると保護対象が持つ位置づけに左右されます。さらに、ビジネス視点でどの程度の目標値を持っていなければならないかも最終的に必要なファクターになります。双方のバランスも重要なファクターです。
例えば、3日掛かって戻せばいいという業務やデータを、高価な仕組みを使って、それ以上に早く戻す必要はないと言えますし、可能なかぎり早急に戻さなければならない業務のサーバーを戻すのに、バックアップのデータ管理がずさんだと復旧が進まないことになります。
図1:情報システムの重要度とRTOの設定 |
復旧目標とITシステムの重要度
復旧目標値をどのように決めるかは簡単には決められないことではありますが、専門家による参考文献※を援用し、今後のテーマを進める上での参考としてみようと思います。
※3ページ目、参考文献参照
図1に、情報システムの重要度クラスの設定を専門家による文献から援用してみました。これによると情報システムの重要度は、いくつかの重要度のカテゴリーによって分けることで、その重要度ごとにシステムを整理し、それぞれのRTOを決めています。
重要度クラスのSは、不測の事態発生時の緊急時コミュニケーションに必要なシステム群として、クラスAは、業務システムが止まると同時に製品やサービスの提供の中断が発生するシステム群、Bは、当初は人手で代替可能でも、業務システムの停止が継続すると製品やサービスの中断が発生するシステム群、Cは、業務システムが停止しても、社内業務のみに影響が限定されるシステム群、Dは、人手などの他の方法で代替手段が存在するシステム群とすることができます。
RTOは、参考文献による参考値でありますが、対策方法、つまり復旧の仕組みによって影響を受けるので、先述したように対象システムごとに適切な仕組みを適用して、RTOの実現の確からしさを上げる必要があります。復旧の仕組みについては、その選択には慎重を期す必要がありますが、復旧には、バックアップメディアからのリストアが大きな時間要素を占めるので、全体時間の中で復旧の仕組み、つまりはバックアップリカバリに関わるシステム自体が大きなボトルネックになる可能性があります。
次ページでは、簡単な想定を設定して、バックアップ運用の業務復旧への影響を試算してみましょう。