IT災害復旧計画策定に必要な各種指標
事業継続計画や災害復旧計画の策定において必須となる指標には、以下の4つが挙げられる。
- RPO(Recovery Point Objective:目標復旧時点)
- RTO(Recovery Time objective:目標復旧時間)
- RLO(Recovery Level Objective:目標復旧レベル)
- MTPD(Maximum Tolerable Period of Disruption:最大許容停止時間)
今回はこれらの指標の関連に重点を置いて説明する。
目標復旧時点(RPO)と目標復旧時間(RTO)
RPOは、災害からのシステム復旧を行う際に“どの時点までさかのぼったデータを使って復旧するか”を示す指標で、代替システムで使用するデータのバックアップを取得するタイミングあるいは頻度になる。
例えばRPO=1日というのはデータバックアップが日次で実行されていて、システム復旧の際に使用するデータは最大1日前のデータである。言い換えると、システムは最大1日分のデータが失われた状態で再開することを意味する。一方、RPO=0(ゼロ)というのは、更新データはリアルタイムでバックアップされており、システム復旧の際には障害発生直前のデータを使用できる。つまりシステムが再開した際にデータの欠損は全くないことを意味する。
このように、RPOの値は大きければ大きいほど失われるデータが多いことを意味する。一般にデータの正確性や完全性を要求するようなシステムほどRPOは小さく設定される。例えば預金残高などの決済後のデータなど金融機関で扱う数字データは正確性が最も重要であるためRPOは限りなくゼロに近いものになる。この場合にはデータ更新の都度、そのデータのコピーを取得する必要があるため、ほぼリアルタイムでデータの複製(レプリカ)を作成する「データレプリケーション」方式を利用するのが一般的である。
一方で、メールなどのようにいったん受信してしまった後に更新されることがなく、データに正確性が求められないデータのRPOは1日など長いものになる。この場合は従来のテープなどを用いた「データバックアップ」方式が一般的である。
RTOは“システム停止から再開までの目標時間”を示す指標で、システム停止からシステム復旧作業に着手するまでの経過時間と、システム復旧作業に着手してから定められたレベルにまで復旧するまでの経過時間の総和である。RTOを短く設定するためには災害発生後どれだけ速やかにシステム復旧作業に着手し、そのシステム復旧作業を迅速に完了できるかがポイントとなる。
システムの復旧作業には、アプリケーションとデータの復旧作業が含まれている。データ復旧時間はデータ復旧をバックアップからリストアして行うのか、データレプリケーションで複製されたデータをそのままアクセス可能とするのかに依存している。データレプリケーションはリストア作業が不要であるため、バックアップからのリストアによるデータ復旧よりRTOを短くできる。アプリケーションが格納されているディスク領域もレプリケーションによってバックアップサイトに常に複製しておけば、システム復旧に掛かる時間を小さくすることが可能だ。
図1:目標復旧時点(RPO)と目標復旧時間(RTO) |