バックアップ運用の見直し
問題は、「どのくらいの時間で復旧できるか?」を知る事
バックアップの課題の多くはバックアップ時間に関係する事に集中し、バックアップが終わらないという事象は現実的に多く発生しているという事をよく耳にします。データが増加している事は確実に起こっており、保護対象のシステムの構成が複雑になった仮想化時代の今では、それに伴うバックアップジョブをこなすスケジュールも複雑化し、そこへ何らかのバックアップ運用上の問題がおきれば、スケジュールも狂い、当日予定していたバックアップ運用は失敗に終わるといったような事態も想定できます。
これは、バックアップを行うバックアップサーバーや、その上で稼働するバックアップソフトの性能、アーキテクチャーに依存するという事が挙げられるため、その点を問題視して、バックアップのアーキテクチャーそのものを見直す契機になる事があります。従来のやり方の限界を、性能やアーキテクチャーでも感じているという事なのです。
仮にバックアップが全て成功しているとして、次に考えなければならないのは、復旧です。復旧について、どのくらいの時間がかかるか把握をしているでしょうか?
日々、データ容量が増加する環境では、その分復旧にも時間がかかる事は定性的に確かな事ですが、具体的にどのくらいの時間で復旧させる事ができるかを常に把握しておく事は必要です。
また、従来のバックアップソフトに代表されるようなバックアップ手法ですと、フルにリストアさせようとすると、フルバックアップがされたメディアから、順に、差分バックアップのデータを重ねていって最新の状態まで戻すといった、非常に時間のかかる運用が必要になります。
このように、実は、バックアップをする事における問題以外にも、復旧に関わる時間的な問題も十分大きな課題になる事は明らかです。
図3:バックアップメディアのデータ読み取り速度試算 |
バックアップのアーキテクチャーからの見直しが必要
皆さんは、どのくらいの時間でシステムが復旧できるか把握できていますか? 復旧作業全体のうち、リストアという作業で示すメディアからのデータ書き戻しの時間は大きな割合をもちます。データ書き戻しのおおむねの予測値をもつ事で、取りあえずの時間的な情報は見積もる事ができますが、これが全てではないので、実際の復旧作業と合わせて、予想よりも時間がかかっている作業の内容を把握する事が肝要です。
図3にメディアからのデータの読み出しにかかる時間を試算しています。これはテープメディア、ディスクメディアの転送速度から計算したものです。言うまでもない事ですが、転送させる容量(リストアさせる容量)が増せば時間が増す事になります。この値は単純にデータをメディアから読み出す時間だけを示していますので、これ以外の要素である、データを読み取る装置がもつ性能や、バックアップソフトの設計上に引きずられるパフォーマンスの問題等は除外されているため、実際はさらに時間が増す事が前提になります。
テープにおいてはさらに他の問題が潜んでいます。テープの利用が少なくなってきたという話を聞く事もありますが、利用する上でのリスクも考慮しておく必要があります。だいぶ古い調査データ(ESG Data Protection Strategies for SMBs, 2007)からですが、リストア失敗の原因の1番は、テープメディアの不良によるものであり、続いて人的なエラー、ハードウエアエラーといった順になります。また、調査に協力した企業の23%は、テープのバックアップオペレーションの20%は失敗すると明言していて、同様に、テープのリストア運用の20%は失敗するとも回答しています。使用環境にも依存するものなので、一概にこの値を鵜呑みにする必要はないとしても、テープメディアのリスクは考慮しておく必要はあります。
今回は、IT-BCPの取り組みのうち、バックアップ運用について取り上げ、復旧までの課題について考えてみました。次回は、バックアップ運用がもたらす業務への影響について考えてみようと思います。
【参考文献】
Data Protection Strategies for SMBs, ESG (2007)