震災で改めて考えるIT-BCP
リスク管理
ITシステムを保有する事業所が直接的に被災し、全面的にITシステムの復旧を余儀なくされるケースを考えましょう。この場合は、ある程度の企業規模ですと、復旧の範囲が広範囲にわたり、復旧への道程において混乱が大いに予想されます。何も手当ができていなかったら、いわゆるITリスク、すなわちITが事業に欠かすことができない現在では、ITの故障によって事業が継続できない事態に陥ります。事業を支えるITですので、止まってしまうことで多大な影響がでることは重視して考えておく必要があります。
社会的なインフラサービスを担っている事業を制御しているシステムであれば言うまでもないですが、それにとどまらず社内で稼働するシステムにおける可用性は確保しておく必要があるものと思います。例えば、今回の震災が発生した際に、携帯電話を含めた電話網の輻輳(ふくそう)状態が発生し、電話によるコミュニケーションはほとんど使用することができない状態を誰もが経験をしましたが、一方でメール、スカイプといったインターネット経由でのコミュニケーションツールがその代替手段として注目されたことは記憶に新しいことと思います。そうであれば、事業所でもしメールシステムを保有している場合は、そのシステムの可用性も優先して考慮する必要があるわけです。
ITを直接的に止めてしまう要因として仮に地震を引き金にした場合は、ITシステムが設置されている設備の電源断等が考えられ、その影響度も大きいものと思われます。また震災とは限らず、ITを止めてしまうであろう要因について、常にその発生の可能性を考慮しておくべきものもあります。 例えば、IT機器のハードウエアの障害、あるいはソフトウエア上の不具合といった面でもBCPにおけるITリスクとして把握しておく必要があります。
そして、これらの発生要因を低減させる、もしくは発生させないための予防的対応をとっておくことが必要になります。これを本稿では、リスク管理として行うべき行動となります。そのための具体的対応は、あらかじめITを停止させない策として無停電電源の導入や、ラックの倒壊を防ぐ免震対応のラック、そもそものIT設備を導入するデータセンターの免震、サービスレベル等がこれに相当し、またIT機器そのものの故障を防ぐための定期保守であったり、ソフトウエアであれば、ベンダーが提供するパッチ、サービスパックといった類の保守サービスを受けるといったものです。
図2:有事発生前後の取り組み |
BCPにおける有事後の対応
さて、ここまでの対策は、リスクに対して予防的な範疇での行動、リスク管理での側面についてのお話でありましたが、考えられる全てのリスクに対して予防的対策がとれていたとしても、これでITに関わる事業継続への対策が完全にとれているとは言えません。ITを止めてしまうような事象を可能な限り発生させない予防、軽減を目的とした対策として機能はしても、止まってしまってからの対策としては機能しません。
そこで、ITシステム、ハードウエア機器、アプリケーションソフトウエアが止まってしまった場合を想定しての対策が必要になります。先回の連載の際には、これらを「危機管理」と称して、有事発生後の危機状況からの、復旧を目的とした対策を持つ必要があると紹介しました(図2)。
有事後の対応は、BCPにおける本質的な部分です。ITシステムでは、旧来より「データのバックアップをテープにとり、さらに遠隔地で保管する」という運用をしています。「災害が起こった」、そして「システムが止まった」、または「データが壊れてしまった」という有事が起こった後に、いかにバックアップ・データから復旧するのかという段取りと、マニュアル類の完備が、具体的な対策行動の例になります。そのために、遠隔地に業務復旧のためのITを稼働させるための、リカバリーサイトの準備、およびそこで本拠地のバックアップデータ保管もしくは、複製回線で転送して作る(レプリケーション)というものが事前に準備する行動として必要になります。
このように、ITにおけるBCPを想定する場合は、有事前後の取り組みの目的とその対策の具体化を把握し、バランスよく備えておく必要があります。そして、有事を想定して、複数ある業務システム復旧の優先順位等がどうであるかをあらかじめBCP策定の中で決めておくことが重要になります。次ページではさらに取り組みの方法について見直しのアプローチをしてみようと思います。