BCP(事業継続計画)におけるIT
BCPにおけるIT
事業継続を広い意味でとらえると、ITに求められる対策としては、「(事業を支える)ITを止めないこと」とくくることができます。前ページでは地震などの自然災害の例を挙げましたが、ITの視点からみると、ITを止めてしまう原因要素はいくつもあります。
ITを止める要素には、例えば、ハードウエア障害、ネットワーク障害、ソフトウエアのバグ、電源断、マシン・ルームの温度異常による各種誤作動、人為的操作ミス、サイバー・アタックによる誤作動、などがあります。これらはITシステム管理者に共通の課題ですが、これらに対する取り組みもまた、「(事業を支える)ITを止めない」という視点に立てばBCPの1つです。
災害時におけるサービス・レベルの管理・維持をどうするかなど、「ITを止めない」ための取り組みは、各企業それぞれです。いずれにせよ、システムが被災した際の復旧手順の準備や訓練、課題の把握といった、いわゆるPDCA(Plan、DO、Check、Action)のサイクルを回すことが提唱されています。
ここではまず、PDCAを回す前に、計画以前の「対策に対する考え方」について見直してみましょう。
ITのリスク管理と危機管理
BCPに対するITの位置づけとして「(事業を支える)ITを止めないこと」ととらえることができるとしましたが、これはつまり、システムを止めないことを目的に、ITを止める個々の要素に対して対応していくということです。
例えば、システムの2重化や、ほかにも地震を脅威とするならば、耐震補強や耐震設備への移設といった箱モノでの対応など、多額の費用がかかる施策が考えられます。これはリスクをマネジメントするという点で、経営的な観点で経済(コスト)的に、しかも合理的な視点で行われる領域の対応となります。
もう1つの視点を考えてみます。それは、「災害が起こってしまった時点以降」の視点です。先述した「箱モノ」(耐震設備への移転など)に代表されるような対応が「災害が起きる前の視点」であるのに対して、次の視点は、「システムが止まってしまった後の復旧」についての考え方になります。
災害後の対応は、BCPにおける本質的な部分です。ITシステムでは、旧来より「データのバックアップをテープにとり、さらに遠隔地で保管する」という運用をしています。「災害が起こった」「システムが止まった」「データが壊れてしまった」という有事が起こった後に、いかにバックアップ・データから復旧するのかという段取りとマニュアル類の完備が、具体的な対策の例になります。
図2に、災害の前後と、その対策の視点について整理をしておきます。有事が発生する前の視点を「リスク管理」、有事が発生した後の視点を「危機管理」と分類しました。特に危機管理の側面では、被害の拡大、つまり復旧が遅れることを防ぐという観点でも、有事後の対応は重要となります。
「リスク管理」は取り組みの可否を左右する要素として大きなコスト負担がありますが、「危機管理」の側面では、日々の運用で吸収できるアクティビティが主になります。次ページでは、「危機管理」の例を具体的に掘り下げます。