運用管理者の判断を支援する障害原因の自動分析「コリレーション機能」
運用管理者の判断を支援する障害原因の自動分析「コリレーション機能」
システムの状態を把握できたら、次に必要となるのはどう対処すればよいか「判断」することである。
WebSAMでは複数の障害情報を基にあらかじめ定義したお客様の運用ポリシーに合わせて相関分析を自動で行い、その障害が発生した根本原因を特定する「コリレーション機能」を持っている。
さらに「その障害にどのように対処すればよいのか」といった「復旧方法」を通知し、ナビゲートしていく「ナレッジ機能」がある。運用管理者のスキルに依存しないシステム運用を実現している。
障害の復旧作業の約7〜8割の時間を費やすといわれている膨大なメッセージの調査・分析作業や復旧方法を調べる作業を、WebSAMでは自動で行うため復旧時間を大幅に短縮できるのが特徴だ。
またWebSAMは、EMC Smartsに実装されているモデルベース障害分析機能を取り込んでおり、分析機能が強化されている。ネットワーク障害などインフラ系の障害に関する原因 分析は、分析エンジンにより自動的に根本原因を特定でき、構成変更時にもルール定義変更の必要がなく迅速に対応できる。
プロビジョニングの自動化により、継続的に改善
対処・復旧方法がわかったら次に「改善」を実行する。WebSAMではこの「監視」から「判断」を行い「改善」してシステムを復旧するまでを、自動化することも可能である。
例えば、システムのスローダウンの事象発生を契機に障害調査・確認を行い、問題を判断して対処するまでの操作をシナリオとして登録しておくことで、 ハードウェアやOSだけでなく、ミドルウェアや業務アプリケーション層のプロビジョニングを自動的に行うことができる。
NECでは評価済みの12のシナリオのテンプレートを用意している。これを利用することで監視設定の定義やプロビジョニング後の再設定などの煩雑な 作業をすべて自動化できるようになる。このため人手による運用リスクと負荷を軽減し、業務の信頼性向上と効率化を実現できる。
このように、「監視」「判断」「改善」という、システム運用の一連の流れをわかりやすく一元管理し、運用管理者を強力にサポートするのが「WebSAM」である。
(協力:日本電気 村上 久美子)


