運用管理者の判断を支援する障害原因の自動分析「コリレーション機能」
運用管理者の判断を支援する障害原因の自動分析「コリレーション機能」
システムの状態を把握できたら、次に必要となるのはどう対処すればよいか「判断」することである。
WebSAMでは複数の障害情報を基にあらかじめ定義したお客様の運用ポリシーに合わせて相関分析を自動で行い、その障害が発生した根本原因を特定する「コリレーション機能」を持っている。
さらに「その障害にどのように対処すればよいのか」といった「復旧方法」を通知し、ナビゲートしていく「ナレッジ機能」がある。運用管理者のスキルに依存しないシステム運用を実現している。
障害の復旧作業の約7〜8割の時間を費やすといわれている膨大なメッセージの調査・分析作業や復旧方法を調べる作業を、WebSAMでは自動で行うため復旧時間を大幅に短縮できるのが特徴だ。
またWebSAMは、EMC Smartsに実装されているモデルベース障害分析機能を取り込んでおり、分析機能が強化されている。ネットワーク障害などインフラ系の障害に関する原因 分析は、分析エンジンにより自動的に根本原因を特定でき、構成変更時にもルール定義変更の必要がなく迅速に対応できる。
プロビジョニングの自動化により、継続的に改善
対処・復旧方法がわかったら次に「改善」を実行する。WebSAMではこの「監視」から「判断」を行い「改善」してシステムを復旧するまでを、自動化することも可能である。
例えば、システムのスローダウンの事象発生を契機に障害調査・確認を行い、問題を判断して対処するまでの操作をシナリオとして登録しておくことで、 ハードウェアやOSだけでなく、ミドルウェアや業務アプリケーション層のプロビジョニングを自動的に行うことができる。
NECでは評価済みの12のシナリオのテンプレートを用意している。これを利用することで監視設定の定義やプロビジョニング後の再設定などの煩雑な 作業をすべて自動化できるようになる。このため人手による運用リスクと負荷を軽減し、業務の信頼性向上と効率化を実現できる。
このように、「監視」「判断」「改善」という、システム運用の一連の流れをわかりやすく一元管理し、運用管理者を強力にサポートするのが「WebSAM」である。
(協力:日本電気 村上 久美子)
バックナンバー
この記事の筆者
“オープンソース技術の実践活用メディア” をスローガンに、インプレスグループが運営するエンジニアのための技術解説サイト。開発の現場で役立つノウハウ記事を毎日公開しています。
2004年の開設当初からOSS(オープンソースソフトウェア)に着目、近年は特にクラウドを取り巻く技術動向に注力し、ビジネスシーンでOSSを有効活用するための情報発信を続けています。クラウドネイティブ技術に特化したビジネスセミナー「CloudNative Days」や、Think ITと読者、著者の3者をつなぐコミュニティづくりのための勉強会「Think IT+α勉強会」、Web連載記事の書籍化など、Webサイトにとどまらない統合的なメディア展開に挑戦しています。
また、エンジニアの独立・起業、移住など多様化する「働き方」「学び方」「生き方」や「ITで社会課題を解決する」等をテーマに、世の中のさまざまな取り組みにも注目し、解説記事や取材記事も積極的に公開しています。
マーケティングG
運用管理製品の市場調査やNECの運用管理製品「WebSAM」の製品企画を行うマーケティングを担当。システム環境の変化にも迅速に対応でき、お客様にとって使いやすいシンプルな運用管理製品の創出を目指し活動。
http://www.nec.co.jp/WebSAM/
筆者の人気記事
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

