キャパシティ・プランニングから統合監視まで
サイレント障害の統合監視 ~アプリケーション性能監視~
インバリアント分析では、分析対象の性能情報から「いつもと違う」挙動の中心となる要素を特定できます。この一次解析により障害の切り分けが可能となりますが、さらに原因となる要素を絞り込みたい場合は、より詳細な性能情報を追加して再分析を行うことで、原因個所の特定を詳細化することができます。
WebSAM MCOperationsは、サーバーの性能情報の自動収集までサポートしているので、切り分け範囲は、サーバー・リソース・レベルまでになりますが、アプリケーション管理ソフト「WebSAM Application Navigator」を導入することで、アプリケーションを含めた、障害の検知/原因の分析/特定が可能になります。
アプリケーション性能情報は、SAP社の基盤ミドルウエア「SAP NetWeaver」のように、アプリケーションが提供する特殊なインタフェースでなければ収集できないケースがあります。WebSAM Application Navigatorは、このようなアプリケーション特有の詳細な性能情報の収集をサポートしています。DB、APサーバー、Webサーバー、ERP、帳票システムやWeb 3階層モデルのシステムで採用されるLinux/OSS領域の主要アプリケーションなど、業務システムで利用されるアプリケーションに幅広く対応し、様々な性能情報の取得が可能です。さらに、これらのアプリケーションを利用して構築された業務システムのサービス・レスポンスを一元的に稼働監視することもできます。
このように、統合管理ソフトやアプリケーション管理ソフトウエアとの連携により、分析対象となる性能情報の種類を広げることで、リアルタイムにサイレント障害を検知し、障害対応時間をさらに短縮化することが可能となります。
クラウド時代のデータセンター運用
以上、4回に亘り、クラウド時代のデータセンター運用に関して説明しました。
第1回では、クラウド・サービス活用の背景からデータセンター運用に対する要件、その実現手法として統合運用管理ソフトウエアの活用例を紹介しました。第2回では、このようなクラウド指向データセンターの管理者を悩ませる「サイレント障害」について、障害検知の遅れと原因分析の長期化といった課題を挙げました。
第3回では、そのサイレント障害への対応を効率化する新技術「インバリアント分析」について、その特徴と従来技術との差異を示し、第4回では、インバリアント分析技術のこれからとして、キャパシティ・プランニングへの応用とほかの運用管理製品との連携によるサイレント障害の統合監視について取り上げました。
クラウド・サービスの実現に向けて、大規模/複雑化するデータセンターでは、今後その運用の効率化が大きな課題となってきます。増え続ける運用コストを低減するためには、まず現状を把握する適切な可視化を実現し、自律化といった先進技術を取り入れ、管理者の負担を低減することも検討する必要があるでしょう。
今回取り上げたインバリアント分析技術は、これまで人間側の負担が大きかった分析作業を自動化できるものであり、WebSAMでは、ほかの運用管理機能と適切に連携させることで、クラウド指向データセンターの運用コストをさらに削減し、管理者一人で数百台から千台規模のサーバーの運用管理を可能にしています。今後もこのような新技術を取り入れ、クラウド時代のデータセンター運用の効率化に貢献していきます。