スペイン発のオープンソース統合監視ツール「Pandra FMS」(2)
障害予防のための改善を実施する
前回の記事に続いて、情報の活用という面から、「効率化」「高品質化」「コスト削減」をどう実現していくかについて説明する。統合システム運用管理システムをどのように利用すれば、将来に向けてのシステム改善や新たなシステム設計に活用できるだろうか。
まず、システムの問題改善には、
- 障害の発生をきっかけとした改善
- 障害が発生する可能性を事前に発見し、障害が発生するまえに予 防を行う改善
の2種類がある。高品質化という目的においては、(2)について、いかに実施できるようにするかがポイントとなる。なぜならば、障害の発生頻度が下がっていくからだ。
障害予防のための改善を実施するためには、運用対象システムの普段の状態を、常に把握しておく必要がある。普段の状態を把握するためには、まずはシステムのログであったり、リソース情報といったデータの蓄積が必要だ。
20世紀型のシステム運用では、これらの情報収集のために、監視システムとは別のシステムを構築していることが多かったのではないだろうか。この場合、実際の運用や監視対象と情報収集の対象に、ずれが生じがちになる。必要なデータの収集ができていなかったり、新たなサーバーが追加になった場合にそれに対する情報収集がされていなかったり、ということも発生する。特にクラウド環境では、柔軟にサーバーを追加できる点にメリットがある。追加されたサーバーに対しても、即座に必要な情報収集を実施できるようにすることが必要となる。
21世紀型の統合運用管理システムでは、監視の機能と情報収集の機能が一元化されており、監視と情報収集をシームレスに行うことができる。PandoraFMSでは、全監視項目に対して、情報収集がデフォルトの動作になっている。コンソールに対象が登録された時点で、情報収集がスタートするのだ。クラウド環境の場合、エージェントをインストールしたイメージを用意しておけば、新たな仮想サーバーを追加する際に、起動するだけでPandoraFMSコンソールに、その監視対象が追加される。もちろん、その場で情報収集も監視される。サーバーを気軽に増やすようなクラウド環境においては、非常に親和性のあるシステムである(図1)。