“障害発生前の解決”をどうやって実現するか
SNMPの活用
精密な性能監視が可能なSNMP
システム管理用のインターネット標準プロトコルとして知られる、SNMP(Simple Network Management Protocol)の最初のバージョンが規定されたのは20年以上前のことで、標準仕様として既に広く普及している。エンタープライズ向け製品でSNMPに対応していないハードウェア/ソフトウェアを探す方が大変なくらい、広範にサポートされているものだ。
一方で、ユーザー側には「ごく汎用的な限られた情報しか取得できないのではないか」といった思い込みもあるようだが、実際にはベンダーごと/製品ごとの拡張の余地が大きいため、製品毎に個別に対応する必要はあるものの、詳細な情報を取得できることが多いのである。
サーバやネットワーク機器などのハードウェア製品では、詳細な性能情報などもSNMP経由で取得できるようになっていることが多いため、運用監視ツールの側で製品ごとの固有の情報を読みとれるように対応を行うことで精密な性能監視も可能になる。
図2:MIB(Management Information Base)の体系(クリックで拡大) |
小パケットで詳細な性能監視を得ることができる
個別対応が必要という点がネックになり、既存の運用監視ツールではユーザーが監視対象としたい機器全てに対応しているということはあまりないのだが、筆者が所属するアイビーシー社のSystem Answerや、大手ベンダー製品であるJP1、WebSAM、Tivoli、Systemwalkerなど、対応機器の豊富なツールはいくつか存在しており、こうしたツールを使えば詳細な性能情報を機器毎に取得できる。
前述のような、Webサーバのレスポンスが悪いといった状況でも、それぞれの性能情報を比較することで、問題があるのがサーバなのか、途中のネットワーク機器なのかを、正確に突き止めることも可能になる。
SNMPでは、監視対象となる機器が一定時間間隔ごとに情報を小サイズのパケットに格納して発信し、これを運用監視ツールで受信することで情報収集を行う。パケットサイズが小さいことから、機器側に与える負荷も小さく、監視自体が性能劣化を招くといった懸念はまずない。監視対象機器の詳細な性能状況を得るためにはその機器固有のMIB情報を運用監視ツール側でサポートしている必要があるのは前述の通りだが、その点がクリアになっていればSNMPによる性能監視はクラウド/仮想化環境における運用監視の課題をきれいに解決できる優れたソリューションとなり得るのである。