VMware vSphere環境の監視管理
サード・パーティー製サーバー監視製品の現状
これまで説明してきた通り、VMware vSphere環境では、ハイパーバイザという従来のサーバー環境に存在しなかった管理層において、ハードウエア・リソースの情報を監視する必要があります。
ここで、従来のようにOS環境にエージェントを仕込むやり方ではなく、ハイパーバイザから直接情報を得るか、あるいはvCenter Serverが管理上所有している情報をもらう必要があることは、容易に想像できると思います。
国内外の監視ツールを扱うサード・ベンダーは、ここ1年くらいの間に、こぞってVMware製品に特化した監視機能を備えた製品ラインアップを揃え始めました。各社製品ごとにアーキテクチャーが異なります。
一般的によく利用されている監視ツールで用いられているアーキテクチャーを図3-1にまとめました。おのおのの特徴は以下の通りです。
直接エージェント導入型
従来のサーバー監視製品で一般的に用いられていたやり方と同じように、ハイパーバイザを管理するための管理OS(Service Console OS)にエージェントを導入して、リソースに関する情報を取得します。
エージェントの導入に関する注意点は、以下の2点です。
- 監視対象となるVMware ESXのすべてにエージェントをインストールする必要がある
- Service Consoleが含まれていないVMware ESXiにはインストールが出来ない
vCenter連携型
VMware vSphereの管理製品であるvCenter Serverが稼働しているマシンにエージェントを導入し、vCenter Serverが持っているリソース情報を取得します。
vCenter Serverの管理下にあるVMware ESXの監視ができるほか、VMotion(VMware ESX間で仮想マシンを無停止で移動させる機能)によって移動した監視対象の仮想マシンの追跡や、クラスタやリソース・プールなどvCenter独自のグルーピング単位での監視が実現可能です。
ハイパーバイザ連携型(エージェントレス)
あるサーバー上に専用のエージェントを用意し、ハイパーバイザからネットワークを経由して直接リソース情報を取得します。
VMware ESXやvCenter ServerなどVMware製品が稼働するマシンに直接エージェントを仕込む必要がないことから、“エージェントレス”型の手法と言えます。
情報収集の処理能力などに制約はあったとしても、監視対象となるVMware ESXの台数には制限がない製品が一般的です。しかし、vCenterと連携するわけではないため、VMotionの挙動の把握や、独自のグルーピング単位でのリソース情報の取得などはできません。
以上、3つの手法を紹介しましたが、どのアーキテクチャーにも一長一短があり、一概にどれが監視に適している/優れていると明言することはできません。強いて言えば、エージェントのライセンス・コストや運用保守、エージェントの動作によるCPUやメモリ・リソースの消費などの懸念から、昨今ではエージェントレスによるサーバー監視機能を求めるユーザーの声が高まっています。
VMware vSphereに特化した監視ツール
以下では、これまで説明してきた、VMware vSphereのリソース監視機能を備えた監視ツールの一部を紹介します。
商用の監視ツール
今回紹介するのは、日立製作所の統合システム運用管理ソフト「JP1」です(図3-2参照)。
運用管理製品として長い歴史と国内トップ・クラスのシェアを誇っているので、知っている方が多いと思います。いくつかの機能カテゴリの中で、アベイラビリティ管理というカテゴリに属する「JP1/Performance Management」製品群の中で、サーバーインフラや各種ミドルウエア製品の性能情報収集/管理機能を提供しています。
2008年11月には、VMware専用のリモート・エージェント製品「JP1/Performance Management - Agent Option for Virtual Machine」をリリースしています。当初はVMware ESX 3.0/3.5に対応した製品でしたが、2009年9月末には2009年5月に販売開始したVMware vSphere 4.0へもいち早く対応しています。
この製品は、先述したエージェントレスによるハイパーバイザ連携型アーキテクチャーの製品で、VMware ESXのハイパーバイザ層からのリソース情報に加え、その上の仮想マシンごとの仮想CPUや仮想メモリに関する情報を透過的に収集できます。主だった機能や特徴は以下の通りです。
- 仮想CPUの必要要求量と割り当て待ちの量(製品では“不足量”と表現されている)を取得できる
- バルーニング処理のスワップ・アウト量を取得できる(製品では“内部スワップ”と表現されている)
- VMkernelによるスワップ・アウト量を取得できる(製品では“外部スワップ”と表現されている)
- 取得した情報に警告と異常の2段階のしきい値を設定して監視できる
- しきい値を超えた場合に、vCenterと同じようにSNMPトラップやEメールを発信できる
- 収集したデータを蓄積し、棒グラフや折れ線、面グラフなどの形式で表示・確認できる
- CPUやメモリなど物理マシン全体の使用量や仮想マシンの使用量を相関グラフ化できる
なお、「JP1/Performance Management」製品だけでも、監視機能や警告メッセージの確認が可能ですが、統合管理製品「JP1/Integrated Management」に対してイベントを通知することにより、JP1のほかのカテゴリ製品のアラーム・イベントと一緒にメッセージ管理できます。
JP1/Integrated Managementでは、メッセージを重要度で色分して表示したり、イベントの種別ごとにEメール通知や他システム連携などの2次的なアクションを実行できます。連載の第4回目で予定しているCTC独自開発の運用管理ツールの紹介時に、JP1統合管理製品と連携したインシデント管理の実例を紹介する予定です。
オープンソースのツール
CTCでは、JP1に代表される商用の運用管理製品を長年販売してきており、インフラ機器やミドルウエアなどのSIと合わせて、監視/管理運用の設計/構築サービスを手がけてきました。
昨今では、先述したエージェントレス型の監視製品の需要と並行して、オープンソースの監視ツールを用いた、より低コストの監視/管理機能の導入を検討するユーザーが増えています。CTCでは、こうした市場ニーズにも答えるべく、オープンソースのソフトにも着目しています。
VMware vSphereの監視機能を備えたオープンソースも、実際のユーザー事例として利用が進んでいます。例えば、ZABBIXというソフトは、商用の監視ツールに見劣りしない機能が備わっており、ベンダーによる関連サービスも豊富です。
MIRACLE LINUXの開発元であるミラクル・リナックス社では、ZABBIX用に、VMware vSphereに特化した監視テンプレートを開発して有償提供しているほか、ZABBIXのサポート・サービスや導入サービスなどの付加価値サービスを提供しています。
CTCでも、ユーザーのニーズに応じてこのようなソフトの紹介ができるよう、準備を進めています。さらに、単に製品や機能の販売だけでなく、SIやシステム構築/導入などで培ったノウハウや、監視も含めた仮想化サーバー統合環境の運用サービスの提供にも取り組んでいます。これらについては、次回の第3回で紹介します。