仮想化環境の安定稼働を実現するCLUSTERPRO
ライブ・マイグレーションによる切り替えでは障害イメージも引き継いでしまう
仮想化ソフトの安定稼働に役立つ機能のひとつがライブ・マイグレーションだ。VMware vSphere(TM)のVMotionや、Hyper-V(TM)のバージョン2.0からサポートされる予定のLive Migrationなどが代表格だ。これらライブ・マイグレーション機能を利用することで、個々の仮想マシンを、稼働中の物理サーバーから別の物理サーバーに、業務を停止することなく移動することが可能になる。
しかし、ライブ・マイグレーション機能は、正常なシステムの移動が前提となっている。移動は手動で行わなくてはならないという制約がある上に、ライブ・マイグレーションが動的にメモリをコピーしているため、物理サーバー上で起きた障害のイメージはすでに待機サーバー上にも波及してしまっているのだ。
つまり、ライブ・マイグレーションはあくまでも正常な状態の仮想サーバーを対象に、リソースの活用率の向上や、メンテナンスなどの計画停止に利用するための機能なのであり、障害対策においては効力を持たないのだ。
HA機能はハードウエアやアプリケーションの異常は検知しない
同様に、仮想化ソフトにはHA(High Availability)機能も搭載されている。HA機能としてはVMware HA、Hyper-VとWSFCとを組み合わせたクイック・マイグレーションが有名だ。
HA機能は仮想化ソフトが仮想マシンの障害を検出して、仮想マシンごとに利用する物理サーバーを切り替える。検知後自動で仮想マシンのOSを立ち上げ、その上の業務アプリケーションを起動するため、切り替えにはおおよそ5~10分程度の時間がかかる。この時間をどう見るかだが、ホットスタンバイを必要とするようなHAの用途では問題視されるケースは多いだろう。
また、仮想化ソフト標準のHA機能は、すべてのレイヤーを監視対象にしておらず、その対象は仮想化ソフトと仮想マシンの動作に絞られている。このレイヤーに異常があれば物理サーバーの切り替えが行われるが、仮想マシン内のOSやアプリケーションに障害が起きても標準HA機能では検出できない。仮想マシンが動いてさえいれば、サーバーの切り替えは起こらないのだ。
ほかにも、ホストOSが乗っている物理サーバーの物理障害は検知できないため、DISKの障害やNICのリンクダウンなどを上位で動いている仮想マシン側に伝達しない。このため、稼働が切り替わらず、暴走やハングアップなどの原因となる。
このように現行の仮想化ソフトが備えているHA機能は、物理装置の障害伝達にも問題を抱えている。
これらの解決策として有効なのが、クラスタソフトの導入だ。クラスタソフトはもともと複数のサーバーの連携による高可用性を実現することを目的に開発されたソフトである。そのため、仮想化ソフトに標準搭載されたマイグレーションやHAの機能だけでは解決できない、サーバー連携の弱点を補うことが可能となる。
それでは、NECのクラスタソフト「CLUSTERPRO」の機能についてさらに見ていこう。