クラウド時代のデータセンターが持つ理想と現実
仮想化/クラウド環境の課題
コスト増とサービスレベルの低下が大きな問題に
クラウドでは、安価なサーバーを利用することで「障害を起こさないように手厚く管理する」のではなく、「問題があったら代替サーバーにライブマイグレーションして回避する」といった運用によってデータセンターの運用管理コストを下げることが期待されていた。
しかし、ネットワーク回線帯域など低コストで迅速に確保することが難しいリソースもあるし、物理サーバーを共有する仮想サーバー間でのリソース取り合いの結果、ある特定の仮想サーバーでのみ性能劣化/レスポンス悪化が発生するなど、従来の性能監視手法だけでは対応できないようなトラブルも生じるなど、ライブマイグレーションだけで何もかも解決できるわけではないし、これまでなかった新しいトラブルも発生するようになってきている。
クラウド化によって運用管理負担が軽減する、というのは今のところ理想論にとどまっていると言わざるを得ない状況だ。
むしろ、仮想化によるワークロードの集約が進行した結果、いったん障害が発生した場合の影響範囲が拡大する傾向にあることから、万一の障害発生に備えて多くのスタッフが常時待機していなくてはならず、運用管理コストは増大する傾向にあると言っても過言ではないだろう。この状況は、データセンター事業者にとっては採算性悪化の要因になるし、企業内データセンターの場合でもコスト増/サービスレベル低下という経営レベルの問題につながりかねない。
図3:仮想環境の運用管理(クリックで拡大) |
システムのリアルタイムな性能情報をつかむことが重要
仮想化技術を導入し、クラウド化したデータセンターを、昔ながらの死活監視などの手法だけで管理するのは限界に来ている。複雑化/高度化する現在のデータセンターの管理には、環境の進化に歩調を合わせた、より高度で緻密な運用管理が必要となる。その基礎となるのは、実はシステムの構成要素全てを網羅できる詳細かつ正確なリアルタイムの性能情報である。「今システムのどこで何が起こっているのか」、それをいち早く正確につかむためにはそうした性能情報が不可欠となる。
では、仮想化/クラウド環境にふさわしい性能監視の手法にはどのようなものが考えられるのだろうか。次回はその点について話を進めていきたい。