【ネットワーク教習所】
サービスを守るネットワーク監視
第3回:パフォーマンス/トラフィック管理
著者:トゥワイズ・ラボ 山居 正幸
公開日:2008/03/27(木)
パフォーマンスが悪いとは?
前回は、ITサービスを止めないためのネットワークの障害管理について紹介した。今回はシステムのパフォーマンスについて解説していく。
ITサービスが停止するような障害に対して利用者は非常に敏感であり、そのような事態が発生したら、問い合わせが殺到するであろう。しかし、アクセスさえできていれば多少レスポンスが悪くても、サーバやネットワークが混んでいる影響だろうと寛容に受け止める傾向にあると思う。
例えば、接続後に気の遠くなるような遅いレスポンスや「サーバが混み合っています」というメッセージが表示された場合などは、アクセスが集中しているのだと納得し、忍耐強く待つことができよう。
人間はシステムのパフォーマンスに関して比較的寛容ではある。そのため、本来のシステム性能以下で動作していても、十分調査せずに放置されている場合も多々ある。しかし、それが続くとユーザ離れが起きる可能性があるので注意が必要だ。
このITシステムのパフォーマンスに関して調査および改善を行う技術がパフォーマンス管理であり、ITサービスへの投資を無駄にしないための重要な技術である。
(画像をクリックすると別ウィンドウに拡大図を表示します)
ITサービスのパフォーマンスを決める2つの要因
ITサービスのパフォーマンスは、おおむねサービスのレスポンスタイム(応答時間)で表すことができる。Webサービスならば、利用者がURLを指定またはリンクをクリックしてから、指定されたページが表示されるまでの時間である。
このレスポンスタイムを決める要因は大きく分けて2つある。サービスを提供するサーバなどの性能によるものと、サーバまでのネットワーク回線によるものである。
サーバの性能に対して、許容以上のリクエストが殺到した場合や、ネットワーク回線に許容以上のトラフィックがかかった場合、レスポンスタイムは長くなる。サーバの性能に関しては、サーバのリソース(CPU性能、メモリ、ディスクI/O速度)が重要である。ネットワークトラフィックに関しては、回線容量と共に経路上のルータなどのLAN機器の性能が関係する。
しかし、闇雲に高性能のサーバやルータを導入したとしても、回線容量の増強を行う対策では解決できない場合があり、システムへの過剰な(無駄な)投資となる可能性がある。
例えば、Webサービスのパフォーマンス改善の目的で、回線数の増強と高価なロードバランサの導入を行った。しかし、実際のボトルネックは、Webサーバと連携して動作しているデータベースサーバの負荷が許容量をオーバーしていたためで、投資効果がまったく無かったということが起こり得るのである。
逆に、サーバ性能をアップして同時に対応できるユーザ数を増やしたが、その分に対応できる回線の増強を行わなかったために、効果が得られないということも考えられる。
効果的な対策を行うには、パフォーマンス/トラフィック管理技術により、実際のレスポンスタイムのモニタとボトルネットについて十分解析することが必要なのである。 次のページ