コネクション棄却率と応答時間

2008年8月27日(水)
佐竹 伸介

ユーザーのWebサイトで挙動特性

 前回およびここまでの説明は、Webサイト側のみに着目し、「MaxClients」および「KeepAlive」の設定が、一般的に、どのようにコネクション棄却率やユーザーへの応答時間に影響を与えるかについて説明してきた。

 しかし、実際に棄却率や応答時間を考える場合、当該Webサイトに新規ユーザーが訪れる特性や閲覧中のユーザーがWebサイト内の新たなWebページを閲覧する特性(クリックするタイミングなど)といった、ユーザーの挙動を知ることは非常に重要である。

 実際、それらユーザーの挙動によりネットワークやサーバーにかかる負荷は大きく変動することが知られている。よって、これらの特性を知り、サーバー負荷の急激な上昇に対する対策を講じなければならない。新規クライアントの到着と新たなページ閲覧要求の到着の特性は異なるので、それぞれについて説明する。

 まず、新規クライアントの到着間隔は過去の研究により、「1.おのおののユーザーは干渉せず、それぞれの都合でランダムにWebサイトに到着する(独立性)」「2.ある期間内に到着するユーザーの数は開始時刻にかかわらず同一の分布に従う(定常性)」「3.非常に短い期間に2つ以上のユーザーが同時に到着する確率は無視できるほど小さい(希少性)」という3つの性質を有しており、指数分布に従う到着間隔すなわちポアソン到着(参考:ポアソン分布(http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83))で近似できることが知られている。この分布の特徴は、平均値に比べ、小さい値での発生確率が高いことである。また、比較的大きな値も発生することである(図2)。

 次に、既にページ閲覧を行っているユーザーが同一Webサイト内での新たなページ閲覧を行うのに要する到着間隔について説明する。この到着間隔はユーザーの思考時間であり、シンクタイムと言われている。また、ユーザーによって大きく異なることが知られている。

 例えば、閲覧するWebページにユーザーが欲している情報がない場合、すばやく次のページへ移動するのでシンクタイムは短い。反対に、欲している情報がそのページに含まれている場合、長い時間をかけてそのページを閲覧するので、シンクタイムは長くなる。過去の研究によると、この特性はPareto分布で近似できることが報告されている。このPareto分布は先ほど説明した指数分布に比べ、短い時間間隔での発生確率が高く、また、すそが非常に長いのが特徴である(図2)。

急激な負荷上昇への対応

 ここまで説明してきた2つの特性から、もっとも注意しなければならないのは、共に、ある期間に集中的にリクエストが到着する可能性を有していることである。Webサイトへの集中したリクエストの到着は、サーバーの負荷を急激に上昇させる原因となり、最悪の場合、サーバーがダウンしサービスを提供できなくなる可能性もある。

 しかし、あらかじめそのような到着を想定し、すべてのリクエストに対応できるようなシステムを備えておくことは現実的ではない。ユーザーとWebサイトが許容できる棄却率および応答時間を検討し「MaxClients」や「KeepAlive」の値を調整することで、サーバーの処理能力を十分に生かすことが必要である。それでも、対応できないほどの負荷がWebサーバーにかかる場合は、複数台のサーバーにより構成されるWebサーバークラスタを検討しなければならない。

 ここでは、2つの特性のみ簡単に説明したが、実際にはWebページの人気度、Webページに含まれるファイル数、サーバーの処理能力や提供されるコンテンツの種類(HTMLファイル、画像ファイル、音声ファイル、動画ファイルなど)なども考慮しなければならない。

 次に到着リクエストと棄却率について考える。

平成5年岡山電業(株)入社後、ネットワークシステムの提案・設計を主たる業務として従事。平成15年岡山県立大学大学院入学。平成20年同大学院修了。主にWebサーバシステムの負荷分散に関する研究を行っている。博士(工学)。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています