High Availability化の基準 1

ユーザサイトにみる障害対応事例

突然の障害にどう対応したのか   本記事では、ユーザサイト公開後に起きた障害対応について実例をもとに紹介します。また、システムの信頼性を高める施策として、どのようなことを行ったのかを解説していきます。障害が発生したWebサイトについて   サイオステクノロジーでは、2007年の8月にプロジェクトマ

與倉 和明

2007年10月30日 20:00

突然の障害にどう対応したのか

   本記事では、ユーザサイト公開後に起きた障害対応について実例をもとに紹介します。また、システムの信頼性を高める施策として、どのようなことを行ったのかを解説していきます。

障害が発生したWebサイトについて

   サイオステクノロジーでは、2007年の8月にプロジェクトマネジメントソフトウェア「ProjectKeeper(以下、PK)」をオープンソースで公開しました。PKの詳細については、以下のURLを参考にしてください。




   PKはダウンロードサイトだけでなく、プロジェクト管理というキーワードでコミュニティを形成し、様々な意見を交換するためのユーザサイトを構築・ 公開しています。公開したWebサイトはコンテンツのリリースの手間やリードタイムを考慮し、公式サイトではなく、既存のサイトを利用しました。

   このWebサイトのシステム環境は以下のような構成になります。



システム環境
図1:システム環境

当初の状況

   ユーザサイトは製品購入後のお客様向けのサービスがほとんどであるため、これまでの経験からアクセス頻度はそれ程高くはないと予測しました。

   想定される障害への対策などについては検討を重ねていましたが、公開までのリードタイムが短く、すべての準備万端な状態で公開することが厳しかったため、プライオリティをつけて必要最低限の準備を行い、順次対応していくこととしました。

   当然のことながら、サーバやアプリケーションのダウン時の対応としてHA構成(LifeKeeper)の導入は検討していました。しかしながら、公開日程が迫っていたため、当初は暫定措置として手動でのメンテナンスで対応するということで公開に踏み切りました。

   ユーザサイトでは各種製品ダウンロードや製品デモシステム、FAQシステムなど、約10種類のJ2EEアプリケーションが 「Apache+mod_jk2+Tomcat」という組み合わせで動作していました。ここにPKのユーザサイトのコンテンツを追加することになります。

   PKのユーザサイトには、PHPアプリケーションの「XOOPS」を採用したので、既存のApacheをPHPが動作するように再構築する必要があ りました。しかし、既存のApacheの環境を変更するにあたって、他サービスへの影響を考慮する必要があります。そこで今回は既存のApacheの設定 を極力変更せずに別のApacheサーバへmod_proxyを利用してリクエストを転送するように設定しました。

   サーバのサイジングについては、以下の2点から前述の通りのシステムで問題ないと判断をしました。



  • PKβ版を発表して2ヶ月程で8,000ダウンロードあった際も、サーバが特に不安定にならなかったこと
  • ユーザ情報の登録が必要なこともあり、PKβ版に比べてダウンロード数は減少すること
表1:サーバのサイジング指標

   Webサイトの公開後、各メディアでPKの記事が紹介され、当初は1日20件〜50件程度と考えていたダウンロード数が連日150〜200件もあり、いい意味で予想は裏切られました。そして、問題が発生したのです。

この記事をシェアしてください

人気記事トップ10

人気記事ランキングをもっと見る