TOP
>
サーバ構築・運用
> 突然の障害にどう対応したのか
High Availability化の基準
ユーザサイトにみる障害対応事例
著者:
サイオステクノロジー 與倉 和明
2007/10/30
1
2
3
次のページ
突然の障害にどう対応したのか
本記事では、ユーザサイト公開後に起きた障害対応について実例をもとに紹介します。また、システムの信頼性を高める施策として、どのようなことを行ったのかを解説していきます。
障害が発生したWebサイトについて
サイオステクノロジーでは、2007年の8月にプロジェクトマネジメントソフトウェア「ProjectKeeper(以下、PK)」をオープンソースで公開しました。PKの詳細については、以下のURLを参考にしてください。
プロジェクト管理ツールProjectKeeperを試そう!
PKはダウンロードサイトだけでなく、プロジェクト管理というキーワードでコミュニティを形成し、様々な意見を交換するためのユーザサイトを構築・公開しています。公開したWebサイトはコンテンツのリリースの手間やリードタイムを考慮し、公式サイトではなく、既存のサイトを利用しました。
このWebサイトのシステム環境は以下のような構成になります。
図1:システム環境
当初の状況
ユーザサイトは製品購入後のお客様向けのサービスがほとんどであるため、これまでの経験からアクセス頻度はそれ程高くはないと予測しました。
想定される障害への対策などについては検討を重ねていましたが、公開までのリードタイムが短く、すべての準備万端な状態で公開することが厳しかったため、プライオリティをつけて必要最低限の準備を行い、順次対応していくこととしました。
当然のことながら、サーバやアプリケーションのダウン時の対応としてHA構成(LifeKeeper)の導入は検討していました。しかしながら、公開日程が迫っていたため、当初は暫定措置として手動でのメンテナンスで対応するということで公開に踏み切りました。
ユーザサイトでは各種製品ダウンロードや製品デモシステム、FAQシステムなど、約10種類のJ2EEアプリケーションが「Apache+mod_jk2+Tomcat」という組み合わせで動作していました。ここにPKのユーザサイトのコンテンツを追加することになります。
PKのユーザサイトには、PHPアプリケーションの「XOOPS」を採用したので、既存のApacheをPHPが動作するように再構築する必要がありました。しかし、既存のApacheの環境を変更するにあたって、他サービスへの影響を考慮する必要があります。そこで今回は既存のApacheの設定を極力変更せずに別のApacheサーバへmod_proxyを利用してリクエストを転送するように設定しました。
サーバのサイジングについては、以下の2点から前述の通りのシステムで問題ないと判断をしました。
PKβ版を発表して2ヶ月程で8,000ダウンロードあった際も、サーバが特に不安定にならなかったこと
ユーザ情報の登録が必要なこともあり、PKβ版に比べてダウンロード数は減少すること
表1:サーバのサイジング指標
Webサイトの公開後、各メディアでPKの記事が紹介され、当初は1日20件〜50件程度と考えていたダウンロード数が連日150〜200件もあり、いい意味で予想は裏切られました。そして、問題が発生したのです。
1
2
3
次のページ
著者プロフィール
サイオステクノロジー株式会社 與倉 和明
システムインテグレーション事業部 ビジネスソリューション部長
重電機メーカー入社後、ソフトウェア開発の魅力に取り付かれ、SIer、コンサルティング会社などを経て、テンアートニ(現サイオステクノロジー)入社。システムコンサル〜開発まで全般をこなす。現在はSIOS Applicationブランドを立ち上げ、開発責任者としてアプリケーションビジネスを展開している。
INDEX
ユーザサイトにみる障害対応事例
突然の障害にどう対応したのか
Webサイトからの応答がない!
HA化の導入基準とは