[ThinkIT] 第5回：富士通の高信頼基盤ソフトウェア「PRIMECLUSTER」 (2/3)

TOP＞比較データ＞異常サーバの確実な停止

徹底比較!!クラスタソフトウェア

第５回：富士通の高信頼基盤ソフトウェア「PRIMECLUSTER」
著者：富士通服部裕慈 2005/12/12

前のページ 1 2 3 次のページ

異常サーバの確実な停止

   一般的にはハートビートの応答がなくなると、そのサーバは停止したものとしてフェイルオーバーします。

   ところがハートビートの応答がなくなった原因が一時的なハングアップやシステム高負荷状態であった場合には、時間が経過するとその状態が解消されることがあります。このため、停止したはずのサーバとフェイルオーバー後に新たに業務を開始したサーバの両方から同じディスクへ同時にアクセスする事態が発生し、重要なデータが破壊される可能性があります。

   PRIMECLUSTERでは、異常が発生したサ−バがどのような状態であってもハードウェア機構との連携により、正常なサーバが異常なサーバを確実に強制停止した後にフェイルオーバーします。これにより前述の複数のサーバからの同時アクセスを防止し、データを保護することができます。

図2：異常なサーバの確実な停止

ホットスタンバイによる高速なフェイルオーバー

PRIMECLUSTERでは、運用側サーバで異常発生後に待機側サーバ上でアプリケーションの起動を行う一般的なコールドスタンバイ方式に加えて、待機側サーバでアプリケーションをあらかじめ起動しておくホットスタンバイ方式があります。このホットスタンバイ方式により、アプリケーションの起動時間を短縮することができ、高速にフェイルオーバーすることが可能です。

待機側サーバの故障による業務停止を未然に防止

待機側サーバは業務が動作していないため、待機側サーバのネットワーク／ストレージのパスなどの故障に気がつきません。その状態で運用側サーバに異常が発生すると、フェイルオーバーに失敗して業務停止となってしまいます。

PRIMECLUSTERでは、待機パトロール機能により待機側サーバのネットワーク／ストレージのパスなどの監視を行っているため、このような業務停止を未然に防止することができます。

柔軟なスプリットブレイン設計

一般的にスプリットブレイン状態になった場合は、サーバ数の多数決によって生存させるサーバ（群）が決定されます。PRIMECLUSTERでは、各サーバおよび稼動している業務に重みを設定しておくことで、「特定のサーバを生存させる」または「特定の業務が稼動するサーバを生存させる」といった柔軟な設計をすることができます。なおPRIMECLUSTERでは、スプリットブレインの解決にクォーラムディスクを必要としません。

豊富な高信頼ソリューション

富士通製品はもちろんのこと、さまざまなISV（Independent Software Vender）、IHV（Independent Hardware Vender）製品と組み合せて豊富なソリューションを利用できます。またアプリケーションについても、起動・停止・異常監視のシェルスクリプトを作成することにより、PRIMECLUSTERによるフェイルオーバーが可能となります。

前のページ 1 2 3 次のページ

著者プロフィール
富士通株式会社服部裕慈
ソフトウェア事業本部自律システム基盤開発統括部プロジェクト部長
1981年富士通株式会社に入社。PRIMECLUSTERをはじめとする、UNIX、LINUXなどのオープンプラットフォームでのクラスタソフトウェアに関する企画、開発を担当。また、オートノミックコンピューティングを実現するソフトウェアの企画、開発にも従事。

INDEX
第5回：富士通の高信頼基盤ソフトウェア「PRIMECLUSTER」
	PRIMECLUSTERの概要
	異常サーバの確実な停止
	ストレージの高信頼化