TOP設計・移行・活用> lk_logの出力その1:コミュニケーションパスのダウンとアップ
LifeKeeperのすべて
LifeKeeperのすべて

第14回:LifeKeeperの管理 - ログの確認方法とSNMPの設定
著者:サイオステクノロジー クラスタソリューショングループ
監修者:サイオステクノロジー  小野寺 章   2006/2/24
前のページ  1  2   3  4  次のページ
lk_logの出力その1:コミュニケーションパスのダウンとアップ

   コミュニケーションパスはLifeKeeperがHAクラスタとして動作するために必要な通信を行うための接続である。よってコミュニケーションパスが切れるようなことがあってはならないが、もしコミュニケーションパスがダウン・アップした場合は以下のように出力される。
ダウンした場合
COMMUNICATION TO 接続相手のホスト名 BY 接続元IPアドレス/接続先IPアドレス FAILED AT:   発生日時


アップした場合
COMMUNICATION TO 接続相手のホスト名 BY 接続元IPアドレス/接続先IPアドレス RESTORE AT:   発生日時

   またコミュニケーションパスによってハートビート通信のやり取りができなくなった場合には「FAILED」と出力される。FAILED状態から復旧した場合には「RESTORE」と出力される。

   なお、コミュニケーションパスの切断の検知はNIC(ネットワークインターフェースカード)のリンク状態によるのではなく、ハートビート通信の応答があるかどうかによって判断される。よってサーバやネットワークが過負荷の状態で、ソフトウェアのレイヤで正常に通信できない状態になると、コミュニケーションパスの切断が検出される場合があるので留意する必要がある。

   コミュニケーションパスのすべてが切れてしまった場合、HAクラスタとしての機能を果たすことができなくなる。この状態をスプリットブレインと呼び、先のコミュニケーションパスのFAILEDメッセージに加えて以下のようなログを確認することができる。

COMMUNICATIONS 接続相手のホスト名 FAILED AT 発生日時

   上記のメッセージを起点に、LifeKeeperはスプリットブレインが起きた場合のシナリオにそった動作を開始する(詳しい動作は後述する「スプリットブレイン発生時のLifeKeeperの動作について」の項を参照)。

   コミュニケーションパスに関するログの確認が必要になるケースとしては、スプリットブレインが発生したタイミングや時刻を確認する場合である。スプリットブレイン発生後の切り替え動作について確認する場合には、その時刻を起点としてログの確認を行えばよい。


スプリットブレイン発生時のLifeKeeperの動作について

   スプリットブレインが発生した場合、LifeKeeperは可能な限りサービスを継続するためスタンバイ側ですべてのリソースを起動しようとする。

   この時、共有ストレージを使用してファイルシステムリソースを作成している場合、アクティブ側が持っているディスクリザーブをスタンバイノードが奪い取る。ディスクリザーブが奪われたことがLifeKeeperで確認されると、アクティブノード側がLifeKeeperによって強制的に再起動され、結果スタンバイノード側でサービスが継続されることになる。この動作によって両系からのディスクマウントを避け、データの保護が行われている。

   では、共有ファイルシステムを使用していない場合はどちらのノードでサービスが提供されることになるのか。まず判断の基準として考えられる点として、どちらのノードでIPリソースが起動しているかどうかである。LifeKeeperでサービスを保護する場合、仮IPリソース(仮想IP)を作成して依存関係を形成する。

   スプリットブレインが発生して、スタンバイ側でリソースを起動しようとしたとき、依存関係においてサービスよりも下位にIPリソースがあれば、すでにアクティブ側でIPリソースが起動しているためスタンバイ側では起動できないということになる。よって、サービスはアクティブ側で継続されることになる。

前のページ  1  2   3  4  次のページ


サイオステクノロジー株式会社 クラスタソリューショングループ
著者プロフィール
サイオステクノロジー株式会社 クラスタソリューショングループ
サイオステクノロジーにおいて、SteelEye LifeKeeperの技術サポートや構築支援を行うエンジニア集団。日本国内で、彼ら以上にLifeKeeperを知る者たちはいないと自負している。世の中のすべてのHAクラスタがLifeKeeperになることを夢見て日々奮闘を続けている。


サイオステクノロジー株式会社 小野寺 章
監修者プロフィール
サイオステクノロジー株式会社  小野寺 章
インフラストラクチャービジネスユニット
エンタープライズソリューション部 部長
国産汎用機メーカに入社し、汎用機のSEを10数年担当、1994年頃からオープン・ダウンサイジングブームの到来とともにUNIX系OSを担当し、Solaris、HP/UXでSun Cluster、Veritas Cluster、MC/ServiceGuardなどを使用した、多数のミッションクリティカルシステムのHAシステム構築に従事。2001年ノーザンライツコンピュータ(現サイオステクノロジー)へ入社後、SteelEye LifeKeeperの総責任者としての国内での販売・サポート業務に従事。


INDEX
第14回:LifeKeeperの管理 - ログの確認方法とSNMPの設定
  はじめに
lk_logの出力その1:コミュニケーションパスのダウンとアップ
  lk_logの出力その2:リソースの起動・停止・監視の実行およびその結果
  LifeKeeper for Linuxでイベントがあった場合にメールを送信するよう設定する