TOPサーバ構築・運用> インスタンスダウン時の自動再起動
最大限の可用性とスケーラビリティを実現するOracle RAC
最大限の可用性とスケーラビリティを実現するOracle RAC

第6回:サーバダウン時のOracle RACの可用性
著者:日立システムアンドサービス  竹村 浩二   2006/10/6
前のページ  1  2   3  次のページ
インスタンスダウン時の自動再起動

   インスタンスがプロセス障害などでダウンした際には、インスタンスを単に再起動すれば復旧することがよくあります。しかし、これまでにこの機能を実現するには手動で作り込みを行う必要がありました。しかしOracle RACでは、この機能を動作させる場合に特に設定する必要はありません。

   実際にログライターのプロセスを強制終了させて、この機能を確認してみましょう。次の実行例では、ログライタープロセス(ora_lgwr_インスタンス名)のプロセス番号を検索し、killコマンドで強制終了を行い、プロセスが消失していることを確認しています。

ログライタープロセスを強制終了
[root@pe26501 root]# ps -ef | grep ora_lgwr | grep -v grep
oracle   11000     1  0 09:52 ?        00:00:04 ora_lgwr_ThinkIT1
[root@pe26501 root]# date ; kill -9 11000
2006年  5月 25日 木曜日 20:13:28 JST
[root@pe26501 root]# ps -ef | grep ora_lgwr | grep -v grep
[root@pe26501 root]#

   インスタンスがダウンしたことを確認するにはアラートログファイルを確認します。次の実行例では、中略1までの部分で、ログライタープロセスを強制終了させた1秒後にインスタンスの停止が開始され、6秒後に停止していることを確認できます。

アラートログファイルの内容
Thu May 25 20:13:29 2006
Errors in file /oracle/app/oracle/admin/ThinkIT/bdump/thinkit1_pmon_10952.trc:
ORA-00470: LGWRプロセスはエラーで終了しました。
Thu May 25 20:13:29 2006
PMON: terminating instance due to error 470
Thu May 25 20:13:29 2006
System state dump is made for local instance
System State dumped to trace file /oracle/app/oracle/admin/ThinkIT/bdump/thinkit1_diag_10954.trc
Thu May 25 20:13:31 2006
Trace dumping is performing id=[cdmp_20060525201329]
Thu May 25 20:13:34 2006
Instance terminated by PMON, pid = 10952

中略1

Thu May 25 20:14:31 2006
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0

中略2

Thu May 25 20:14:36 2006
ALTER DATABASE   MOUNT
Thu May 25 20:14:45 2006
Database mounted in Shared Mode (CLUSTER_DATABASE=TRUE)
Completed: ALTER DATABASE   MOUNT
Thu May 25 20:14:46 2006
ALTER DATABASE OPEN
Thu May 25 20:14:53 2006
Completed: ALTER DATABASE OPEN

   インスタンスが監視されている様子を確認するにはCluster Ready Servicesデーモン(crsd)ログファイル($ORA_CRS_HOME/log/ホスト名/crsd/crsd.log)を確認します。次の実行例では、ログライタープロセスを強制終了させた1秒後に、「ora.ThinkIT.ThinkIT1.inst on pe26501 went OFFLINE unexpectedly」でインスタンスの異常発生を検知したことが確認できます。

   更に1分後には「Restarting ora.ThinkIT.ThinkIT1.inst on pe26501」でインスタンスの自動起動が実行されています。

   アラートログファイルでは、Oracle Clusterwareによる起動実行の1秒後、中略1の箇所の直後にインスタンスの起動が開始されていることがわかります。またログライタープロセスを強制終了させた1分25秒後の中略2の直後には、インスタンスの起動が完了していることが確認できます。

Oracle Clusterwareログファイル
Oracle Clusterwareログファイル
(画像をクリックすると別ウィンドウに拡大図を表示します)

前のページ  1  2   3  次のページ


日立システムアンドサービス 竹村 浩二氏
著者プロフィール
株式会社日立システムアンドサービス
オープンソリューション本部
プロフェッショナルサービス部   竹村 浩二

日立システムに転職し、8年目。Oracle Databaseの設計/構築/移行/技術支援などに携わっている。Oracle RACを使った高い信頼性と高可用性を備えたデータベース構築も手がける。2004年には、新資格でのORACLE MASTER Platinum Oracle9i Databaseを国内第一号にて取得したほか、本年、同Oracle Database 10g を同じく国内第一号にて取得している。


INDEX
第6回:サーバダウン時のOracle RACの可用性
  はじめに
インスタンスダウン時の自動再起動
  稼動しているサーバを意識せずに接続可能