現象
DataKeeperリソースを使用しているLifeKeeper for Windows環境において、「シャットダウン時の動作」を「リソースを切り替える」に設定した場合に、シャットダウンに伴うスイッチオーバに失敗する可能性があります。
原因
DataKeeperリソースの切り替えが完了する前に、Windows OSによりアクティブ側ノードのネットワークサービスが停止される場合があります。この場合、スタンバイ側のLKDRのミラーリングステータスの変更に失敗するため、スタンバイノード上でのリソース起動に失敗します。
対象バージョン
DataKeeperリソースを使用するLifeKeeper for Windows の全バージョン
対処
DataKeeperリソースを保持するLifeKeeper for Windows環境では、「シャットダウン時の動作」を「リソースを切り替える」に設定した場合に上記の問題が生じる可能性があるため、「リソースを切り替える」に設定している場合は「リソースを切り替えない」に設定を変更していただきます様お願いいたします。
また「リソースを切り替える」に設定したまま運用する場合には、本現象が発生する場合があることを予めご了承ください。また同問題の発生そのものを回避することは出来ません。以下に同問題が生じた場合の一般的な復旧手順を示します。
現象の確認
上記の問題によりスイッチオーバが失敗したのかを確認する必要があります。
以下の点についてチェックを行い、事象が本問題に一致するかを確認してください。
【確認ポイント】
1.オペレーションよりアクティブノードのOSをシャットダウンを行った。
2.OSのシャットダウンに伴って全てのリソースがスタンバイ側へ切り替わる
が、スタンバイ側ノードでボリュームリソースの起動に失敗した。
3.2でボリュームリソースの起動に失敗したノードのアプリケーションイベン
トログを見ると以下のようなログが記録されている。
Process: Restore.ksh(プロセスID) *ERROR* (No. 12508) Error creating mirror on ”ホスト名” to target “IPアドレス”.
The CREATEMIRROR command returned a value of 53. .
4.スタンバイ側でLKDR管理画面起動し、同期ステータスを確認すると「同期
保留中」というステータスになっている。
※上記に当てはまらないスイッチオーバの失敗は、別の要因によるものです。
リソースの復旧
以下の手順に沿ってリソース状態を復旧してください。
1.スタンバイ側のLifeKeeper GUIを起動します。アクティブノードが停止しているため、表示までに時間を要する場合がありますが、起動後はスタンバイノードのみが表示されます。またLKDRボリュームリソースの起動に失敗しているため、ボリュームリソースのステータスが「障害」と表示されています。
2.リソースツリーの最上位のリソースのアイコンを右クリックし、メニューから「サービス開始」を実行します。実行すると「サービス開始」の確認画面が開きます
3.「サービス開始」画面の「サービス開始」ボタンを押下します。「サービス開始」ボタンを押すと、サービス開始処理が画面に表示されます。アクティブノードが停止しているため、いくつかのエラーメッセージが表示されますが、全てのサービスが起動できれば問題ありません。
4.GUI画面から全てのリソースが「アクティブ」となっていることを確認してください。
掲載日: 2007年12月17日