対象製品
LifeKeeper for Linux
Quorum/Witness を majority モードで利用している場合はサーバの再起動の順番を誤ると QUORUM_LOSS_ACTION が実施されてサーバの再起動が生じる可能性があります。
これを回避するためには以下の順番でサーバの再起動を行ってください。
(1) 待機系の LifeKeeper を停止。
(2) 稼働系の LifeKeeper を停止。
(3) witness サーバの LifeKeeper を停止。
(4) witness サーバの LifeKeeper を起動。
(5) 待機系の LifeKeeper を起動。
(6) 稼働系の LifeKeeper を起動。
尚、2台のサーバで majority モードを利用することは非推奨の構成となります。
Witness サーバを追加するか、別のモードをご検討ください。
majority モードにつきましては以下もご参考ください。
SIOS Protection Suite for Linux テクニカルドキュメンテーション
└ LifeKeeper
└ インストールと設定
└ LifeKeeper I-O フェンシングの概要
└ Quorum/Witness
└ majorityモード
[注意事項(LifeKeeper v9.6.0 以前)]
※LifeKeeper v9.6.1 以降では修正しているため、該当致しません。
稼働系ノードにおける LifeKeeper の停止は、待機系ノードでの LifeKeeper の停止完了後に実施してください。
待機系ノードでの LifeKeeper 停止処理中(完了前)に、稼働系ノードにて LifeKeeper の停止を実施した場合、稼働系ノードでは、待機系ノード及び witness サーバとの通信が切断されたと誤検知する恐れがあります。
通信切断の検知(誤検知)により、稼働系ノードでは Quorum 喪失が発生し、QUORUM_LOSS_ACTION パラメーターに設定されている処理が動作致します。
待機系ノードにおける LifeKeeper の停止完了は、次の 2 種類の情報が両方記録された時点となります。
(いずれか一方の情報が記録された時点では、停止は完了しておりません。)
1)待機系ノードの /var/log/lifekeeper.log に次の情報が記録されている。
[日時] [ホスト名] lk-start-stop[PID]: NOTIFY:shutdown:::010055:LifeKeeper stopped
2)稼働系ノードの /var/log/lifekeeper.log に次の情報(2点)が記録されている。
(次の情報は、連続して記録されている必要はありません。次の情報の間に、その他情報が記録される場合がありますが、問題等はありません。)
[日時] [ホスト名] lifekeeper[PID]: NOTIFY:event.comm_down:::010466:COMMUNICATIONS [対向先ノードのホスト名] FAILED
[日時] [ホスト名] lifekeeper[PID]: NOTIFY:event.comm_down:::010469:We do have quorum on comm_down to [対向先ノードのホスト名], continuing