現象
スタンバイサーバの再起動、もしくはスタンバイサーバの LifeKeeper の再起
動などを行った際に、アクティブサーバでデータレプリケーション領域に対す
るディスクI/O が行えなくなり、最終的にサービス停止に至る場合があります。
現象が発生するとアクティブサーバの LifeKeeper のログに、以下のメッセー
ジが出力され続けます。
「kernel: md:cannot remove active disk nbdXX from mdXX …」
原因
Linux カーネルの nbd モジュールの不具合により、nbd クライアントと nbd
サーバ間の通信の復旧時に nbd クライアントの切り離し処理に失敗するため
です。
nbd モジュールの不具合の詳細
nbd に対する処理が頻繁に行われている時に、nbd クライアントと nbd サー
バ間の通信が切断されると、nbd の書き込みキューがクリアできないという問
題が発生することがあります。
影響を受けるバージョン
・2.6.25 以降のカーネルで DataKeeper for Linux を使用している環境。
具体的に該当する環境は以下の通りです。
(1) Red Hat Enterprise Linux 6 系 (以降、RHEL6)
LifeKeeper for Linux v7.3 以降を使用する環境
(2) The Community ENTerprise Operating System v6 系 (以降、CentOS6)
LifeKeeper for Linux v7.5 以降を使用する環境
(3) SUSE Linux Enterprise Server 11 系(以降、SLES11)
LifeKeeper for Linux v7.0 以降を使用する環境
現象発生後の対処方法
アクティブサーバを再起動することで問題が解消します。
対処方法
RHEL6とCentOS6環境の場合は、以下の組み合わせに対しご提供する DataKeeper for Linux
向けのパッチを適用していただくことにより、本不具合を回避することができます。
・LifeKeeper for Linux v7.5 と RHEL6/CentOS6 の組み合わせ
・LifeKeeper for Linux v8.0 と RHEL6/CentOS6 の組み合わせ
対象バージョンより下位の LifeKeeper のバージョンを使用している場合は、
LifeKeeperのアップデートを行った後にパッチを適用していただく必要があります。
円滑な製品サポートをご提供するため、パッチのご提供先は弊社にて管理させ
ていただいております。お手数をお掛けして恐縮ではありますが、パッチをご
希望の際は、以下の情報とともにサポートまで申請をお願いいたします。
・パッチ導入に際しての作業ご担当者様の以下の情報
- PSC No.
- 氏名
- 会社名
- メールアドレス
- ご連絡先電話番号
・導入先エンドユーザ名
修正予定
(1) RHEL6/CentOS6
LifeKeeper for Linux v8.1.1で修正されています。
(2) SLES11
SLES11 は標準のカーネルに nbd モジュールが組み込まれているため、ディス
トリビューション提供のカーネルに修正が行われた nbd モジュールが取り込
まれるのをお待ちいただく必要がございます。nbd モジュールの不具合はアッ
プストリームカーネル (Linux 標準カーネル) でも修正が進んでおり、
3.6 / 3.5.5 / 3.4.12 でパッチが取り込まれています。
<改定履歴>
[2012年11月12日 改定] CentOS6 に関する記述を追加しました。
[2013年1月18日 改定] RHEL6/CentOS6 の修正予定を変更しました。