弊社のLifeKeeperテスト環境において、DataKeeper for Linux(以下DK)を利用している際に、DKのソース側のサーバーでカーネルパニックが発生する現象が確認されました。後述する「影響を受ける環境」に該当するお客様には、この事象に関する詳細と対策をご案内いたしますので、下記をご参照ください。
影響を受ける環境
環境情報
カーネルパニックが発生する可能性のあるOSは以下の通りです。
- Red Hat Enterprise Linux(以下RHEL) 9.1, 9.2, 9.3, 9.4 およびその互換OS
- SUSE Linux Enterprise Server(以下SLES) 15 SP5
発生頻度
この現象は弊社の開発環境での強度の負荷試験を実施している最中に確認されたものであり、お客様の実運用環境における発生はこれまでに報告がありません。
事象発生の原因と対策
概要
DKでレプリケーションしているデバイスに対して高頻度のIOが発生している最中にターゲット側の強制終了やネットワークの切断が発生すると、ソース側でカーネルパニックが発生するという現象です。
原因
DKが利用しているNBDドライバーというLinuxカーネルドライバーの不具合が原因です。修正内容はgit.kernel.orgの以下のURLにて公開されています。
本事象の対策
サイオステクノロジーはお客様の環境での問題発生を防ぐべく、git.kernel.orgに掲載された修正を取り込んだNBDドライバーを作成し、修正パッチ(HADRパッケージ)としてご提供いたします。
HADRパッケージのお申し込み
ご利用中のOSバージョンとカーネルのバージョン情報(”$ uname -r” コマンドの実行結果を貼り付けてください)を添えて、弊社サポート窓口までお問い合わせください。なお、HADRパッケージの適用においてはクラスター構成する全てのノードで同じバージョンのカーネルがインストールされている必要がありますのでご注意ください。
現在、RHEL 9.1〜9.4およびSLES 15 SP5のデフォルトカーネル向けのHADRパッケージが用意できております。具体的なバージョンは以下の通りです。
OS | kernel version |
---|---|
RHEL 9.1およびその互換OS | 5.14.0-162.6.1.el9_1 |
RHEL 9.2およびその互換OS | 5.14.0-284.11.1.el9_2 |
RHEL 9.3およびその互換OS | 5.14.0-362.8.1.el9_3 |
RHEL 9.4およびその互換OS | 5.14.0-427.13.1.el9_4 |
SLES 15 SP5 | 5.14.21-150500.53.2 |
原則として、上記のリストにあるカーネルをご利用ください。OSのアップデートにより新しいカーネルに更新されている場合は、カーネルの互換性の問題でHADRパッケージのインストールができない場合がございますので、カーネルのダウングレードをご検討ください。
なおHADRパッケージを導入いただいた後は、カーネルのアップデートを行わないようお願いいたします。
また、どうしても上記のリストに無いカーネルを利用する必要のあるお客様は、弊社までご相談ください。
HADRパッケージ導入時の注意事項
HADRパッケージの導入手順については、同梱しておりますマニュアルをご参照ください。既にLifeKeeperが稼働中である環境にHADRパッケージをインストールするにはLifeKeeperを停止する必要がありますが、こちらは片方のノードずつアップデートするローリングアップデートを行うことで、サービスの停止時間を最小にすることが可能です。
導入後の注意事項
OSベンダーより修正済みnbdモジュールがパッチとして提供された場合は、速やかにそちらのパッチに移行いただくことを推奨いたします。これは弊社作成のNBDドライバー(HADRパッケージ)を組み込んだ状態では、OSベンダーが提供するサポートに影響する可能性が考えられるためです。なおLifeKeeperにおいては、NBDドライバーの作成者が弊社でもRed Hat社でも、同様にサポートをご提供いたします。