[現象]
Windows の Application イベントログに以下のようなエラーが出力される。
Process: qwk_storage_server.exe (72320) *ERROR* (No. 18102) [node:s3://path] Periodic storage quorum check has not been done for XX ms, which exceeds 2*QWK_STORAGE_HBEATTIME (12000) ms.
[原因]
QWK_STORAGE_OBJECT に指定された S3 へのアクセスで 12秒以上要した場合に出力されます。
(QWK_STORAGE_HBEATTIME がデフォルト設定の場合)
[対処方法]
一時的な出力であればとくに対処は不要となりますが、継続して出力されている場合は以下どちらかの
対策をご検討ください。
・S3 へのアクセスを改善する。
こちらは AWS 内の通信環境周りの改善が必要となります。AWS 側にて改善ください。
LifeKeeper 製品から AWS の推奨構成や設定についての支援は行えないため、留意ください。
・QWK_STORAGE_HBEATTIME の値を調整する。
QWK_STORAGE_HBEATTIME は最大 10 まで行える設定となります。
設定いただくことでメッセージの出力を抑えることは可能となりますが、設定以上の時間が
かかる場合は同様にメッセージが出力されてしまい、その場合は、一つ目の S3 へのアクセス速度の
改善が必要となります。
QWK_STORAGE_HBEATTIME のパラメータにつきましてはマニュアルを参照ください。
LifeKeeper for Windows テクニカルドキュメンテーション > 構成 > LifeKeeper Quorum > Quorumパラメータ一覧
https://docs.us.sios.com/sps/8.10.0/ja/topic/quorum-parameters-list
[参考]
<S3 へのアクセス確認>
※LifeKeeper から実際に行っている処理とは異なります。
下記のコマンドの実行時間を計測し、その時間が QWK_STORAGE_HBEATTIME ×2 の時間以内になれば
Storage Quorum の動作でも問題が無いかを判断するのに有効となります。
S3オブジェクト名には、自ノードのS3オブジェクトまたは対向ノードのS3オブジェクトを指定してください。
aws s3 cp <S3オブジェクト名> -
(例)
aws s3 cp s3://sios01-s3-un/EC2_UN -
EC2 のインスタンスでバーストパフォーマンスインスタンスを選択された際に CPU クレジットを使い尽くし、結果、CPU の性能が抑えられ S3 へのアクセスに十分なパフォーマンスを発揮できなくなるという事例がありました。
もし、この状況となる可能性がある場合は、より性能の高いインスタンスサイズに変更するか、クレジット設定モードを Unlimited モードに変更することをご検討ください。
また、バーストパフォーマンスインスタンスを利用ではない場合も、S3 へのアクセスには十分なパフォーマンスを維持できるインスタンスが必要となりますので、利用状況を確認して、適切なパフォーマン
スが得られるよう検討ください。
改訂履歴
[公開日:2024年4月16日]