お客様で LifeKeeper が出力するログメッセージの監視をしたいとのお問い合わせをいただくことがあります。
LifeKeeper では、ログメッセージの重大度に応じて以下のログレベルを設定しておりますので、お客様の監視ポリシーに合わせて監視設定を行ってください。
- EMERG / FATAL
LifeKeeper 自体の動作に影響を及ぼす、または、及ぼす可能性のある内容 - NOTIFY
LifeKeeper 自体やリソース等の状態が遷移したこと示す通知 - ERROR
LifeKeeper のサービスやリソースに影響を与える障害、失敗等 - WARN
LifeKeeper のサービスやリソースに対し、直ちに異常を示すものではない 注意や警告 - INFO
LifeKeeper に関する情報のメッセージ
ログレベルの具体例)
以下では、EMERG と ERROR について具体例を取り上げます。
※AAAAA(host)、BBBBB(Process ID)、CCCCC(resource)およびDDDDD(node)は環境によって異なります
リソースの停止に失敗して、OS再起動を行う場合の例
Nov 11 00:00:00 AAAAA recover[BBBBB]: EMERG:lcd.recover::CCCCC:004788:failed to remove resource 'CCCCC'. SYSTEM HALTED.
ノードとの通信ができない場合の例
Nov 11 00:00:00 AAAAA flg_create[BBBBB]: ERROR:lcd.mes:::004217:Communication failure: destination system "DDDDD" is out of service.