Watch Dog Timerについて
Watch Dog Timer は、LifeKeeper自体がハングアップなどの異常状態に陥った場合に、システムの強制的な再起動を行う機能です。
この機能により、システムの信頼性をより高めることができます。
なお、本機能は特定の障害を回避するものではありません。
Watch Dog Timer動作概要
Watch Dog Timerは、一定時間毎にLifeKeeper Coreの稼働状況を監視し、動作の正常性を確認しています。
正常に稼働していないと判断された場合は、システムの強制再起動を行います。
具体的には、LifeKeeperのlcdデーモンと、各リソースのquickCheckスクリプトの実行状態を監視しています。
サポート環境
Watch Dog timerは、LifeKeeper for Linux v7.3以降でサポートいたします。
・Watch Dog Timerの利用をサポートするOSは以下の通りです。
Red Hat Enterprise Linux 5
Red Hat Enterprise Linux 6
WatchDog timerの設定方法
1.OSに付属のWatchDog timerのパッケージをインストールしてください。
# rpm -ivh watchdog-<バーション>
2.WatchDog timerの設定ファイル(/etc/watchdog.conf)を、下記の様に編集します。
test-binary = /opt/LifeKeeper/samples/watchdog/LifeKeeper-watchdog test-timeout = 5 interval = 7
※/opt/LifeKeeper/samples/watchdog/LifeKeeper-watchdog は変更しないでください。
※test-timeoutはinterval値より短い秒数を設定してください。
※intervalはLifeKeeperのハートビートのタイムアウト値よりも短く設定してください。
なお、ハートビートのタイムアウト値は標準の設定では15秒です。
特に理由がなければ、7秒でご利用いただくことをお勧めします。
3.WatchDog timerの起動
# /etc/init.d/watchdog start
4.WatchDog timerの自動起動の設定
# chkconfig watchdog on
※Watch Dog timerの起動、停止は、LifeKeeperからは行いません。chkconfigを使用して、OS起動時に自動的に起動が行われるよう設定してください。