DMMP ARK が提供する監視機能と起動処理、停止処理、リカバリ処理についてご説明します。
対象製品
DMMP Recovery Kit (LifeKeeper for Linux)
※本処理概要は LifeKeeper for Linux v9.0.0 に付属するリカバリキットをもとに作成しています。
監視処理
[dmmp]
LKCHECKINTERVAL(デフォルト120秒)の間隔で、DMMP ARK の quickCheck が実行され、DMMP ARK の監視デーモンが起動します。
1)監視デーモンが 10秒間隔で保護対象のディスクのデバイス情報を取得します。
2)デバイス情報を元に sg_persist を利用しリザーブの取得を確認しています。
リザーブ確認:sg_persist -k
リザーブ取得:sg_persist -r
3) 1),2)にて処理がエラー終了した場合、次回チェックにて lkdisktest コマンドを利用してディスク I/O を確認します。
lkdisktest でもディスク I/O が確認出来ない場合は SCSIERROR の設定にそった障害処理を行います。
上記いずれかにてエラーが 10 秒 × リトライ数分返ってきた場合は、実行中の quickCheck をエラーとし、即座にリソース異常と判定致します。
エラーではなく、1)~3)にてディスクから応答が取れない場合は最大で以下の秒数を待ち、異常と判定します。
LKCHECKINTERVAL × 2
[dmmpp]
監視処理はありません。
起動処理
[dmmp]
起動時に quickCheck が動作していたら quickCheck を停止します。
1) 対象ストレージデバイスの reservation key を確認します。
取得出来ない、もしくは正しくない場合は起動処理が中断されます。
2) reservation key からデバイスのパスIDを取得し、デバイスへリザーブの取得を試みます。
reserveが取得できない場合は処理がエラー終了します。
リザーブ取得コマンド
# sg_persist -out -reserve -param-rk=<※>
※ HostID とデバイスのパスをもとにした文字列が入ります。
3) デバイスの状態をチェックし、問題が無ければ起動終了となります。
デバイスの状態に異常がみられる場合は起動処理が SCSIERROR で終了します。
[dmmpp]
リソース情報を確認して問題がなければ正常終了します。
停止処理
[dmmp]
1) quickCheck が動作していたら停止させます。
2) 停止対象のデバイス名を取得します。
3) 取得したデバイスを停止させます。
リザーブ解放コマンド
# sg_persist -out -clear -param-rk=<※>
※ HostID とデバイスのパスをもとにした文字列が入ります。
[dmmpp]
リソース情報を確認して問題がなければ正常終了します。
リカバリ処理
[dmmp]
リカバリ処理はありません。(リカバリはスキップされます)
[dmmpp]
リカバリ処理はありません。(リカバリはスキップされます)
改訂履歴
[公開日:2016年07月20日] [改訂日:2017年05月18日]