SAP Recovery Kit が提供する監視機能と起動処理、停止処理についてご説明します。
対象製品
SAP Recovery Kit (LifeKeeper for Linux)
本処理概要は LifeKeeper for Linux v9.0.0 に付属するリカバリキットをもとに作成しており、SAP Rocovery Kit が提供する動作の概要について記載しております。
監視処理
LKCHECKINTERVAL(デフォルト120秒)の間隔で以下の確認を行います。
1)保護(リカバリ)レベルを確認します。
<リカバリレベル>
Full | ローカルリカバリとフェイルオーバを実施。 |
LocalOnly | ローカルリカバリのみ実施。 |
RemoteOnly | フェイルオーバのみ実施。 |
Off | ローカルリカバリ、フェイルオーバのどちらも実施しない。 |
2)SAPリソースの状態(ISP か ISU か、それ以外か)を確認します。
3)インスタンスの起動状態
1.共有されたNFSへのアクセスが可能かを確認します。
# /opt/LifeKeeper/lkadm/bin/pingnfs -s サーバアドレス -t 5
※-t はタイムアウトで、5秒固定です。
2.SAP の必要なサービスに起動をかけます。
起動しているプロセスを確認して、起動していなければ起動します。
3.VIP(仮想ホスト名)を取得します。
4.プロセスリストを取得します。
以下のコマンドを利用してプロセスリストを取得します。
# sapcontrol -host <VIP> -nr <インスタンスの番号> -function GetProcessList
取得したプロセスリストを利用して SAP が動作しているかを確認します。
5.プロセスが停止しているか動作しているかを確認します。
6.プロセスリストから情報を取得し、SAP インスタンスが稼働しているかを確認します。
7.UI (色)の状態の確認を行います。
緑 :動作している
赤、黄:動作していない or 動作している
グレー:動作していない
8.確認した結果から動作状態をリターンコードとして返します。
インスタンスが停止している場合:0
インスタンスが動作している場合:1
4)3)の確認でインスタンスが起動していたら、quickCheck は正常終了します。
インスタンスが起動していない場合はリソース異常となります。
起動処理
SAPリソース起動は以下のコマンドで SAP を起動させます。
# sapcontrol -format script -prot NI_HTTP -host $viphost -nr $InstanceNum -function Start
$viphost:仮想ホスト名
$InstanceNum:インスタンスの番号
起動コマンド発行後、SAPインスタンスの状態を確認し、問題があるようであればエラーを表示させます。
SAPリソース起動のタイムアウトは SAP_START_WAIT で調整します。
デフォルト値は 1108秒です。
停止処理
SAPリソース停止は以下のコマンドで SAP を停止させます。
# sapcontrol -format script -prot NI_HTTP -host $viphost -nr $InstanceNum -function Stop
$viphost:仮想ホスト名
$InstanceNum:インスタンスの番号
停止コマンド発行後、SAPインスタンスの状態を確認し、問題があるようであればエラーを表示させます。
SAPリソース停止のタイムアウトは SAP_REMOVE_TIMEOUT で調整します。
デフォルト値は 600秒です。
回復処理
SAPリソースのリカバリのタイムアウトは SAP_RECOVER_TIMEOUT で調整します。
デフォルト値は:1708秒です。
1)リカバリのレベルを決定し、このリソースが sendevent および recover を使用してリカバリできるかどうかを判断します。
<リカバリレベル>
Full | ローカルリカバリとフェイルオーバを実施。 |
LocalOnly | ローカルリカバリのみ実施。 |
RemoteOnly | フェイルオーバのみ実施。 |
Off | ローカルリカバリ、フェイルオーバのどちらも実施しない。 |
2)SAPリソースの状態(ISP か ISU か、それ以外か)を確認します。
3)1)のリカバリレベルがローカルリカバリを実施するレベルの場合に、ローカルリカバリを
実施可能か確認します。
4)”停止処理”と同様に SAP の停止を行います。
5)”起動処理”と同様に SAP の開始を行います。
6)リカバリ処理がエラーとなった場合はリカバリレベル応じてフェイルオーバします。
関連パラメータ
===============================================
SAP Recovery Kit のパラメータ名とその意味を説明しています。
※デフォルトではすべての設定項目が未記載となります。
※設定を変更したい項目を /etc/default/LifeKeeper へ設定してください。
SAP_CONFIG_REFRESH
Configuration Propertiesページの更新頻度を秒単位で指定します。
デフォルト値:60
※ 5より低い設定値はデフォルト値となります。
SAP_CREATE_NAS
NAS マウントされたファイルシステムの NAS リソースを自動的に生成するかどうかを指定します。
自動生成しない:0
自動生成する :1
デフォルト値:1
SAP_QUICKCHECK_TIMEOUT
quickCheck のタイムアウト時間を秒単位で指定します。
デフォルト値:60
SAP_RESTORE_TIMEOUT
restore のタイムアウト時間を秒単位で指定します。
デフォルト値:SAP_START_WAIT(1048) + SAP_QUICKCHECK_TIMEOUT(60)
SAP_REMOVE_TIMEOUT
remove のタイムアウト時間を秒単位で指定します。
デフォルト値:SAP_STOP_WAIT(540) + SAP_QUICKCHECK_TIMEOUT(60)
SAP_RECOVER_TIMEOUT
recover のタイムアウト時間を秒単位で指定します。
デフォルト値:SAP_REMOVE_TIMEOUT(600) + SAP_RESTORE_TIMEOUT(1108)
※デフォルト値より小さい数値はデフォルト値として利用されます。
==============================================
改訂履歴
[公開日:2017年9月27日]