対象製品
本処理概要は下記の対象製品に対する個別のリソースと共通のリソース(JP1/Base)の処理ついて説明します。
Generic ARK for JP1/AJS3 Manager (2010/1/29 リリース)
Generic ARK for JP1/AJS3 Agent (2010/8/9 リリース)
※本処理概要はそれぞれ上記リリース日から現在に至りリリースされているバージョンをもとに作成しています。
監視処理
[JP1/Base]
監視処理にはタイムアウト(デフォルト:12秒)が設けられており、この時間を超過するか監視処理の成功もしくは終了が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合は監視処理がエラーとなり、回復処理へ移行します。
1) 稼働状態の確認処理
以下のコマンドラインを実行し、稼働状態を確認します。
1-1) 動作確認コマンド1 : # /opt/jp1base/bin/jbs_spmd_status -h <仮想ホスト名>
上記コマンドラインが戻り値0を返す場合、後述の動作確認コマンド2の実施へ移行します。
上記コマンドラインが戻り値0以外を返す場合、当該戻り値をもって後述の戻り値の確認処理へ移行します。
1-2) 動作確認コマンド2 : # /opt/jp1base/bin/jevstat <仮想ホスト名>
上記コマンドラインが戻り値12を返す場合、戻り値を1として後述の戻り値の確認処理へ移行します。
上記コマンドラインが戻り値12以外を返す場合、当該戻り値をもって後述の戻り値の確認処理へ移行します。
2) 戻り値の確認処理
上述した2つのコマンドラインの戻り値を確認します。
戻り値が0の場合、監視処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に再度上述の稼働状態の確認処理を実施します。
※jevstatコマンドの戻り値が12の場合は本条件には該当しません。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、監視処理は失敗終了となり回復処理を実施します。
[JP1/AJS3 ManagerおよびAgent]
監視処理にはタイムアウト(デフォルト:12秒)が設けられており、この時間を超過するか監視処理の成功もしくは終了が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合は監視処理がエラーとなり、回復処理へ移行します。
1) 稼働状態の確認処理
以下のコマンドラインを実行し、稼働状態を確認します。
動作確認コマンド : # /opt/jp1ajs2/bin/jajs_spmd_tatus -h <仮想ホスト名>
上記コマンドラインの当該戻り値をもって後述の戻り値の確認処理へ移行します。
2) 戻り値の確認処理
上述したコマンドラインの戻り値を確認します。
戻り値が0の場合、監視処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に再度上述の稼働状態の確認処理を実施します。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、監視処理は失敗終了となり回復処理を実施します。
起動処理
[JP1/Base]
起動処理においてはタイムアウト(デフォルト:480秒)が設けられており、この時間を超過してもリソースの起動処理が完了しない場合、起動処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2)戻り値の確認処理
戻り値が0の場合、JP1/Baseは起動状態にあると判断し、起動処理は成功終了します。
戻り値が0以外の場合、JP1/Baseは起動状態にないと判断し、続けて次項の処理へ移行します。
2) 停止操作および強制停止操作
二重起動対策を目的として停止処理の「停止操作」および「強制停止操作」と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の起動操作へ移行します。
3) 起動操作
以下のコマンドラインを実行します。
# /etc/opt/jp1base/jbs_start.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ以降します。
4) 稼働状態の確認その2
本確認は起動処理に対して設けられているタイムアウトを超過するか、起動処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、起動処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が0の場合、起動処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
※jevstatコマンドの戻り値が12の場合は本条件には該当しません。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、上記の「停止操作および強制停止操作」と同内容を実施して、
起動処理は失敗終了となります。
[JP1/AJS3 ManagerおよびAgent]
起動処理においてはタイムアウト(デフォルト:480秒)が設けられており、この時間を超過してもリソースの起動処理が完了しない場合、起動処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2) 戻り値の確認処理
戻り値が0の場合、JP1/AJS3 ManagerまたはAgentは起動状態にあると判断し、起動処理は成功終了します。
戻り値が0以外の場合、JP1/AJS3 ManagerまたはAgentは起動状態にないと判断し、続けて次項の処理へ移行します。
2) 停止操作および強制停止操作
二重起動対策を目的として停止処理の「停止操作」および「強制停止操作」と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の起動操作へ移行します。
3) 起動操作
以下のコマンドラインを実行します。
# /etc/opt/jp1ajs2/jajs_start.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ以降します。
4) 稼働状態の確認その2
本確認は起動処理に対して設けられているタイムアウトを超過するか、起動処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、起動処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が0の場合、起動処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、上記の「停止操作および強制停止操作」と同内容を実施して、
起動処理は失敗終了となります。
停止処理
[JP1/Base]
停止処理においてはタイムアウト(デフォルト:120秒)が設けられており、この時間を超過してもリソースの停止処理が完了しない場合、停止処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2) 戻り値の確認処理
戻り値が8の場合、JP1/Baseは停止状態にあると判断し、停止処理は成功終了します。
戻り値が8以外の場合、JP1/Baseは停止状態にないと判断し、次項の停止操作に移行します。
2) 停止操作
以下のコマンドラインを実行します。
# /etc/opt/jp1base/jbs_stop.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の強制停止操作へ移行します。
3) 強制停止操作
以下のコマンドラインを実行します。
# /etc/opt/jp1base/jbs_killall.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ移行します。
4) 稼働状態の確認その2
本確認は停止処理に対して設けられいているタイムアウトを超過するか、停止処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、停止処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が8の場合、停止処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
※jevstatコマンドの戻り値が12の場合は本条件には該当しません。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、停止処理は失敗終了となります。
[JP1/AJS3 ManagerおよびAgent]
停止処理においてはタイムアウト(デフォルト:120秒)が設けられており、この時間を超過してもリソースの停止処理が完了しない場合、停止処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2) 戻り値の確認処理
戻り値が8の場合、JP1/AJS3 ManagerまたはAgentは停止状態にあると判断し、停止処理は成功終了します。
戻り値が8以外の場合、JP1/AJS3 ManagerまたはAgentは停止状態にないと判断し、次項の停止操作に移行します。
2) 停止操作
以下のコマンドラインを実行します。
# /etc/opt/jp1ajs2/jajs_stop.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の強制停止操作へ移行します。
3) 強制停止操作
以下のコマンドラインを実行します。
# /etc/opt/jp1ajs2/jajs_killall.cluster <仮想ホスト名>
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ移行します。
4) 稼働状態の確認その2
本確認は停止処理に対して設けられいているタイムアウトを超過するか、停止処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、停止処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が8の場合、停止処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、停止処理は失敗終了となります。
回復処理
[JP1/Base]
回復処理においてはタイムアウト(デフォルト:480秒)が設けられており、この時間を超過しても回復処理が完了しない場合、回復処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2) 戻り値の確認処理
戻り値が0の場合、JP1/Baseは起動状態にあると判断し、起動処理は成功終了します。
戻り値が0以外の場合、JP1/Baseは起動状態にないと判断し、続けて次項の処理へ移行します。
2) 停止操作および強制停止操作
二重起動対策を目的として停止処理の「停止操作」および「強制停止操作」と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の起動操作へ移行します。
3) 起動操作
起動処理の「起動操作と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ以降します。
4) 稼働状態の確認その2
本確認は起動処理に対して設けられているタイムアウトを超過するか、回復処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、起動処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が0の場合、起動処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
※jevstatコマンドの戻り値が12の場合は本条件には該当しません。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、上記の「停止操作および強制停止操作」と同内容を実施して、
回復処理は失敗終了となります。
[JP1/AJS3 ManagerおよびAgent]
回復処理においてはタイムアウト(デフォルト:480秒)が設けられており、この時間を超過しても回復処理が完了しない場合、回復処理は失敗終了となります。
1) 稼働状態の確認その1
1-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
1-2) 戻り値の確認処理
戻り値が0の場合、JP1/AJS3 ManagerまたはAgentは起動状態にあると判断し、起動処理は成功終了します。
戻り値が0以外の場合、JP1/AJS3 ManagerまたはAgentは起動状態にないと判断し、続けて次項の処理へ移行します。
2) 停止操作および強制停止操作
二重起動対策を目的として停止処理の「停止操作」および「強制停止操作」と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の起動操作へ移行します。
3) 起動操作
起動処理の「起動操作と同内容を実施します。
本操作における実行結果は評価対象とはせず、続けて次項の稼働状態の確認その2へ以降します。
4) 稼働状態の確認その2
本確認は起動処理に対して設けられているタイムアウトを超過するか、回復処理の成功もしくは失敗が確定されるまで以下に記載する処理をリトライします。
タイムアウトを超過した場合、起動処理は失敗終了となります。
4-1) 稼働状態の確認処理
監視処理の「稼働状態の確認処理」と同内容を実施し、当該処理で得られた戻り値を持って事項の戻り値の確認処理へ移行します。
4-2) 戻り値の確認処理
戻り値が0の場合、起動処理は成功終了します。
戻り値が12の場合、5秒(固定)待機した後に本項目をリトライします。
戻り値が上記以外の場合、本処理に移行する直前に実施した動作確認コマンドを再度実行し、
当該コマンドの出力結果をログ出力した後、上記の「停止操作および強制停止操作」と同内容を実施して、
回復処理は失敗終了となります。
パラメータ
タイムアウト等のパラメータは各リソースの各スクリプト内にて設定されます。
詳細は本リカバリキットのメディアに同梱されている管理ガイドをご参照ください。
関連資料
[Linux]Generic ARK for JP1のリソース起動時にlifekeeper.logに 「ERROR:lk_logmgr:log::000000:*****」のメッセージが出力される
改定履歴
掲載日:2016年12月14日