事象
IPリソース作成の際、以下のようなメッセージが出力されエラーとなり、IPリソース作成に失敗することがあります。
※ LifeKeeper のバージョンにより、出力結果が異なります。
LifeKeeper for Linux v7.4 以降の出力
Jun 9 10:15:29 lk01 creIPhier[XXXX]: NOTIFY:ip:creIPhier:ip-10.1.1.100:123043:BEGIN create of "ip-10.1.1.100"
Jun 9 10:15:32 lk01 creIPhier[XXXX]: INFO:ip:creIPhier:ip-10.1.1.100:123065:LifeKeeper application=comm on lk01.
Jun 9 10:15:32 lk01 creIPhier[XXXX]: INFO:ip:creIPhier:ip-10.1.1.100:123067:LifeKeeper communications resource type= ip on lk01.
Jun 9 10:15:32 lk01 creIPhier[XXXX]: INFO:ip:creIPhier:ip-10.1.1.100:123057:Creating resource instance with id IP-10.1.1.100 on machine lk01
Jun 9 10:15:32 lk01 creIPhier[XXXX]: INFO:ip:creIPhier:ip-10.1.1.100:123058:Resource successfully created on lk01
Jun 9 10:15:32 lk01 restore[XXXX]: NOTIFY:RKActionHandler:restore:ip-10.1.1.100:001044:BEGIN restore of "ip-10.1.1.100"
Jun 9 10:15:44 lk01 restore[XXXX]: ERROR:ip:restore:ip-10.1.1.100:123095:broadcast ping failed
Jun 9 10:15:44 lk01 restore[XXXX]: ERROR:ip:restore:ip-10.1.1.100:123096:The broadcast ping used to determine the viability of 10.1.1.100/24 failed. Please ensure that the ping list for this resource is properly configured in the properties panel or that broadcast ping checking is disabled by adding NOBCASTPING=1 to the /etc/default/LifeKeeper configuration file.
Jun 9 10:15:49 lk01 restore[XXXX]: NOTIFY:RKActionHandler:restore:ip-10.1.1.100:001046:END failed "restore" of "ip-10.1.1.100" with return value of 1
Jun 9 10:15:49 lk01 perform_action[XXXX]: ERROR:lcd.lraci:restore:ip-10.1.1.100:004300:restore of resource "ip-10.1.1.100" has failed
Jun 9 10:15:49 lk01 creIPhier[XXXX]: ERROR:ip:creIPhier:ip-10.1.1.100:123056:create ip hierarchy failure: perform_action failed
Jun 9 10:15:49 lk01 creIPhier[XXXX]: NOTIFY:ip:creIPhier:ip-10.1.1.100:123048:END failed create of "ip-10.1.1.100".
LifeKeeper for Linux v7.3 以前の出力
火 1月 25 12:34:56 JST 2011 IP health check: ERROR: Broadcast ping test failed for virtual IP 192.168.0.221 on interface eth0. ***ERROR*** perform_action[291,lraci.C]火 1月 25 12:34:58 JST 2011: restore of resource "ip-192.168.0.221" has failed iphier: create ip hierarchy failure: perform_action failed
原因および対処方法
LifeKeeper のノードが属しているネットワーク環境に、ブロードキャスト ping に応答する機器が存在しない場合に、上記のようなエラーが発生します。
(参考)RHEL5 では、初期状態でブロードキャストpingに応答しない設定になっており、LifeKeeper のノードが属しているネットワーク環境で RHEL5 システムしか存在しない場合、このような事象が発生しやすくなります。
上記のエラーを回避する方法として以下のいずれかの対処を行ってください。
(1)クラスタノード以外にブロードキャスト ping に応答する機器を設置する
※ クラスタノード以外にブロードキャスト ping に応答する機器がない環境では、他のノードが障害で応答しなくなった場合にIPリソースのブロードキャスト ping テストで異常を検知し、IP リソースが停止、または起動しなくなります。
(2)ブロードキャスト ping の監視を無効にする
/etc/default/LifeKeeperの NOBCASTPING パラメータの設定値を下記のように変更します。
この設定は、全てのノードで実施してください。
====== /etc/default/LifeKeeper ====== NOBCASTPING=0 (修正前) NOBCASTPING=1 (修正後)
※ パラメータ値変更に伴う LifeKeeper の再起動は必要ありません。
注)ブロードキャスト ping を無効にした場合、ネットワーク障害の検出ができなくなります。
(3)ping listを設定する
ping list を設定すると、broadcast pingに代わり、特定のIPアドレスに向けたunicast pingにより疎通確認を行います。設定方法は、以下マニュアルをご参照ください。
IP Recovery Kit 管理ガイド / IP 構成の確認および編集
参考資料
[Linux] IP Recovery Kit の処理概要(v7.4.0-)
IP Recovery Kit 管理ガイド
仮想 IP アドレスに関する設定、注意事項については、IP Recovery Kit 管理者ガイドについてもご一読ください。
<改定履歴>
[公開日:2013年3月11日]
[更新日:2012年6月1日]
[更新日:2016年7月25日]
[更新日:2016年10月17日] リンク先ドキュメントを v9.1.0 へ変更
[更新日:2017年7月5日] リンク先ドキュメントを v9.1.2 へ変更
[更新日:2017年10月23日] リンク先ドキュメントを v9.2.0 へ変更
[更新日:2017年12月18日] リンク先ドキュメントを v9.2.1 へ変更
[更新日:2018年3月19日] リンク先ドキュメントを v9.2.2 へ変更
[更新日:2018年8月17日] リンク先ドキュメントを v9.3 へ変更
[更新日:2019年5月13日] リンク変更
[更新日:2019年10月21日] リンク先ドキュメントを v9.4.0 へ変更
[更新日:2020年6月9日] リンク先ドキュメントを v9.5.0 へ変更、対処方法を追記、体裁の変更