[pgpool-general-jp: 1213] バックエンドDB3台構成時のフェイルオーバについて

稲垣 tadashi.1027 @ gmail.com
2013年 10月 29日 (火) 19:31:03 JST


いつもお世話になっております。
アイ・エス・ビー稲垣です。

バックエンドDB3台構成時のフェイルオーバ発生時に切り変わるときと、
切り替わらないときがあります。
db01が落ちたときはdb02に切り替わる確立が高いですが、
db02が落ちたときは必ず切り替わりません。
切り替わらない上にfailover: set new primary node: -1になってしまいます。

db01、db02、db03のどのサーバがPrimaryであっても、Standbyに切り替わるよう
設定したいと思っております。

お忙しいところ大変失礼いたしますが、ご教授のほど宜しくお願い致します。

添付ファイルはdb01〜db03までのpgpool.confとfailover-stream.sh<http://pgpool.xn--conffailover-stream-ei4r.sh>
になります。
構成、バージョン、フェイルオーバ時のログは以下のようになっております。

【構成】
pgpool-IIとPostgreSQLを同居させたサーバ3台構成です。

host    ipaddress
db01   192.168.100.34
db02   192.168.100.35
db03   192.168.100.36

【バージョン】
pgpool-II version 3.3.1 (tokakiboshi)
psql (PostgreSQL) 9.2.4

【フェイルオーバ時のログ】
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48029]: connect_inet_domain_socket:
getsockopt() detected error: Connection refused
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48029]: make_persistent_db_connection:
connection to 172.16.64.35(5432) failed
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48029]: health check failed. 1 th host
172.16.64.35 at port 5432 is down
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48029]: set 1 th backend down status
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48029]: wd_start_interlock: start
interlocking
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48044]: wd_send_response: failover
request from other pgpool is canceled because it's while switching
Oct 29 18:46:23 m2m-pdbs01 pgpool-II[48044]: wd_send_response:
WD_STAND_FOR_LOCK_HOLDER received but lock holder exists already
Oct 29 18:46:24 m2m-pdbs01 pgpool-II[48029]: starting degeneration.
shutdown host 172.16.64.35(5432)
Oct 29 18:46:24 m2m-pdbs01 pgpool-II[48029]: Restart all children
Oct 29 18:46:24 m2m-pdbs01 pgpool-II[48029]: find_primary_node_repeatedly:
waiting for finding a primary node
Oct 29 18:46:32 m2m-pdbs01 pgpool-II[31414]: connect_inet_domain_socket:
getsockopt() detected error: Connection refused
Oct 29 18:46:32 m2m-pdbs01 pgpool-II[31414]: make_persistent_db_connection:
connection to 172.16.64.35(5432) failed
Oct 29 18:46:32 m2m-pdbs01 pgpool-II[31414]: check_replication_time_lag:
could not connect to DB node 1, check sr_check_user and sr_check_password
Oct 29 18:46:34 m2m-pdbs01 pgpool-II[48029]: wd_end_interlock: end
interlocking
Oct 29 18:46:35 m2m-pdbs01 pgpool-II[48029]: failover: set new primary
node: -1
Oct 29 18:46:35 m2m-pdbs01 pgpool-II[48029]: failover: set new master node:
0
-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: <http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20131029/72bb00a3/attachment-0001.html>
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: db03.tar.gz
型:         application/x-gzip
サイズ:     6506 バイト
説明:       無し
URL:        <http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20131029/72bb00a3/attachment-0003.gz>
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: db01.tar.gz
型:         application/x-gzip
サイズ:     6510 バイト
説明:       無し
URL:        <http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20131029/72bb00a3/attachment-0004.gz>
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: db02.tar.gz
型:         application/x-gzip
サイズ:     6508 バイト
説明:       無し
URL:        <http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20131029/72bb00a3/attachment-0005.gz>


pgpool-general-jp メーリングリストの案内