[pgpool-general-jp: 723] pgpool-IIでの障害について

Eiichiro Sakai sakai @ agate-japan.com
2010年 2月 12日 (金) 15:27:54 JST


メーリングリスト各位

はじめまして。
酒井と申します。

pgpoolを運用しておりまして、下記のような障害に
遭遇し助言をいただきたくポストさせていただきました。

1.pgpoolから2台のpostgresにレプリケーションモードで運用しているのですが、
(ロードバランスは使用しておりません)
あるSQL(select for update)が実行中のまま応答が返ってこなくなり
その後新規のリクエストがpgpoolで実行中(idle in trunsaction)のまま滞留した状
況に
陥りました。
同一SQLを実行しても普段はすぐに返されるSQLで、postgreのSQLログにもdeadlockが
発生してる
ような記録は残っておらず、何が起因でこのような現象となったのか不明な状況で
す。

postgresのMLにポストすべき内容かもしれませんが、もし同様の現象のご経験が
ある方がいらっしゃれば何を確認すればいいのか、もしくはどのように
回避すべきかご教授いただけないでしょうか?

2.上記現象となった際にpgpoolを「-m fast stop」で停止したところ、
すぐにOS自体からの応答がなくなりsshで接続することもできない状況となってしま
いました。
(結局電源ON/OFFを実施いたしました)
なんら考えられる原因などございましたらご教授いただければと思います。
上記停止タイミングで下記のログが大量に出力されていました。
ERROR: pid 30917: pool_read_kind: kind does not match between master(69)
slot[1] (83)
ERROR: pid 30917: pool_do_auth: failed to read kind before BackendKeyData

[環境]
・OS:CentOS5(64bit)
・pgpool:2.1
・postgres:8.3.7

お忙しいところ申し訳ありませんが、何卒よろしくお願いいたします。

---------------------------------------
Agate Inc.
酒井 英一郎
E-Mail:sakai @ agate-japan.com




pgpool-general-jp メーリングリストの案内