[pgpool-general-jp: 921] Re: heartbeat

ポンパー revivex36 @ gmail.com
2011年 4月 18日 (月) 11:12:57 JST


早々返答を頂き有り難うございます。
スタンバイモードとはheartbeat のスタンバイモードです。このスタンバイ以外でも
heartbeatを片方停止、若しくは片方のサーバーをリブートしたときにも起こるようです。

発生するのが、必ず、数日か数週間 運転させた状態で起こって、今現在は
スタンバイにしても、リブート、heartbeat停止でも問題なくノードをコネクトしてくれます。

とりあえず、言われている D オプションを入れて起動してみます。数日後に
再度発生するか確認してみます。

有り難うございました。

2011年4月17日18:14 TAKATSUKA Haruka <harukat @ sraoss.co.jp>:

> 高塚と申します。
>
> 「スタンバイモード」というのは、マシンレベルでシステムを休止させる
> ことでしょうか? それだとすれば、pgpool が そのノード上の PostgreSQL
> を休止状態と判断するのは、仕様通りです。
>
> 片方の heartbeat を止めただけで pgpool が PostgreSQL のノードダウンを
> 検出するのは、想定に合いません。PostgreSQL を heartbeat 傘下 に (cloneで)
> 入れていればそうなるかもしれません。もしそうであれば PostgreSQL は
> heartbeat の管理下からはずしてください。
>
> また、pgpool は pool_status ファイルにノードダウン状況を記録していて、
> これが各ノードで書かれるので、以前の pool_status が残っていて問題と
> なっているかもしれません。pgpoolリソースに options パラメータで
>  -D オプション(Discard pgpool_status file)を与えて起動するようにして
> 回避できます。
>
> 以上、参考になりましたでしょうか。
>
>
> On Sun, 17 Apr 2011 12:21:50 -0700
> ポンパー <revivex36 @ gmail.com> wrote:
>
> > お世話になります。
> >
> > ハートビートで2台のホストにpgpool-II version 3.0.2 と postgresql.x86_64
>  8.4.6-1PGDG.rhel5
> > をインストールして
> > heartbeat.x86_64  2.1.3-3.el5.centos によるHA構成を作っています。ホストのOSはCENTOSです。
> >
> > heartbeatの動作については問題なく動いています。スタンバイモードやheartbeatを止めてテストしてもクリアーに
> > pgpool を移動させてサービスの続行を行っています。
> >
> > 質問の件ですが、問題ない状況で長時間運転しておいて動作確認のために、例えばpgpool 起動中のホストに
> > スタンバイモードに変更してみると待機中の2台目のホストにpgpoolを立ち上げてくれるのですが、
> > スタンバイモードになったホストのDBがDOWNステイタスとして扱われてしまい同期状態が崩れてしまいます。
> > pgpoolのログは以下のようになります。
> >
> > 2011-04-17 11:39:17 LOG:   pid 14830: read_status_file: 1 th backend is
> set
> > to down status
> > 2011-04-17 11:39:17 LOG:   pid 14830: pgpool-II successfully started.
> > version 3.0.2 (umiyameboshi)
> > 2011-04-17 11:39:19 LOG:   pid 14846: connection received:
> host=192.168.0.10
> > port=42341
> > 2011-04-17 11:39:19 LOG:   pid 14846: statement: show pool_status
> > 2011-04-17 11:39:51 LOG:   pid 14849: send_failback_request: fail back 1
> th
> > node request from pid 14849
> > 2011-04-17 11:39:51 LOG:   pid 14830: starting fail back. reconnect host
> > 2192.168.0.7(5433)
> > 2011-04-17 11:39:51 LOG:   pid 14830: failover_handler: set new master
> node:
> > 0
> > 2011-04-17 11:39:51 LOG:   pid 14830: failback done. reconnect host
> > 192.168.0.7(5433)
> >
> > ログではpgpooladmin から外れたノードをリターンさせていますが、これでは実際に障害が発生したときに片方のノードが
> > 外れたままになってしまいます。必ず長期間運転したときに起こっています。スタンバイに切り替えるときでも
> > 片方のheartbeat を停止したときにも発生します。
> >
> > このような問題点は以前取り上げられたケースがあるでしょうか? ご教授お願いします。
>
> ______________________________________________________________________
>  高塚 遙  harukat @ sraoss.co.jp  SRA OSS, Inc  http://www.sraoss.co.jp
>  〒171-0022 東京都豊島区南池袋2-32-8 8F
>  TEL: 03-5979-2701  FAX: 03-5979-2702  CellPhone: 090-3812-9652
>
> _______________________________________________
> pgpool-general-jp mailing list
> pgpool-general-jp @ sraoss.jp
> http://www.sraoss.jp/mailman/listinfo/pgpool-general-jp
>
-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20110417/5a00993e/attachment.html 


pgpool-general-jp メーリングリストの案内