[pgpool-general-jp: 1477] Re: Postgres10環境でregression test 008に失敗します

Bo Peng pengbo @ sraoss.co.jp
2018年 1月 12日 (金) 13:06:55 JST


彭です。

環境にもよりますが、ストリーミングレプリケーションの standby が 
WAL 適用する前に、primary の WAL が消されてしまったのが原因だと
思います。

このような事象を防ぐために、アーカイブからリストアできるように 
recovery.conf に restore_command='cp ... 'を追加した方がいいです。

添付の pgpool_setup のパッチをためしていただけますか。

以上、よろしくお願いいたします。

On Thu, 11 Jan 2018 00:26:39 +0000
"Kariatsumari, Kazuki" <ka.kariatsumari @ jp.fujitsu.com> wrote:

> 狩集です。
> 
> 回答ありがとうございます。
> 自身にパスワード無しでssh接続できるようにした後、
> 再度regression test 008を実施しましたが、
> 状況に変化はありませんでした。
> 
> また、008.dbredirect/testdir/pgpool_setup.logにエラーはありませんでした。
> 
> 以上です。宜しくお願いします。
> 
> > -----Original Message-----
> > From: Bo Peng [mailto:pengbo @ sraoss.co.jp]
> > Sent: Wednesday, January 10, 2018 3:35 PM
> > To: pgpool-general-jp @ sraoss.jp
> > Cc: Kariatsumari, Kazuki/狩集 一樹
> > Subject: Re: [pgpool-general-jp: 1474] Postgres10環境でregression test
> > 008に失敗します
> > 
> > 彭です。
> > 
> > PostgreSQL ストリーミングレプリケーションの構築で失敗したのではない
> > かと思います。
> > 
> > 008.dbredirect のテストスクリプトの中で $PGPOOL_SETUP -m s -n 3 を実
> > 行し、
> > 3ノードのストリーミングレプリケーションを構成しています。
> > 
> > 008.dbredirect/testdir/pgpool_setup.log に何らかのエラーが出力された
> > でしょうか。
> > 
> > よくある原因としては、パスワードなしの ssh 設定していなかったことです。
> > 自分自身に ssh でパスワード無しでログインできるようになっている必要
> > があります。
> > 
> > 以上、よろしくお願いします。
> > 
> > On Wed, 10 Jan 2018 02:39:52 +0000
> > "Kariatsumari, Kazuki" <ka.kariatsumari @ jp.fujitsu.com> wrote:
> > 
> > > 狩集と申します。
> > >
> > > RHEL7.3、Postgres10、pgpool-II-3.7.1環境を構築し、
> > > regression testを実行したところ、testing 008.dbredirectで失敗しま
> > した。
> > >
> > > 008.dbredirect/testdir/data0/log/内のログを確認したところ、以下の記
> > 述がありました。
> > >
> > > 12031 2018-01-09 16:30:22 JST ERROR:  requested WAL segment
> > 000000010000000000000002 has already been removed
> > >
> > > 上記のエラーからWALが存在しないことが失敗の原因と考え、
> > > regression test実行時にWALの値を設定するように、
> > pgpool-II-3.7.1/src/test/pgpool_setupに
> > > 以下の変更を加えました。(★行を追加しました)
> > >
> > > -----
> > > 285                 echo "wal_level = hot_standby" >> $PGCONF
> > > 286                 echo "wal_keep_segments = 5" >> $PGCONF★
> > > 287                 echo "max_wal_senders = $NUMCLUSTERS" >> $PGCONF
> > > -----
> > >
> > > 変更後、再度008.dbredirectを実施したところ、
> > > 008.dbredirect/testdir/log/pgpool.logに以下のメッセージが出力され
> > るようになりました。
> > >
> > > 2018-01-09 20:50:50: pid 30748: DEBUG:  could not load balance because
> > of too much replication delay
> > >
> > > メッセージの文面を見る限り、レプリケーションで遅延が発生しているよ
> > うです。
> > > 遅延発生の原因について、ご存知のことがございましたら教えて頂けない
> > でしょうか。
> > >
> > > 以上です。宜しくお願いします。
> > >
> > > _______________________________________________
> > > pgpool-general-jp mailing list
> > > pgpool-general-jp @ sraoss.jp
> > > http://www.sraoss.jp/mailman/listinfo/pgpool-general-jp
> > >
> > 
> > 
> > --
> > Bo Peng <pengbo @ sraoss.co.jp>
> > SRA OSS, Inc. Japan
> > 
> 
> 
> 


-- 
Bo Peng <pengbo @ sraoss.co.jp>
SRA OSS, Inc. Japan
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: pgpool_setup.patch
型:         application/octet-stream
サイズ:     467 バイト
説明:       無し
URL:        <http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20180112/5c300230/attachment.obj>


pgpool-general-jp メーリングリストの案内