[pgpool-general-jp: 800] online recovery

ポンパー revivex36 @ gmail.com
2010年 9月 20日 (月) 12:11:14 JST


オンラインリカバリーについて質問があります。

OSはCENTOS5
でPGPOOLはpgpool-II-3.0、POSTGRESはpostgresql-server.x86_64 8.4.4-1PGDG.rhel5
を使っています。

RSYNCを使ったリカバリーを行いたいのですが、以下のようにスクリプトを作成し、ステージ1,2とも同じものを実行します。

#! /bin/sh
# Online recovery 1st stage script
#
if [ $# -ne 3 ]
then
    echo "pgpool_recovery datadir remote_host remote_datadir"
    exit 1
fi
datadir=$1
DEST=$2
DESTDIR=$3
PGCTL=/usr/bin/pg_ctl

## Remove all of files in recovery postgresql data files.
#
ssh -T $DEST rm -rf $DESTDIR.bk
# Wait until background procee is done.
wait
ssh -T $DEST mv -f $DESTDIR{,.bk}
## Data transfer for postgresql core data
#
rsync -avz -e ssh $datadir/ $DEST:$DESTDIR/ &
# Wait until background procee is done.
wait
# Exclude postgresql.conf file.
ssh -T $DEST rm -f $DESTDIR/postmaster.pid
ssh -T $DEST cp -f $DESTDIR.bk/postgresql.conf $DESTDIR
# Wait for all of procedures to be done.
wait

リカバリーサーバーの復帰は出来るのですが、リカバリーの最後の部分で

2010-09-19 19:34:21 LOG:   pid 17629: check_postmaster_started: failed to
connect to postmaster on hostname:111.222.333.444 database:template1
user:postgres
2010-09-19 19:34:24 LOG:   pid 17629: check_postmaster_started: try to
connect to postmaster on hostname:111.222.333.444 database:template1
user:postgres (retry 28 times)

2010-09-19 19:52:35 ERROR: pid 17686: check_postmaster_started: remote host
start up did not finish in 90 sec.
2010-09-19 19:52:35 ERROR: pid 17686: start_recovery: check start failed

が連続して30回出力されて、PGPPOL、マスター、リカバリーとも立ち上がっているのですが、PGPOOLがリカバリーサーバーが3の状態で復帰していないように
認識しています。

どこか設定に問題点があるのでしょうか? リカバリーを行ったコマンドはPCP_RECOVERY_NODEです。

ご教授お願いします。
-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: http://www.sraoss.jp/pipermail/pgpool-general-jp/attachments/20100919/913a58c8/attachment.html 


pgpool-general-jp メーリングリストの案内