<div dir="ltr">Yes, it was problem with passwordless ssh. Thanks for help! <br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пн, 29 июл. 2019 г. в 17:56, Гиа Хурцилава <<a href="mailto:khurtsilava.g@gmail.com">khurtsilava.g@gmail.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Sorry, here is the pgpool.conf from the master node<div><br></div><div>So I delete >/dev/null from the script and here is the result:</div><div><br></div><div> + FAILED_NODE_ID=0<br> + FAILED_NODE_HOST=master<br> + FAILED_NODE_PORT=5432<br> + FAILED_NODE_PGDATA=/var/lib/pgsql/11/data<br> + NEW_MASTER_NODE_ID=1<br> + OLD_MASTER_NODE_ID=0<br> + NEW_MASTER_NODE_HOST=slave<br> + OLD_PRIMARY_NODE_ID=0<br> + NEW_MASTER_NODE_PORT=5432<br> + NEW_MASTER_NODE_PGDATA=/var/lib/pgsql/11/data<br> + PGHOME=/usr/pgsql-11<br> + ARCHIVEDIR=/var/lib/pgsql/archivedir<br> + REPL_USER=repl<br> + PCP_USER=pgpool<br> + PGPOOL_PATH=/usr/bin<br> + PCP_PORT=9898<br> + logger -i -p <a href="http://local1.info" target="_blank">local1.info</a> follow_master.sh: start: pg_basebackup for 0<br> + ssh -T -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null postgres@master /usr/pgsql-11/bin/pg_ctl -w -D /var/lib/pgsql/11/data status<br> Warning: Permanently added 'master,192.168.56.110' (ECDSA) to the list of known hosts.<br> Permission denied, please try again.<br> Permission denied, please try again.<br> Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).<br> + [[ 255 -eq 0 ]]<br> + logger -i -p <a href="http://local1.info" target="_blank">local1.info</a> follow_master.sh: failed_nod_id=0 is not running. skipping follow master command.<br>follow_master.sh: failed_nod_id=0 is not running. skipping follow master command.<br> + exit 0<br> [192-1] 2019-07-29 13:55:02: pid 2504: LOG:  execute command: /etc/pgpool-II/follow_master.sh 2 reserve 5432 /var/lib/pgsql/11/data 1 0 slave 0 5432 /var/lib/pgsql/11/data<br> follow_master.sh: start: pg_basebackup for 2<br> + FAILED_NODE_ID=2<br> + FAILED_NODE_HOST=reserve<br> + FAILED_NODE_PORT=5432<br> + FAILED_NODE_PGDATA=/var/lib/pgsql/11/data<br> + NEW_MASTER_NODE_ID=1<br> + OLD_MASTER_NODE_ID=0<br> + NEW_MASTER_NODE_HOST=slave<br> + OLD_PRIMARY_NODE_ID=0<br> + NEW_MASTER_NODE_PORT=5432<br> + NEW_MASTER_NODE_PGDATA=/var/lib/pgsql/11/data<br> + PGHOME=/usr/pgsql-11<br> + ARCHIVEDIR=/var/lib/pgsql/archivedir<br> + REPL_USER=repl<br> + PCP_USER=pgpool<br> + PGPOOL_PATH=/usr/bin<br> + PCP_PORT=9898<br> + logger -i -p <a href="http://local1.info" target="_blank">local1.info</a> follow_master.sh: start: pg_basebackup for 2<br> + ssh -T -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null postgres@reserve /usr/pgsql-11/bin/pg_ctl -w -D /var/lib/pgsql/11/data status<br> Warning: Permanently added 'reserve,192.168.56.112' (ECDSA) to the list of known hosts.<br> Permission denied, please try again.<br> Permission denied, please try again.<br> Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).<br> + [[ 255 -eq 0 ]]<br> + logger -i -p <a href="http://local1.info" target="_blank">local1.info</a> follow_master.sh: failed_nod_id=2 is not running. skipping follow master command.<br> slave root[2550]: follow_master.sh: failed_nod_id=2 is not running. skipping follow master command.<br> + exit 0<br></div><div><br></div><div>I'm starting to think that there some problem with ssh connection, but not sure</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">вс, 28 июл. 2019 г. в 03:58, Tatsuo Ishii <<a href="mailto:ishii@sraoss.co.jp" target="_blank">ishii@sraoss.co.jp</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">I noticed followings in the log files:<br>

<br>

/home/t-ishii/slave log.txt:Jul 25 22:30:53 reserve root[2011]: follow_master.sh: failed_nod_id=1 is not running. skipping follow master command.<br>

/home/t-ishii/slave log.txt:Jul 25 22:30:53 reserve root[2019]: follow_master.sh: failed_nod_id=2 is not running. skipping follow master command.<br>

<br>

I don't know which is node 1 and 2 (because you didn't share<br>

pgpool.conf) , but I don't think two nodes were skipped by follow<br>

master command was normal because you have only 3 nodes and just one<br>

of 3 is already down.<br>

<br>

I suspect following code in follow_master.sh did not succeed:<br>

<br>

ssh -T -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null \<br>

    postgres@${FAILED_NODE_HOST} ${PGHOME}/bin/pg_ctl -w -D ${FAILED_NODE_PGDATA} status >/dev/null 2>&1<br>

<br>

You would want to remove ">/dev/null" to see what was going on there.<br>

<br>

Best regards,<br>

--<br>

Tatsuo Ishii<br>

SRA OSS, Inc. Japan<br>

English: <a href="http://www.sraoss.co.jp/index_en.php" rel="noreferrer" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>

Japanese:<a href="http://www.sraoss.co.jp" rel="noreferrer" target="_blank">http://www.sraoss.co.jp</a><br>

<br>

> "slave" -primary<br>

> "master" and "reserve"- standby<br>

> After I shut down "slave", "master" became primary, but "reserve" got<br>

> status down. Configs are same from the documentation (changed just<br>

> hostnames and ip's). Failover config is the same also<br>

> <br>

> пт, 26 июл. 2019 г. в 12:54, Tatsuo Ishii <<a href="mailto:ishii@sraoss.co.jp" target="_blank">ishii@sraoss.co.jp</a>>:<br>

> <br>

>> Hi,<br>

>><br>

>> Yes, please provide log and config files.<br>

>><br>

>> My intuition is that there's something wrong with the follow master<br>

>> command script or related settings (especially ssh), because the<br>

>> script shutdowns standby server to resync with new primary database<br>

>> server.<br>

>><br>

>> Best regards,<br>

>> --<br>

>> Tatsuo Ishii<br>

>> SRA OSS, Inc. Japan<br>

>> English: <a href="http://www.sraoss.co.jp/index_en.php" rel="noreferrer" target="_blank">http://www.sraoss.co.jp/index_en.php</a><br>

>> Japanese:<a href="http://www.sraoss.co.jp" rel="noreferrer" target="_blank">http://www.sraoss.co.jp</a><br>

>><br>

>> > Гиа Хурцилава <<a href="mailto:khurtsilava.g@gmail.com" target="_blank">khurtsilava.g@gmail.com</a>><br>

>> > чт, 25 июл., 13:56 (21 час назад)<br>

>> > кому: pgpool-general<br>

>> ><br>

>> > Hi there.<br>

>> ><br>

>> > I’ve got 3 machines with pgpool-4.0.5 and postgresql-11. I have done<br>

>> > configuration for pgpool from the official documentations (<br>

>> > <a href="http://www.pgpool.net/docs/latest/en/html/example-cluster.html" rel="noreferrer" target="_blank">http://www.pgpool.net/docs/latest/en/html/example-cluster.html</a>) and<br>

>> > everything works fine, except 1 thing. When I’m shutting down master<br>

>> node,<br>

>> > one of the slaves is correctly promoted, and another one is going down<br>

>> with<br>

>> > master. Just like that:<br>

>> ><br>

>> > node_id | hostname | port | status | lb_weight |  role   | select_cnt |<br>

>> > load_balance_node | replication_delay | last_status_change<br>

>> ><br>

>> ><br>

>> ---------+----------+------+--------+-----------+---------+------------+-------------------+-------------------+---------------------<br>

>> ><br>

>> >  0       | master   | 5432 | down   | 0.333333  | standby | 0          |<br>

>> > false             | 0                 | 2019-07-25 13:49:22<br>

>> ><br>

>> >  1       | slave      | 5432 | up         | 0.333333  | primary | 0<br>

>> >   | true              | 0                | 2019-07-25 13:49:22<br>

>> ><br>

>> >  2       | reserve  | 5432 | down   | 0.333333  | standby | 0          |<br>

>> > false             | 0                 | 2019-07-25 13:49:22<br>

>> ><br>

>> ><br>

>> ><br>

>> > What reason can be of this behavior? How can I fix it?<br>

>> ><br>

>> > If you’ll need logs or config files-let me know. Thanks.<br>

>><br>

</blockquote></div>

</blockquote></div>