[pgpool-general-jp: 1481] Re: Postgres10環境でregression test 011、012、013に失敗します

Tatsuo Ishii ishii @ sraoss.co.jp
2018年 1月 15日 (月) 16:56:50 JST


石井です。

> ・011.watchdoc_quorum_failover...

このテストを実施するために、ソースツリーをクリーンな状態で(つまりコン
パイル済みオブジェクトファイルが残っていない状態で)、テストを実施する
必要があります。テスト用の特別なオブジェクトを生成するためです。

make distclean
make clean

など実施してからregression testを行ってください。
--
Tatsuo Ishii
SRA OSS, Inc. Japan
English: http://www.sraoss.co.jp/index_en.php
Japanese:http://www.sraoss.co.jp

> 狩集です。
> 
> regression test 008の質問中ですが、
> 以下3件のregression testでも失敗したため、質問させてください。
> 
> ----環境情報------
> OS       :RHEL7.3
> Postgres :10.1
> pgpool-II:3.7.1
> ------------------
> 
> ・011.watchdoc_quorum_failover...
>   9件中1件失敗しています。
> 
>   Checking if the Standby2 fooled by fake error...
>     "1	down"という記述を011.watchdoc_quorum_failover/standby2/log/backend_down_requestに出力後、
>     011.watchdoc_quorum_failover/standby2/log/pgpool.logから"failover"という文字列を検索して
>     いますが、見つからずにリトライ回数(10回)を超えて失敗しています。
> 
> ---
> Checking if the Standby2 fooled by fake error...
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> ・012.watchdog_failover_when_quorum_exists
>   5件中2件失敗しています。
> 
> 1件目
>   Checking if the Master rejects the failover because quorum is not present...
>     "1	down"という記述を012.watchdog_failover_when_quorum_exists/master/log/backend_down_requestに出力後、
>     012.watchdog_failover_when_quorum_exists/master/log/pgpool.logから"Rejecting the failover request"
>     というメッセージを検索していますが、見つからずにリトライ回数(10回)を超えて失敗しています。
> 
> ---
> Checking if the Master rejects the failover because quorum is not present...
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 2件目
>   Checking if all Pgpool-II agrees that the failover request is executed
>     show pool_nodesでDBノードのリストを表示させ、standby側のノードの状態がdown状態になっていることを
>     確認していますが、リトライ回数を超えても失敗しています。
> 
> ---
> Checking if all Pgpool-II agrees that the failover request is executed
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 
> ・013.watchdoc_test_failover_require_consensus
>   7件中4件失敗しています。
> 
> 1件目
>   Checking if the standby successfuly process the failover request...
>     "1	down"という記述を013.watchdoc_test_failover_require_consensus/standby/log/backend_down_requestに
>     出力後、013.watchdoc_test_failover_require_consensus/standby/log/pgpool.logから
>     "building consensus for request"という記述を探していますが、
>     見つからずにリトライ回数(10回)を超えて失敗しています。
> 
> ---
> Checking if the standby successfuly process the failover request...
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 2件目
>   Checking if the Master receives the failover request and waiting for consensus...
>     1件目が失敗しているため、続けて失敗しているように見えます。
> 
> ---
> Checking if the Master receives the failover request and waiting for consensus...
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 3件目
>   Checking if the node is quarantined on standby...
>     1件目が失敗しているため、続けて失敗しているように見えます。
> 
> ---
> Checking if the node is quarantined on standby...
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 
> 4件目
>   Checking if all Pgpool-II agrees that the failover request is executed
>     show pool_nodesでDBノードのリストを表示させ、standby側のノードの状態がdown状態になっていることを
>     確認していますが、失敗しています。
> 
> ---
> Checking if all Pgpool-II agrees that the failover request is executed
> [check] 1 times
> [check] 2 times
> [check] 3 times
> [check] 4 times
> [check] 5 times
> [check] 6 times
> [check] 7 times
> [check] 8 times
> [check] 9 times
> [check] 10 times
> ---
> 
> 上記3つのテストですが、watchdocがテストDBが疑似エラーを検出できていないため、
> failoverが実行されず、pgpool.logに期待している文字列が出力されてないように見えます。
> テスト時に同様の現象が発生した方がおられましたら、対処方法等を教えて頂けないでしょうか。
> 
> 以上です。宜しくお願いします。
> 
> _______________________________________________
> pgpool-general-jp mailing list
> pgpool-general-jp @ sraoss.jp
> http://www.sraoss.jp/mailman/listinfo/pgpool-general-jp


pgpool-general-jp メーリングリストの案内