<div dir="ltr"><div>Hi,</div><div><br></div><div>Any thoughts on this issue? We are still experiencing intermittent test failures due to this issue.</div><div><br></div><div>Best regards,</div><div>Emond</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Apr 1, 2022 at 9:03 AM Emond Papegaaij <<a href="mailto:emond.papegaaij@gmail.com">emond.papegaaij@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi,<div><br></div><div>Unfortunately, this issue still pops up every once in a while. We are now running 4.3.1. In our latest failure, the issue occured in a simple restart of all services on node 1, with node 3 being the leader. Pgpool on node 1 tries to rejoin the cluster, but gets rejected over and over again. Node 3 reports that 'only life-check process can mark this node alive again'. I've attached the full logs of both node 1 and 3. The configuration hasn't changed since last time.</div><div><br></div><div>Best regards,</div><div>Emond</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Nov 29, 2021 at 4:12 PM Emond Papegaaij <<a href="mailto:emond.papegaaij@gmail.com" target="_blank">emond.papegaaij@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr">On Mon, Nov 29, 2021 at 3:55 PM Bo Peng <<a href="mailto:pengbo@sraoss.co.jp" target="_blank">pengbo@sraoss.co.jp</a>> wrote:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Thank you for your test.<br>
<br>
Because we did some bug fix for watchdog since 4.2.4, it might be an upgrade issue.<br>
If you can reproduce this issue in 4.2.6, could you share the pgpool logs of all nodes?<br></blockquote><div><br></div><div>I'll continue to monitor the tests. If one fails again, I'll share the logs. As I said, this could take some time, because the failure only occurs about once a week. Thanks for your help so far.</div><div><br></div><div>Best regards,</div><div>Emond</div></div></div>
</blockquote></div>
</blockquote></div></div>