PG数据库导致断电/重启无法正常启动

最新推荐文章于 2025-06-24 17:41:24 发布

原创

最新推荐文章于 2025-06-24 17:41:24 发布 · 1.1k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#数据库

一、问题

数据库断电后，启动PG数据库后无法正常启动，报”psql: could not connect to server: No such file or directory”的错误，错误图片如下：

二、背景分析

数据库是单机版，使用k8s进行部署运行在指定节点，数据目录挂服务器的指定目录。在数据中心机房部署了两套k8s集群，但是pod网络未规划好，两个集群pod网段有重复导致两个集群之间的pod概率性的发生地址冲突。在发生ip重复了后修改了我方使用的k8s集群的pod网段，并对所有pod进行了重启，在执行重启操作后我方部署pg数据库无法正常提供服务，经过查询容器日志发现了上述问题。

三、解决过程

① 根据日志进入容器查看文件是否存在

kubectl exec -it -n namespace contairnerId /bin/sh

进入容器后发现/var/run/postgresql/.s.PGSQL.5432文件不存在，然后进入一个正常的pg数据库容器，发现该文件是存在的，因此确认pg数据库的进程不正常。

② 查看pg数据库进程是否存在

cat /var/lib/postgresql/11/main/master.pid

查看后结果和含义如下：