【PostgreSQL】数据库报错 “requested WAL segment 0000000100000010000000C5 has already been removed“

最新推荐文章于 2025-05-15 13:49:41 发布

RumIV

最新推荐文章于 2025-05-15 13:49:41 发布

阅读量1k

点赞数 7

CC 4.0 BY-SA版权

分类专栏：数据库文章标签：数据库 postgresql

12 篇文章

订阅专栏

要解决，可按照以下步骤操作：

确认归档目录：检查配置的归档位置（archive_command）是否存在缺失的WAL段文件（0000000100000040000000A5）。若存在，手动将其复制到主库的pg_wal目录或备库的接收目录。
检查主库的pg_wal目录：使用命令 ls -l $PGDATA/pg_wal/0000000100000040000000A5* 确认文件是否被误删。若存在，调整清理策略；若不存在且归档中也没有，需进入恢复流程。

使用最近的基础备份：找到最新的基础备份（如通过pg_basebackup或第三方工具生成的备份），将其恢复到备库或新实例。
应用归档的WAL日志：在恢复配置（recovery.conf或postgresql.conf中的restore_command）中指定归档位置，确保所有可用WAL段被应用。示例配置：
```
restore_command = 'cp /path/to/archive/%f %p'
recovery_target_timeline = 'latest'
```
停止在缺失的WAL前：若缺失的WAL无法找回，需设置recovery_target_xid或recovery_target_time到该WAL之前的时间点，避免恢复失败。

若无法恢复缺失的WAL，必须重新创建备库：

# 在主库生成新的基础备份
pg_basebackup -h 主库IP -D /path/to/new/standby -U replication -v -P --wal-method=stream
# 配置备库的postgresql.conf和primary_conninfo，启动备库

增加WAL保留量：修改wal_keep_size（PostgreSQL 13+）或wal_keep_segments（旧版本），例如：
```
wal_keep_size = '10GB'  # 保留足够WAL供备库同步
```
启用复制槽（推荐）：复制槽能防止主库删除未同步的WAL：
```
SELECT * FROM pg_create_physical_replication_slot('standby1_slot');
```
备库配置primary_slot_name = 'standby1_slot'。

检查复制状态：在主库执行：
```
SELECT * FROM pg_stat_replication;
```
确认备库的write_lag、flush_lag正常。
监控WAL和归档：使用监控工具（如Prometheus + pg_exporter）跟踪WAL生成和归档状态，及时报警异常。