文章目录
一、什么是 Voting Disk?
Voting Disk(投票盘)是 Oracle RAC 中用于判断集群节点存活状态的重要组件,它是一个共享磁盘文件,所有节点都必须能够访问它。
你可以把它理解成集群的“点名册”或“签到表”。
二、Voting Disk 的主要作用
在 RAC 集群中,Voting Disk 有两个核心作用:
1.记录每个节点的“存活心跳”
- 每个节点定期(1秒一次)向 Voting Disk 写入一个“我还活着”的标记(称为 disk heartbeat);
- 同时也会读取其他节点是否有更新,来确认“别人还活着”;
- 这个过程由 CSSD(Cluster Synchronization Service)进程自动完成。
2.在集群通信异常时,决定哪些节点保留、哪些节点退出
- 当节点间私网(网络心跳)中断时,Voting Disk 就成为唯一能“裁判”的组件;
- 只有多数(>50%)节点能访问 Voting Disk 的那一方才能保留运行;
- 少数派会被自动重启或隔离(fencing),防止“脑裂”。
三、Voting Disk 是如何“投票”的?
假设你有 3 个节点:node1
、node2
、node3
,它们都连接到同一个 Voting Disk。
正常情况:
- 所有节点都能访问 Voting Disk;
- 每个节点每秒写入一次“我还在”;
- 大家互相读写成功,集群运行正常。
异常情况:网络断开 → 分区(Split Brain)场景:
分区 A | 分区 B |
---|---|
node1 + node2 | node3 |
能访问 Voting Disk(多数) | 无法访问 Voting Disk(少数) |
结论:
- 分区 A 保留运行
- node3 会被自动重启 / 踢出集群
这就是“多数投票机制”。
四、Voting Disk 的存放位置?
- 通常放在 共享存储中,如 ASM、NFS、iSCSI 等;
- 可以配置多个副本(1~5 个),确保冗余;
- 所有副本必须在多个节点都可读写。
查询 Voting Disk 信息命令:
crsctl query css votedisk
五、Voting Disk 丢失或不可用会怎样?
情况 | 后果 |
---|---|
所有节点都无法访问 Voting Disk | 集群全部宕机(无法判断活跃状态) |
某个节点无法访问 Voting Disk | 该节点被视为“失联”,会被踢出 |
Voting Disk 存储故障 | 触发重启或数据丢失风险 |
六、Voting Disk 与心跳机制的关系
类型 | 说明 |
---|---|
网络心跳(Network Heartbeat) | 节点之间通过私网传输心跳包 |
磁盘心跳(Disk Heartbeat) | 通过 Voting Disk 写入/读取心跳记录 |
CSSD 判断机制 | 两种都失败才判定节点死机并触发重启 |
只有网络中断 | 等待 Voting Disk 判断再处理 |
只有 Voting Disk 断 | 网络心跳仍然能维持短暂容错运行 |
七、通俗类比:Voting Disk 像什么?
想象一个公司 5 个人在群里互相报平安(心跳),但突然网络断了,只能靠在办公室白板上签名(Voting Disk)判断谁在值班。
- 如果你看不到白板、也没听到别人说话 → 你以为“我是不是只有我一个人活着了?”→ 自杀保护机制。
- Voting Disk 就是那块写字板,帮助大家“确认自己是不是孤立的”。
总结
Voting Disk 是 Oracle RAC 的核心裁判和判断节点生死的“选票中心”,配合 CSSD 使用,在网络异常或节点异常时起到决定性的作用,防止脑裂、保障集群一致性。