Namespace
命名空间,是 NVMe 协议中一个基本的逻辑空间的概念。简单地说,命名空间将 NVMe SSD 的用户空间进行逻辑划分,每个命名空间拥有自身的 NAND 颗粒,可以独立地进行格式化和加密等操作。
OP
Over-provisioning,一般称为预留空间,它是指 SSD 保留一部分闪存空间留作他用,这部分空间用户不可操作,容量大小一般是由主控决定的,一般不建议用户自行修改。OP 空间在垃圾回收(Garbage Collection, GC)、耗损平衡(Wear Leveling, WL)、减少写入放大(Write Amplification, WA)等多个方面都有作用,具体如何应用要取决于 SSD 主控算法。OP 的使用情况对于磁盘的健康状态是有影响的。
DWPD
Drive Writes Per Day,每日整盘写入次数(按质保年限计算),是指在预期寿命内可每日完整写入 SSD 固态硬盘所有容量的次数。这个参数一般会作为参考 NMVe SSD 寿命和性能的重要评测数据。由于 SSD 的实现是基于电气原理的,每个 NAND 颗粒的擦写(P/E)次数是有限制的,一般厂家都会标定一个寿命期限。OP 所实现的 WL 对于维护磁盘的使用寿命具有很重要的意义。
P/E 周期
(Program/Erase Cycle):NAND 闪存的写入 - 擦除循环次数,每完成一次 “写入 - 擦除” 计数 1 次,达到上限后可能失效(不同类型 NAND 的 P/E 周期差异见上文)。
TBW
(Total Bytes Written):总写入字节数,单位 TB,衡量 SSD 寿命的官方指标(如 100TBW 表示累计可写入 100TB 数据),数值越高越耐用。
MTBF
Mean Time Between Failures,平均无故障工作时间,或相邻两次故障之间的平均工作时间,是衡量一个产品的可靠性指标,单位为“小时”。MTBF主要通过实证法采用加速应力方式来证明产品长期可靠度,主要通过高温加速测试计算评估,从测试深度、广度、持久度三个方向进行测验。
PI
Protection Information,保护信息。完整的端到端数据保护支持由Host端生成PI,提供从Host直至SSD内部的完整端到端数据路径保护。在数据生成时,通过对数据添加PI,并将其作为元数据始终伴随用户数据一同传输和校验,借此降低静默错误的发生;同时,借助ECC(如BCH、LDPC)、Die间RAID5等手段,对检测到的错误数据加以修正,提升整个端到端数据传输过程中的可靠性。PI也可以通过SSD Controller生成,提供SSD盘内的数据保护,通常,后者称为“数据路径保护”技术。
PI与用户数据通常是连续存放。这要求SSD在提供标准的用户数据存储空间(如512字节或4096字节)之外,额外提供PI作为元数据的存储区域。
VSS
Viable Sector Size,可变Sector Size,也叫活性扇区大小。它允许SSD在保存用户数据的同时,保存该数据的元数据,也就是对PI的存储。它是全闪存阵列实现NVMe端到端数据保护,降低静默错误发生的必要前提。在保证一致性能前提下,进一步保证存储系统和分布式文件系统对数据可靠性的高要求。
DIF/DIX
PI 的具体实现包括 DIF 和 DIX 两种方式,这两种数据保护机制的主要区别是 PI 信息的位置不同。具体选择哪种格式,要根据应用场景的需求。
Data Integrity Field (DIF),即元数据与用户数据(LBA Data)连续存放。
Data Integrity Extension (DIX),元数据与用户数据单独存放。
SR-IOV
Single-Root I/O Virtualization,单根 I/O虚拟化。是一种基于硬件的虚拟化解决方案,通过利用PF和VF的属性,将一个设备虚拟出多个PCIe设备,利于虚拟机操作,从而大大减轻宿主机的CPU负荷,提高性能和可伸缩性,帮助系统解决虚拟机SSD盘的QoS问题,可支持更多数量的虚拟机业务。VM可直接与VF通信,不需要Hypervisor接入IO处理,节约 vCPU资源,实现性能隔离。
SR-IOV可实现多个虚拟机共享物理资源,且bypass Hypervisor(或者VMM)软件层,使得虚拟机可使用到NVMe SSD的高性能。
PRP
Physical Region Page,物理(内存)区域页,主机侧用于通知SSD数据所在的内存位置的一种方式。NVMe把Host的内存分为页的集合,页的大小在CC寄存器中配置,可以是4K、8K…128MB,PRP Entry是一个64位的内存物理地址指针,描述的是一段连续的物理内存的起始地址,PRP list中每个PRP Entry都描述一个物理页。每个NVME 命令有两个域,PRP1和PRP2,Host通过这两个域告诉SSD数据在内存中的位置或数据需要写入的地址。
SGL
Scatter Gather List,散列聚集列表,是另一种索引内存的数据结构。用以描述一段数据空间,该空间可以是数据源所在空间,也可以是数据目标空间,SGL由若干个SGL segment组成,每个segment又由若干个SGL descriptor组成。与PRP描述物理页不同,SGL可以描述任意大小的内存空间,更为灵活。
Multi-stream write
多流写,该技术可以使SSD根据主机端提供的Stream ID,将具有相同或相似生命周期的数据写入到相同的擦除单元中去,大大提高GC时的效率,减少写放大,使得SSD的性能和寿命都有较大的提升。
ZNS
Zoned Name Spaces,分区命名空间。ZNS将一个Namespace的逻辑地址空间切分成单个zone(一种固定大小的子区间),每个zone都有一段LBA(Logical Block Address, 逻辑地址空间)区间,这段区间只能顺序写,而且如果要覆盖写,则必须进行一次擦除操作。这样,namespace就可以把NAND内部结构的边界透露给外界。NVMe SSD也就能够将地址映射表等内部管理工作交由host去处理,从而减少写放大、选择合适的GC时机。ZNS驱动器减少了用于过度配置的额外闪存,因为它们不希望频繁写入,因此成本更低。
ASPM
Active State Power Management,主动状态电源管理,是 PCIe 协议定义的电源管理机制。通过让 PCIe 设备(如 NVMe SSD)在低负载时自动切换到低功耗状态(如 L0s、L1),降低闲置时的能耗;高负载时快速唤醒至活跃状态,兼顾节能与性能。常用于笔记本等移动设备,平衡续航与响应速度。
DMDP
Dual Port Multi-Device,双端口多设备,指 SSD 支持两个独立的物理接口(如双 PCIe 接口),可同时连接到两个主机或控制器。通过冗余路径设计,避免单端口故障导致的业务中断,提升存储系统的可用性(类似 “双活” 机制),多见于企业级 SSD 和存储阵列。
IOPS
Input/Output Operations Per Second,每秒输入输出操作数,衡量存储设备处理读写请求的能力。
- 按数据块大小分为随机 IOPS(如 4K、8K 小文件,反映系统启动、数据库操作等场景性能)和连续 IOPS(大文件读写,如视频传输)。
- NVMe SSD 的随机 IOPS 可达数十万甚至上百万,远超 HDD(约数百至数千),是 SSD “流畅度” 的核心指标。
UBER
Unrecoverable Bit Error Rate,不可恢复位错误率,衡量数据完整性的关键指标。指每传输 1 比特数据中,无法通过 ECC(纠错码)等机制修复的错误比例(通常以 10⁻¹⁵为单位,即每 10¹⁵比特中最多 1 个不可修复错误)。数值越低,说明设备对数据的保护能力越强,企业级 SSD 的 UBER 通常远低于消费级产品。
LDPC
Low-Density Parity-Check Code,低密度奇偶校验码,一种高效的纠错编码技术。相比传统的 BCH 码,LDPC 能以更低的计算复杂度纠正更多位错误,尤其适用于 TLC/QLC 等高密度 NAND 闪存(因存储单元电荷稳定性差,易产生位错误)。通过 LDPC,SSD 可延长 NAND 的有效寿命,并提升数据可靠性。
AFR(Annual Failure Rate)
年故障率,指设备在一年内发生故障的概率(基于大量设备的统计均值)。
- 计算公式:
AFR ≈ (8760小时 / MTBF) × 100%
,与 MTBF 成反比。 - 企业级存储设备(如 SSD/HDD)的 AFR 通常低于 1%(如 0.35%-0.44%),消费级设备则多在 1%-2%,反映其在连续高负载场景下的稳定性差异。
RAID
Redundant Array of Independent Disks,独立磁盘冗余阵列,通过将多个存储设备(HDD 或 SSD)逻辑组合,实现性能提升或数据冗余。
- 常见级别:
- RAID 0(条带化):数据分散写入多盘,提升吞吐量(无冗余,单盘故障则数据丢失);
- RAID 1(镜像):数据同步写入两盘,冗余性高(容量减半,性能略降);
- RAID 5(分布式奇偶校验):兼顾性能与冗余(单盘容错,适合中小规模存储);
- RAID 6(双奇偶校验):双盘容错,可靠性更高(写入性能略低,适合企业级场景)。
- 在 SSD 阵列中,RAID 可进一步放大并行读写能力,同时通过冗余降低单盘故障风险。
SLC/MLC/TLC/QLC
- SLC:用于企业级高性能场景(如数据库、缓存),依赖其高 P/E 周期(10 万次 +)和低延迟;
- MLC:逐渐被 TLC 替代,仅部分工业级设备保留,平衡成本与寿命;
- TLC:消费级主流(如 PC、手机),通过 SLC Cache 技术弥补性能,P/E 周期 1000-3000 次;
- QLC:主打大容量存储(如移动硬盘、仓库盘),依赖 OP 和算法优化延长寿命,P/E 周期 300-1000 次;
- PLC(Penta-Level Cell):每单元存 5bit,处于试验阶段,容量更大但性能和寿命进一步降低,目标是超低成本存储。
FTL(Flash Translation Layer)
闪存转换层,SSD 控制器的核心组件,负责逻辑地址(LBA)与物理地址(NAND 区块)的映射。同时管理磨损均衡(避免局部区块过度使用)、垃圾回收(整理无效数据)、坏块替换等底层操作,是 SSD 性能和寿命的 “隐形管家”。
NVMe over Fabrics(NVMe-oF)
将 NVMe 协议扩展到网络 fabrics(如 FC、RDMA、TCP)的技术,突破本地 PCIe 总线的物理距离限制,实现远程 NVMe 设备(如数据中心的 SSD 阵列)的低延迟访问。相比传统 iSCSI 等协议,NVMe-oF 可保留 NVMe 的高性能(低延迟、高吞吐量),适用于分布式存储和跨机房数据共享。
WAF(Write Amplification Factor)
写入放大系数,指 SSD 实际写入 NAND 的字节数与主机写入字节数的比值(WAF = 实际写入量 / 主机写入量
)。
- WAF=1 为理想状态(无无效写入),数值越高,说明垃圾回收、块擦除等操作产生的额外写入越多,会加速 NAND 磨损并降低性能。
- OP 空间、多流写(Multi-stream)、ZNS 等技术可有效降低 WAF(如 ZNS 通过顺序写入减少 GC,WAF 接近 1)。