TOPS(Tera Operations Per Second) 是衡量 AI 计算芯片(如 GPU、TPU、NPU)算力的关键指标,表示 每秒万亿次操作(万亿次/秒),主要用于评估处理器在深度学习任务中的性能。
1. TOPS 的具体含义
- 1 TOPS = 1 万亿次操作/秒(1 Trillion Operations Per Second)
- “操作” 通常指 整数或浮点运算(如乘加运算 MAC,Multiply-Accumulate)。
- 适用场景:
- 神经网络推理(Inference)
- 计算机视觉(CV)
- 自然语言处理(NLP)
2. TOPS 与相关术语的区别
术语 | 含义 | 适用场景 |
---|---|---|
TOPS | 每秒万亿次操作(通用算力) | AI 推理/训练 |
FLOPS | 每秒浮点运算次数(精度敏感) | 科学计算/HPC |
GOPS | 每秒十亿次操作(低算力设备) | 边缘计算 |