本文分析一下C++原子变量和普通变量的区别,以及原子变量的底层原理。
本文涉及的代码测试环境:Microsoft Visual Studio Community 2022 、Windows 11、Intel x86-64。
本文内容如下:
- 原子变量和普通变量的功能区别
- 原子性底层原理
- 内存乱序问题原因
- 内存乱序解决方法
- std::memory_order_relaxed
- std::memory_order_seq_cst
- std::memory_order_acquire/release
- 普通变量和原子变量对比
- 总结
00 原子变量和普通变量的功能区别
相比普通变量,C++原子变量有如下两个基本特性:
- 原子变量的所有操作(fetch_add、store、load、compare_exchange_strong、exchange等)都具有原子性;
- 原子变量可以解决内存序问题,保证多个变量的可见性保持一定的一致性。
00.1 原子性
对于以上两个特性,原子性相对比较好理解:一个线程在进行某个原子变量操作时,系统中的所有线程,不可能观察到原子变量操作完成了一半;要么都完成了,要么都没开始。与通过互斥锁访问同一个数据的效果一样。
00.2 内存序
内存序问题,理解上会稍微困难一点。
简单来说,由于受到编译器的指令重排和CPU的微指令流水线乱序执行的影响,程序的代码顺序,可能与实际生效的顺序不一样。
01 原子性底层原理
这里我们对比一些原子变量和普通变量的汇编指令。
01.1 原子变量
测试代码:
int main() {
std::atomic_int32_t counter32;
counter32.fetch_add(10);
int32_t tmp = 10;
counter32.compare_exchange_strong(tmp, tmp + 1);
counter32.exchange(3);
counter32.store(15);
std::cout << counter32.load() << std::endl;
return 0;
}
使用Release配置生成,关键汇编代码如下:
fetch_add:
lock add dword ptr [counter32],0Ah
compare_exchange_strong:
mov ecx,0Bh // 参数2
mov eax,0Ah // 参数1
lock cmpxchg dword ptr [counter32],ecx
exchange:
mov ecx,3 // 参数1
xchg ecx,dword ptr [counter32]
store:
mov eax,0Fh // 参数1
xchg eax,dword ptr [counter32]
load:
mov edx,dword ptr [counter32]
这里fetch_add和compare_exchange_strong都使用了lock前缀。
lock前缀会对总线加锁,在总线加锁期间,其它CPU核心无法通过总线访问内存,直到该指令结束。
exchange和store函数使用了xchg汇编指令,该汇编指令自带lock效果。
load函数使用了普通的内存读取指令mov。
fetch_add、compare_exchange_strong、exchange和store都是变量写操作,通过对总线加锁来达到原子性的效果。如果另外线程需要读取数据(如load函数),只需要普通的内存读取指令即可。因为在总线加锁期间,读取操作会被阻塞。
01.2 普通变量
测试代码:
int normal(int32_t& counter32) {
// 专门引入运行时变量,