C++原子变量和普通变量的区别及原子变量的底层原理

本文链接：https://blog.csdn.net/ProComing/article/details/144067672

本文分析一下C++原子变量和普通变量的区别，以及原子变量的底层原理。
本文涉及的代码测试环境：Microsoft Visual Studio Community 2022 、Windows 11、Intel x86-64。
本文内容如下：

原子变量和普通变量的功能区别
原子性底层原理
内存乱序问题原因
内存乱序解决方法
std::memory_order_relaxed
std::memory_order_seq_cst
std::memory_order_acquire/release
普通变量和原子变量对比
总结

00 原子变量和普通变量的功能区别

相比普通变量，C++原子变量有如下两个基本特性：

原子变量的所有操作（fetch_add、store、load、compare_exchange_strong、exchange等）都具有原子性；
原子变量可以解决内存序问题，保证多个变量的可见性保持一定的一致性。

00.1 原子性

对于以上两个特性，原子性相对比较好理解：一个线程在进行某个原子变量操作时，系统中的所有线程，不可能观察到原子变量操作完成了一半；要么都完成了，要么都没开始。与通过互斥锁访问同一个数据的效果一样。

00.2 内存序

内存序问题，理解上会稍微困难一点。

简单来说，由于受到编译器的指令重排和CPU的微指令流水线乱序执行的影响，程序的代码顺序，可能与实际生效的顺序不一样。

01 原子性底层原理

这里我们对比一些原子变量和普通变量的汇编指令。

01.1 原子变量

测试代码：

int main() {
   
  std::atomic_int32_t counter32;
  counter32.fetch_add(10);
  int32_t tmp = 10;
  counter32.compare_exchange_strong(tmp, tmp + 1);
  counter32.exchange(3);
  counter32.store(15);
  std::cout << counter32.load() << std::endl;
  return 0;
}

使用Release配置生成，关键汇编代码如下：

fetch_add:
lock add    dword ptr [counter32],0Ah

compare_exchange_strong:
mov         ecx,0Bh // 参数2
mov         eax,0Ah // 参数1
lock cmpxchg dword ptr [counter32],ecx

exchange:
mov         ecx,3 // 参数1
xchg        ecx,dword ptr [counter32]

store:
mov         eax,0Fh // 参数1
xchg        eax,dword ptr [counter32]

load:
mov         edx,dword ptr [counter32]

这里fetch_add和compare_exchange_strong都使用了lock前缀。
lock前缀会对总线加锁，在总线加锁期间，其它CPU核心无法通过总线访问内存，直到该指令结束。
exchange和store函数使用了xchg汇编指令，该汇编指令自带lock效果。
load函数使用了普通的内存读取指令mov。
fetch_add、compare_exchange_strong、exchange和store都是变量写操作，通过对总线加锁来达到原子性的效果。如果另外线程需要读取数据（如load函数），只需要普通的内存读取指令即可。因为在总线加锁期间，读取操作会被阻塞。

01.2 普通变量

测试代码：

int normal(int32_t& counter32) {
   
  // 专门引入运行时变量，