深入理解 compare_exchange_strong 与 compare_exchange_weak：原子操作的强弱之道

泡沫o0

已于 2025-06-09 22:27:38 修改

阅读量987

点赞数 17

CC 4.0 BY-SA版权

分类专栏： C/C++ 编程世界: 探索C/C++的奥妙文章标签： linux 开发语言 c++ 嵌入式性能优化 arm c++11

于 2025-06-09 22:20:07 首次发布

本文链接：https://blog.csdn.net/qq_21438461/article/details/148543236

C/C++ 编程世界: 探索C/C++的奥妙专栏收录该内容

683 篇文章

订阅专栏

在这里插入图片描述

深入理解 compare_exchange_strong 与 compare_exchange_weak：原子操作的强弱之道

在并发编程的世界里，原子操作如同微观世界的基本粒子，看似简单却蕴含着深刻的设计哲学。本文将深入探讨 C++ 中两个重要的原子操作：compare_exchange_strong 和 compare_exchange_weak，理解它们的底层原理、设计理念以及实际应用。

1. 基础概念与设计理念

1.1 原子操作的本质

原子操作是现代并发编程的基石。正如哲学家赫拉克利特所说"万物皆流，无物常驻"，在多线程环境中，共享数据的状态也在不断变化。原子操作为我们提供了一种在这种变化中寻求确定性的方法。

原子操作保证了操作的不可分割性，即要么完全执行，要么完全不执行。在 C++11 引入的原子库中，compare_exchange 操作是最为核心的原子操作之一，它实现了著名的 CAS（Compare-And-Swap）语义。

// 基本的 CAS 操作语义
// 如果 *object == expected，则将 desired 赋值给 *object
// 否则，将 *object 的当前值赋值给 expected
bool cas(T* object, T* expected, T desired);

1.2 CAS 操作的基本原理

CAS 操作的核心思想是"比较并交换"，它包含三个操作数：

内存位置（V）
预期原值（A）
新值（B）

整个操作的逻辑是：如果内存位置 V 的值与预期值 A 相等，则将内存位置 V 的值更新为 B；否则，不做任何操作。这个过程必须是原子的，不能被其他线程中断。

CAS 操作要素	说明	作用
内存位置 V	需要操作的共享变量地址	确定操作目标
预期值 A	期望该位置当前的值	检测是否被其他线程修改
新值 B	希望设置的新值	更新目标
返回值	操作是否成功	供调用者判断和重试

1.3 强弱语义的设计哲学

C++ 标准库提供了两种 CAS 变体：compare_exchange_strong 和 compare_exchange_weak。这种设计体现了"完美与效率之间的权衡"这一工程哲学。

compare_exchange_strong 保证了操作的确定性：

template<class T>
bool atomic<T>::compare_exchange_strong(T& expected, T desired,
                                       memory_order success,
                                       memory_order failure);

compare_exchange_weak 允许偶尔的"伪失败"：

template<class T>
bool atomic<T>::compare_exchange_weak(T& expected, T desired,
                                     memory_order success,
                                     memory_order failure);

两者的主要区别在于：strong 版本只有在值真正不匹配时才会失败，而 weak 版本即使在值匹配的情况下也可能失败（spurious failure）。这种设计的深层原因，我们将在下一章详细探讨。

2. 底层实现原理剖析

2.1 硬件层面的差异

在硬件层面，不同的处理器架构对 CAS 操作的实现有着显著差异。正如心理学家威廉·詹姆斯所说：“我们的信念帮助创造了它们所验证的事实”，硬件的设计理念也深刻影响着软件的实现方式。

x86/x64 架构

在 x86/x64 架构上，CAS 操作通过 CMPXCHG 指令实现：

; Intel x86 的 CMPXCHG 指令
; 比较 EAX 与目标操作数，相等则用源操作数替换目标
LOCK CMPXCHG [memory], register

这个指令是原子的，不会产生伪失败，因此在 x86 平台上，compare_exchange_weak 和 compare_exchange_strong 的底层实现几乎相同。

ARM 架构

ARM 架构使用 LL/SC（Load-Linked/Store-Conditional）机制：

; ARM 的 LL/SC 实现
retry:
    LDREX R1, [R0]      ; Load-Linked
    CMP R1, R2          ; 比较
    BNE fail           
    STREX R3, R4, [R0]  ; Store-Conditional
    CMP R3, #0          ; 检查是否成功
    BNE retry           ; 失败则重试

LL/SC 机制的特点是，在 LDREX 和 STREX 之间，如果有其他处理器访问了同一缓存行，STREX 就会失败，即使值没有被修改。这就是伪失败的硬件基础。

架构	CAS 实现机制	是否有伪失败	典型指令
x86/x64	直接 CAS 指令	否	CMPXCHG
ARM	LL/SC	是	LDREX/STREX
PowerPC	LL/SC	是	lwarx/stwcx
RISC-V	LR/SC	是	lr.w/sc.w

2.2 内存模型的影响

C++ 内存模型定义了多线程程序中内存操作的可见性和顺序性规则。CAS 操作可以指定不同的内存序（memory order），这会影响操作的性能和语义。

// 不同内存序的使用示例
std::atomic<int> flag{0};
int expected = 0;

// 顺序一致性（最强保证）
flag.compare_exchange_strong(expected, 1, 
                           std::memory_order_seq_cst,
                           std::memory_order_seq_cst);

// 获取-释放语义
flag.compare_exchange_strong(expected, 1,
                           std::memory_order_acq_rel,
                           std::memory_order_acquire);

// 松散内存序（最弱保证，最高性能）
flag.compare_exchange_weak(expected, 1,
                         std::memory_order_relaxed,
                         std::memory_order_relaxed);

内存序的选择会影响编译器和处理器的优化行为：

内存序	同步保证	性能影响	适用场景
memory_order_seq_cst	全局顺序一致	最低	需要严格顺序保证
memory_order_acq_rel	获取-释放语义	中等	同步点实现
memory_order_relaxed	仅保证原子性	最高	简单计数器

2.3 伪失败（Spurious Failure）机制

伪失败是 compare_exchange_weak 的核心特性。即使期望值与当前值相等，操作也可能返回 false。这种设计看似违反直觉，实则蕴含着深刻的性能考量。就像哲学家尼采所说：“那些杀不死我的，使我更强大”，伪失败机制虽然增加了编程复杂度，但在某些场景下能带来显著的性能提升。

伪失败的原因包括：

缓存行竞争：其他处理器访问了相同的缓存行
中断处理：操作被系统中断打断
调度切换：线程被操作系统调度器抢占
硬件限制：某些硬件的 LL/SC 实现有时间或指令数限制

// 处理伪失败的典型模式
template<typename T>
void update_with_weak(std::atomic<T>& target, T new_value) {
    T expected = target.load();
    // weak 版本通常在循环中使用
    while (!target.compare_exchange_weak(expected, new_value)) {
        // expected 已被更新为当前值
        // 可以根据新值决定是否继续尝试
        if (should_abort(expected)) {
            break;
        }
        // 计算新的 new_value（如果需要）
        new_value = compute_new_value(expected);
    }
}

3. 实战应用与性能优化

3.1 典型使用场景分析

理解了底层原理后，让我们探讨如何在实际项目中正确选择和使用这两种 CAS 操作。

场景一：无锁数据结构

在实现无锁栈、队列等数据结构时，CAS 操作是核心：

template<typename T>
class LockFreeStack {
    struct Node {
        T data;
        Node* next;
    };
    std::atomic<Node*> head;

public:
    void push(T data) {
        Node* new_node = new Node{std::move(data), nullptr};
        new_node->next = head.load(std::memory_order_relaxed);
        
        // 使用 weak 版本，因为我们本来就在循环中
        while (!head.compare_exchange_weak(new_node->next, new_node,
                                         std::memory_order_release,
                                         std::memory_order_relaxed)) {
            // new_node->next 自动更新为当前 head
        }
    }
    
    std::shared_ptr<T> pop() {
        Node* old_head = head.load(std::memory_order_relaxed);
        
        // 使用 strong 版本，避免不必要的循环
        while (old_head && 
               !head.compare_exchange_strong(old_head, old_head->next,
                                           std::memory_order_acquire,
                                           std::memory_order_relaxed)) {
            // old_head 自动更新
        }
        
        return old_head ? 
            std::make_shared<T>(std::move(old_head->data)) : nullptr;
    }
};

场景二：自旋锁实现

自旋锁是 CAS 操作的经典应用：

class SpinLock {
    std::atomic<bool> locked{false};
    
public:
    void lock() {
        bool expected = false;
        // 使用 weak 版本配合退避策略
        while (!locked.compare_exchange_weak(expected, true,
                                           std::memory_order_acquire,
                                           std::memory_order_relaxed)) {
            expected = false;
            // 退避策略：减少缓存行竞争
            while (locked.load(std::memory_order_relaxed)) {
                std::this_thread::yield();
            }
        }
    }
    
    void unlock() {
        locked.store(false, std::memory_order_release);
    }
};

3.2 性能考量与最佳实践

选择 strong 还是 weak 版本需要综合考虑多个因素。如同心理学中的"认知失调理论"告诉我们，当信念与现实冲突时，我们倾向于调整认知以减少不适感。在性能优化中，我们也需要根据实际测量结果调整我们的"直觉"。

考虑因素	compare_exchange_strong	compare_exchange_weak
使用复杂度	简单，无需处理伪失败	需要循环处理伪失败
性能特征	在 x86 上与 weak 相同	在 LL/SC 架构上可能更快
适用场景	单次尝试、条件复杂	循环重试、条件简单
代码可读性	更直观	需要额外的循环逻辑

性能测试示例：

#include <benchmark/benchmark.h>

static void BM_CompareExchangeStrong(benchmark::State& state) {
    std::atomic<int> counter{0};
    for (auto _ : state) {
        int expected = counter.load();
        while (!counter.compare_exchange_strong(expected, expected + 1,
                                              std::memory_order_relaxed)) {
            // expected 已更新
        }
    }
}

static void BM_CompareExchangeWeak(benchmark::State& state) {
    std::atomic<int> counter{0};
    for (auto _ : state) {
        int expected = counter.load();
        while (!counter.compare_exchange_weak(expected, expected + 1,
                                            std::memory_order_relaxed)) {
            // 包含伪失败的处理
        }
    }
}

BENCHMARK(BM_CompareExchangeStrong)->Threads(1)->Threads(4)->Threads(8);
BENCHMARK(BM_CompareExchangeWeak)->Threads(1)->Threads(4)->Threads(8);

3.3 常见陷阱与解决方案

在使用 CAS 操作时，有几个常见的陷阱需要避免：

陷阱一：ABA 问题

ABA 问题是指一个值从 A 变为 B，又变回 A，CAS 操作无法察觉这种变化：

// 问题示例
struct Node { int data; Node* next; };
std::atomic<Node*> top;

// 线程 1：pop 操作
Node* old_top = top.load();
// 此时线程被调度走...

// 线程 2：pop A, pop B, push A
// top 的值看起来没变，但实际上 old_top->next 可能已经无效

// 线程 1 继续：
if (top.compare_exchange_strong(old_top, old_top->next)) {
    // 危险！old_top->next 可能指向已释放的内存
}

解决方案：使用带版本号的指针或 hazard pointer：

template<typename T>
struct VersionedPointer {
    T* ptr;
    uint32_t version;
};

std::atomic<VersionedPointer<Node>> top;

陷阱二：活锁

过度使用 CAS 可能导致活锁，即线程不断重试但无法取得进展：

// 可能导致活锁的代码
void increment_counter(std::atomic<int>& counter) {
    int current = counter.load();
    // 高竞争下，这个循环可能执行很多次
    while (!counter.compare_exchange_weak(current, current + 1)) {
        // 没有退避策略
    }
}

解决方案：实现指数退避：

void increment_with_backoff(std::atomic<int>& counter) {
    int current = counter.load();
    int backoff = 1;
    
    while (!counter.compare_exchange_weak(current, current + 1)) {
        // 指数退避
        for (int i = 0; i < backoff; ++i) {
            std::this_thread::yield();
        }
        backoff = std::min(backoff * 2, 1024);
    }
}

总结

compare_exchange_strong 和 compare_exchange_weak 是现代并发编程的重要工具。理解它们的区别不仅需要掌握技术细节，更需要理解背后的设计哲学。strong 版本提供了确定性和简单性，而 weak 版本在某些架构上提供了更好的性能潜力。

选择使用哪个版本，需要根据具体的应用场景、目标硬件平台和性能需求来决定。在 x86 架构上，两者性能相近；而在 ARM 等使用 LL/SC 的架构上，weak 版本可能有优势。无论选择哪种，正确理解和处理其语义都是编写高效并发程序的关键。

记住，并发编程的艺术在于在正确性和性能之间找到平衡。就像建筑大师密斯·凡·德·罗所说：“少即是多”，有时候，接受 weak 版本的不确定性，反而能获得整体上更优雅高效的解决方案。

结语

在我们的编程学习之旅中，理解是我们迈向更高层次的重要一步。然而，掌握新技能、新理念，始终需要时间和坚持。从心理学的角度看，学习往往伴随着不断的试错和调整，这就像是我们的大脑在逐渐优化其解决问题的“算法”。

这就是为什么当我们遇到错误，我们应该将其视为学习和进步的机会，而不仅仅是困扰。通过理解和解决这些问题，我们不仅可以修复当前的代码，更可以提升我们的编程能力，防止在未来的项目中犯相同的错误。

我鼓励大家积极参与进来，不断提升自己的编程技术。无论你是初学者还是有经验的开发者，我希望我的博客能对你的学习之路有所帮助。如果你觉得这篇文章有用，不妨点击收藏，或者留下你的评论分享你的见解和经验，也欢迎你对我博客的内容提出建议和问题。每一次的点赞、评论、分享和关注都是对我的最大支持，也是对我持续分享和创作的动力。

最后，想特别推荐一下我出版的书籍——《C++编程之禅：从理论到实践》。这是对博主C++ 系列博客内容的系统整理与升华，无论你是初学者还是有经验的开发者，都能在书中找到适合自己的成长路径。从C语言基础到C++20前沿特性，从设计哲学到实际案例，内容全面且兼具深度，更加入了心理学和禅宗哲理，帮助你用更好的心态面对编程挑战。
本书目前已在京东、当当等平台发售，推荐前往“清华大学出版社京东自营官方旗舰店”选购，支持纸质与电子书双版本。希望这本书能陪伴你在C++学习和成长的路上，不断精进，探索更多可能！感谢大家一路以来的支持和关注，期待与你在书中相见。