高性能并发编程：深入理解无锁环形缓冲队列

原创于 2025-07-10 09:09:25 发布 · 992 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#C #队列 #并发

C/C++ 专栏收录该内容

24 篇文章

订阅专栏

高性能并发编程：深入理解无锁环形缓冲队列（Lock-Free Ring Buffer）

本文完整深入讲解如何实现一个 无锁（Lock-Free）高并发的环形缓冲队列（Ring Buffer）。涵盖原理、源码、内存模型、CPU缓存优化、线程安全性分析及常见坑点，最终构建出一个 高性能、工业级可用的组件。

📌 背景介绍

在现代高并发系统中，如实时音视频、网络包处理、传感器数据采集、任务调度等场景，传统的互斥锁（mutex）已成为性能瓶颈。而环形缓冲队列（Ring Buffer）以其固定内存、无碎片、无锁访问等优点，成为构建高性能组件的首选。

📌 核心设计目标

💡 无锁（Lock-Free）设计，避免阻塞
💡 固定容量、连续内存，零内存申请
💡 支持并发安全访问
💡 支持扩展为 MPSC / MPMC 等模型
💡 支持放入定长数据或指针

📌 数据结构详解

typedef struct {
    size_t capacity;
    size_t mask;
    void **buffer;
    _Atomic size_t head;
    _Atomic size_t tail;
} ring_buffer_t;

通过 head 与 tail 控制数据流动。

容量应为 2 的幂以提升性能。

📌 内存模型与原子操作

内存顺序说明

顺序类型	含义
`relaxed`	无同步限制
`acquire`	保证后续操作可见
`release`	保证之前操作可见
`seq_cst`	强一致性顺序

原子操作示例

atomic_store_explicit(&rb->tail, tail + 1, memory_order_release);

📌 入队与出队实现细节

入队

bool ring_buffer_push(ring_buffer_t *rb, void *data) {
    size_t tail = atomic_load_explicit(&rb->tail, memory_order_relaxed);
    size_t head = atomic_load_explicit(&rb->head, memory_order_acquire);
    if ((tail - head) >= rb->capacity) return false;
    rb->buffer[tail & rb->mask] = data;
    atomic_store_explicit(&rb->tail, tail + 1, memory_order_release);
    return true;
}

出队

bool ring_buffer_pop(ring_buffer_t *rb, void **data) {
    size_t head = atomic_load_explicit(&rb->head, memory_order_relaxed);
    size_t tail = atomic_load_explicit(&rb->tail, memory_order_acquire);
    if (head == tail) return false;
    *data = rb->buffer[head & rb->mask];
    atomic_store_explicit(&rb->head, head + 1, memory_order_release);
    return true;
}

📌 性能优化：缓存行对齐与伪共享

typedef struct {
    alignas(64) _Atomic size_t head;
    char pad1[64 - sizeof(size_t)];
    alignas(64) _Atomic size_t tail;
    char pad2[64 - sizeof(size_t)];
} ring_buffer_t;

📌 多线程扩展模型（MPSC、MPMC）

MPSC

使用 atomic_fetch_add() 修改 tail，保证多个生产者安全。

MPMC

需要使用 compare_exchange_weak 等 CAS 原语，复杂度增加。

📌 支持定长二进制数据的缓冲区

修改结构如下：

typedef struct {
    uint8_t *buffer;
    size_t elem_size;
    ...
} ring_buffer_bin_t;

写入数据时使用：

memcpy(rb->buffer + (tail & rb->mask) * rb->elem_size, data, rb->elem_size);

📌 错误处理与可用性增强

ring_buffer_is_full()
ring_buffer_is_empty()
ring_buffer_peek()
ring_buffer_clear()

📌 应用场景与实践经验

嵌入式数据采集（实时、低功耗）
多线程日志模块
网络通信中的包缓冲

📌 完整代码示例

ring_buffer_t *rb = ring_buffer_create(1024);

void producer() {
    for (int i = 0; i < 10000; ++i) {
        int *item = malloc(sizeof(int));
        *item = i;
        while (!ring_buffer_push(rb, item));
    }
}

void consumer() {
    void *item;
    while (true) {
        if (ring_buffer_pop(rb, &item)) {
            printf("Got: %d\n", *(int *)item);
            free(item);
        }
    }
}