DMA机制

炼就不死心

于 2025-06-22 11:39:42 发布

阅读量1.2k

点赞数 9

CC 4.0 BY-SA版权

文章标签：硬件架构 windows

DMA 是一种允许 硬件设备直接访问系统内存 而 无需 CPU 介入 的技术，用于高效传输大量数据（如网络包、磁盘 I/O、音视频流）。以下是其核心原理、工作流程及实际应用分析。

初始化阶段（CPU 参与）：
- CPU 配置 DMA 控制器（或设备内置的 DMA 引擎），指定：
  - 源地址（内存或设备缓冲区）。
  - 目标地址（设备寄存器或另一块内存）。
  - 传输长度（字节数）。
- 例如，网卡驱动初始化 DMA 描述符环（Descriptor Ring）。
数据传输阶段（硬件自主完成）：
- DMA 控制器或设备直接通过总线（如 PCIe）读写内存。
- 无需 CPU 参与，数据传输由硬件异步完成。
完成通知（中断或轮询）：
- DMA 传输完成后，硬件触发中断通知 CPU。
- CPU 处理后续逻辑（如释放内存、启动下一次传输）。

传统架构：主板上的独立芯片（如 Intel 8237 DMA 控制器）。
工作方式：
- CPU 配置 DMA 控制器的寄存器。
- 外设向 DMA 控制器发起请求（DREQ）。
- DMA 控制器接管总线，完成内存与外设的数据传输。
现代应用：部分嵌入式系统仍使用此方案。

现代架构：高性能设备（网卡、NVMe SSD、GPU）集成自己的 DMA 引擎。
优势：
- 更高带宽（通过 PCIe 总线直接访问内存）。
- 支持分散-聚集（Scatter-Gather）传输（非连续内存块操作）。
示例：
- 网卡的 Tx/Rx 描述符环（Descriptor Ring）。
- NVMe 的 PRP（Physical Region Page）列表。

分配 DMA 缓冲区：

void *dma_alloc_coherent(struct device *dev, size_t size, 
                        dma_addr_t *dma_handle, gfp_t flag);

分散-聚集（Scatter-Gather）传输：

int dma_map_sg(struct device *dev, struct scatterlist *sg, 
              int nents, enum dma_data_direction dir);

问题：CPU 缓存（Cache）与 DMA 内存可能不一致。
解决方案：
- 一致性内存（Coherent DMA）：CPU 和设备看到的地址一致（如 dma_alloc_coherent）。
- 流式 DMA（Streaming DMA）：需手动同步缓存（dma_sync_single_for_device）。

网卡驱动分配 DMA 描述符环（Descriptor Ring）：

struct dma_desc *tx_ring = dma_alloc_coherent(dev, size, &dma_addr, GFP_KERNEL);

将描述符的物理地址写入网卡寄存器：

writel(dma_addr, nic_reg_base + TX_RING_ADDR);

驱动将 sk_buff 的物理地址填入描述符：

tx_ring[i].addr = cpu_to_dma(skb->data);
tx_ring[i].len = skb->len;

通知网卡启动 DMA：

writel(DMA_START, nic_reg_base + TX_CTRL);

DMA 攻击：恶意设备通过 DMA 篡改内核内存（如 Thunderclap 漏洞）。
防护措施：
- IOMMU（Input-Output Memory Management Unit）：将设备 DMA 地址映射为虚拟地址，隔离设备访问权限。
- 内核选项 CONFIG_IOMMU_DEFAULT_DMA_STRICT。