AXI SmartConnect IP 详细介绍
概述
AXI SmartConnect 专为在 FPGA 和 SoC 系统中实现高性能、灵活的 AXI 互连设计,支持 AXI4、AXI3 和 AXI4-Lite 协议的内存映射接口,以及 AXI4-Stream 协议的流式接口。它通过自动优化网络拓扑、协议转换和数据宽度转换,提供低延迟、高吞吐量的互连解决方案,广泛应用于复杂系统,如 Zynq UltraScale+ MPSoC、Versal 架构、视频处理和 PCIe 通信。
AXI SmartConnect 的核心功能是作为多主多从设备的 AXI 互连中心,动态适配不同的协议、数据宽度、时钟域和突发特性,简化系统设计并优化性能。它集成了多项高级功能,如协议转换、数据宽度转换、时钟域转换和流水线优化,取代了传统的 AXI Interconnect IP(PG059),提供更高的灵活性和效率。
该 IP 核的主要功能包括:
- 多协议支持:兼容 AXI4、AXI3、AXI4-Lite 和 AXI4-Stream 协议。
- 动态互连:支持多主多从(N-to-M)拓扑,自动优化网络结构。
- 转换功能:提供协议转换、数据宽度转换和时钟域转换。
- 高性能优化:通过流水线寄存器和事务仲裁实现低延迟和高吞吐量。
主要特性
AXI SmartConnect IP 具有以下关键特性:
-
协议支持:
- 支持 AMBA AXI4、AXI3、AXI4-Lite 和 AXI4-Stream 协议。
- 支持以下互连模式:
- AXI4/AXI3 到 AXI4/AXI3(内存映射)。
- AXI4/AXI3 到 AXI4-Lite(控制接口)。
- AXI4-Stream 到 AXI4-Stream(流式传输)。
- 自动执行协议转换(如 AXI4 长突发到 AXI3 短突发)。
-
多主多从拓扑:
- 支持 N-to-M 互连(N 个主接口到 M 个从接口,N 和 M 可达 16 或更高)。
- 动态优化网络拓扑,减少冗余路径,提升吞吐量。
- 支持交叉开关(Crossbar)或共享总线(Shared Bus)架构,根据配置自动选择。
-
转换功能:
- 协议转换:
- AXI4 到 AXI3:分割长突发(256 节拍)为短突发(16 节拍)。
- AXI4/AXI3 到 AXI4-Lite:限制为单次传输。
- 数据宽度转换:
- 支持主从接口数据宽度不匹配(如 32 位到 128 位)。
- 自动执行数据打包(Upsizing)或拆分(Downsizing)。
- 时钟域转换:
- 支持跨时钟域(CDC)互连,主从接口可使用不同时钟(
aclk
和aclk1
)。 - 使用同步 FIFO 或异步 FIFO 确保数据一致性。
- 支持跨时钟域(CDC)互连,主从接口可使用不同时钟(
- 突发长度调整:
- 自动分割或合并突发,适配主从设备的需求。
- 协议转换:
-
性能优化:
- 流水线寄存器:
- 自动插入寄存器切片(Register Slice),优化时序性能。
- 支持 Fully Registered 或 Light Weight 模式(参考 PG373)。
- 事务仲裁:
- 支持轮询(Round-Robin)或优先级仲裁(Priority-Based)。
- 优化多主设备访问共享从设备的吞吐量。
- 低延迟设计:
- 最小化互连路径延迟,典型延迟 1-3 个时钟周期(不含 CDC)。
- 高吞吐量:
- 支持宽数据路径(最大 1024 位)和并行事务处理。
- 流水线寄存器:
-
时钟与复位:
- 支持单一时钟域(
aclk
)或多时钟域(aclk
和aclk1
)。 - 支持低电平有效复位(
aresetn
),同步到对应时钟。 - 最大频率:400 MHz(UltraScale+,-1 速度等级),更高频率支持 Versal 设备。
- 支持单一时钟域(
-
工具与设备支持:
- 设计工具:Vivado Design Suite。
- 支持设备:Artix-7、Kintex-7、Virtex-7、Zynq-7000、Kintex UltraScale、Virtex UltraScale、Zynq UltraScale+ MPSoC、Versal AI Core、Versal Premium、Versal Prime。
功能模块
AXI SmartConnect IP 的功能模块围绕互连管理、协议转换和性能优化设计,核心包括交叉开关、转换模块和时钟域管理。以下是主要模块及其功能:
1. 交叉开关模块
- 功能:实现多主多从的互连路由。
- 机制:
- 支持 N-to-M 交叉开关(Crossbar),动态路由主接口(SI)到从接口(MI)。
- 使用地址解码器(Address Decoder)将 SI 的事务映射到正确的 MI。
- 支持共享总线模式,减少资源占用(适用于低带宽场景)。
- 实现事务仲裁(轮询或优先级),管理多主设备的访问冲突。
- 应用:连接多个 AXI 主设备(如 DMA、处理器)到多个从设备(如 DDR、外围设备)。
2. 协议转换模块
- 功能:适配不同 AXI 协议的事务。
- 机制:
- AXI4 到 AXI3:
- 分割长突发(
ARLEN
/AWLEN
> 15)为多个短突发(≤ 15)。 - 映射锁定信号(
ARLOCK
/AWLOCK
)。
- 分割长突发(
- AXI4/AXI3 到 AXI4-Lite:
- 限制为单次传输(
ARLEN
/AWLEN
= 0)。 - 忽略突发信号(如
ARBURST
)。
- 限制为单次传输(
- AXI4-Stream:
- 维持
TVALID
/TREADY
握手,传递TDATA
、TLAST
等信号。
- 维持
- 使用有限状态机(FSM)管理事务转换时序。
- AXI4 到 AXI3:
- 应用:桥接不同协议的设备,如 AXI4 DMA 到 AXI3 外设。
3. 数据宽度转换模块
- 功能:适配主从接口的数据宽度差异。
- 机制:
- Upsizing:将窄数据(如 32 位)打包为宽数据(如 128 位)。
- Downsizing:将宽数据拆分为窄数据。
- 使用内部缓冲区(FIFO)管理数据对齐和字节选通(
WSTRB
)。 - 确保事务完整性,维护突发顺序和响应信号(
RRESP
/BRESP
)。
- 应用:连接不同数据宽度的设备,如 64 位处理器到 256 位 DDR 控制器。
4. 时钟域转换模块
- 功能:支持跨时钟域的事务传输。
- 机制:
- 使用异步 FIFO 或同步器(Synchronizer)桥接不同时钟域(
aclk
和aclk1
)。 - 确保 Valid-Ready 握手和数据信号的正确传递。
- 支持独立复位(
aresetn
)同步到对应时钟。
- 使用异步 FIFO 或同步器(Synchronizer)桥接不同时钟域(
- 应用:连接运行在不同时钟频率的模块,如 PL 和 PS。
5. 流水线优化模块
- 功能:插入寄存器切片,优化时序性能。
- 机制:
- 自动插入 Fully Registered 或 Light Weight 寄存器切片(参考 PG373)。
- 缩短关键路径,提升最大频率(Fmax)。
- 支持用户配置的流水线深度(典型 1-2 级)。
- 应用:支持高频率设计和长距离布线。
6. 时钟与复位模块
- 功能:管理时钟和复位信号。
- 机制:
- 时钟:支持单一
aclk
或多时钟(aclk
和aclk1
)。 - 复位:
aresetn
,低电平有效,同步到对应时钟。 - 支持单一或多时钟域设计,简化时序管理。
- 时钟:支持单一
- 应用:确保与 AXI 系统时钟和复位一致。
接口信号
以下是 AXI SmartConnect IP 的主要接口信号及其功能:
-
AXI 从接口(S_AXI,S00_AXI 到 S15_AXI):
- 类型:AXI4、AXI3、AXI4-Lite 或 AXI4-Stream 从接口,接收主设备的信号。
- 信号(以 AXI4 为例,AXI3、AXI4-Lite 和 AXI4-Stream 为子集):
- 读地址通道:
S00_AXI_ARADDR[C_ADDR_WIDTH-1:0]
:读地址(32 或 64 位)。S00_AXI_ARVALID
、ARREADY
:读地址握手。S00_AXI_ARLEN[7:0]
:突发长度(AXI4:0-255;AXI3:0-15)。S00_AXI_ARSIZE[2:0]
:传输大小。S00_AXI_ARBURST[1:0]
:突发类型(INCR、WRAP、FIXED)。S00_AXI_ARID[C_ID_WIDTH-1:0]
:事务 ID。
- 读数据通道:
S00_AXI_RDATA[C_DATA_WIDTH-1:0]
:读数据(32-1024 位)。S00_AXI_RRESP[1:0]
:读响应(OKAY、SLVERR、DECERR)。S00_AXI_RVALID
、RREADY
:读数据握手。S00_AXI_RID[C_ID_WIDTH-1:0]
:读事务 ID。
- 写地址通道:
S00_AXI_AWADDR
、AWVALID
、AWREADY
、AWLEN
、AWSIZE
、AWBURST
、AWID
:写地址参数。
- 写数据通道:
S00_AXI_WDATA
、WVALID
、WREADY
:写数据握手。S00_AXI_WSTRB[C_DATA_WIDTH/8-1:0]
:写选通。S00_AXI_WLAST
:突发最后一拍。
- 写响应通道:
S00_AXI_BRESP
、BVALID
、BREADY
:写响应。S00_AXI_BID
:写事务 ID。
- AXI4-Stream 通道:
S00_AXI_TDATA[C_DATA_WIDTH-1:0]
:流数据。S00_AXI_TVALID
、TREADY
:流握手。S00_AXI_TLAST
:包结束标志。S00_AXI_TKEEP[C_DATA_WIDTH/8-1:0]
:字节有效信号。
- 读地址通道:
- 功能:接收主设备的事务或流信号。
- 参数:
C_S_AXI_PROTOCOL
:协议类型(0=AXI4,1=AXI3,2=AXI4-Lite,3=AXI4-Stream)。C_ADDR_WIDTH
:地址宽度。C_DATA_WIDTH
:数据宽度。C_ID_WIDTH
:事务 ID 宽度。
-
AXI 主接口(M_AXI,M00_AXI 到 M15_AXI):
- 类型:AXI4、AXI3、AXI4-Lite 或 AXI4-Stream 主接口,输出转换后的信号。
- 信号:与
S_AXI
类似,但方向相反。 - 功能:将事务或流信号传递到从设备。
- 参数:同
S_AXI
,但数据宽度或协议可能不同。
-
时钟与复位接口:
aclk
:主时钟,驱动 SI 和部分 MI 接口。aclk1
(可选):辅助时钟,用于跨时钟域的 MI 接口。aresetn
:低电平有效复位,同步到对应时钟。- 功能:提供时钟和复位控制。
配置方法
1. 在 Vivado 中添加 IP
- 添加 AXI SmartConnect:
- 在 Vivado IP Catalog 中搜索 AXI SmartConnect,添加到设计。
- 双击 IP 核,打开定制化对话框。
- 配置参数:
- 拓扑配置:
C_NUM_SI
:从接口数量(1-16)。C_NUM_MI
:主接口数量(1-16)。
- 协议配置:
C_Sxx_AXI_PROTOCOL
:每个从接口协议(AXI4、AXI3、AXI4-Lite、AXI4-Stream)。C_Mxx_AXI_PROTOCOL
:每个主接口协议。
- 接口参数:
C_Sxx_AXI_DATA_WIDTH
:从接口数据宽度(32-1024 位)。C_Mxx_AXI_DATA_WIDTH
:主接口数据宽度。C_Sxx_AXI_ADDR_WIDTH
:地址宽度(32 或 64 位)。C_Sxx_AXI_ID_WIDTH
:事务 ID 宽度(0-32 位)。
- 时钟配置:
C_COMMON_CLOCK
:启用单一时钟(0=多时钟,1=单一时钟)。C_ACLK_RATIO
:主从时钟频率比率(若多时钟)。
- 性能优化:
C_REG_CONFIG
:寄存器切片模式(Fully Registered、Light Weight、Bypass)。C_ARBITRATION_SCHEME
:仲裁策略(Round-Robin 或 Priority-Based)。
- 地址映射:
- 配置每个 MI 的基地址和地址范围(
C_Mxx_AXI_BASE_ADDRESS
、C_Mxx_AXI_HIGH_ADDRESS
)。
- 配置每个 MI 的基地址和地址范围(
- 拓扑配置:
- RTL 生成:
- Vivado 生成 Verilog 代码,实例化互连逻辑和转换模块。
- 输出文件位于项目目录(如
project_name.srcs/sources_1/ip/axi_smartconnect
)。
2. 连接与驱动
- 硬件连接:
- S_AXI:
- 连接到 AXI 主设备(如 Zynq PS、AXI DMA)或 AXI4-Stream 主设备(如 VDMA)。
- M_AXI:
- 连接到 AXI 从设备(如 DDR 控制器、GPIO)或 AXI4-Stream 从设备(如视频处理模块)。
- 分配时钟和复位:
aclk
:连接到主时钟源。aclk1
(若启用):连接到辅助时钟源。aresetn
:连接到主从接口的复位信号。
- 使用 Vivado 地址编辑器为每个 MI 分配地址空间。
- S_AXI:
- 驱动程序:
- AXI SmartConnect 为透明互连 IP,无需专用驱动。
- 依赖主从设备的驱动程序,事务通过 SmartConnect 透明传递。
- 配合 Vivado ILA(集成逻辑分析仪)验证互连性能。
3. 仿真与验证
- 仿真环境:
- 使用 Vivado Simulator 或 ModelSim 进行 RTL 仿真。
- 编写 Verilog 测试平台,驱动多个 SI 接口信号(如
S00_AXI_ARADDR
、S00_AXI_TDATA
)。 - 使用 AXI Verification IP(PG267)生成激励,验证协议转换和数据完整性。
- 验证内容:
- 检查协议转换:验证 AXI4 到 AXI3 的突发分割、AXI4 到 AXI4-Lite 的单次传输。
- 验证数据宽度转换:确认 32 位到 128 位的打包/拆分正确。
- 测试时钟域转换:确保跨时钟域事务无数据丢失。
- 验证仲裁:检查多主设备访问共享从设备的顺序和吞吐量。
- 确保 AXI4-Stream 的
TVALID
/TREADY
和TLAST
行为正确。
- 波形分析:
- 使用 Vivado 波形查看器分析 SI 和 MI 信号。
- 确认事务路由、转换和流水线延迟符合预期。
- 检查时序裕量(参考 Vivado 时序报告)。
资源利用情况
AXI SmartConnect 的资源占用取决于接口数量、协议类型、数据宽度和优化配置。以下是典型资源利用情况(基于 7 系列、UltraScale 和 Zynq 设备,Vivado 综合):
- 资源类型:
- LUT(查找表):500-5000,取决于接口数量和转换复杂性。
- FF(触发器):1000-10000,与 LUT 占用相关。
- BRAM:0-4,根据 FIFO 配置(跨时钟域)。
- DSP 切片:0(不使用)。
- 配置示例:
- 4 SI 到 2 MI,AXI4,64 位数据宽度,单一时钟:约 1000 LUT、2000 FF。
- 8 SI 到 4 MI,AXI4+AXI4-Lite,128 位数据宽度,多时钟:约 3000 LUT、6000 FF、2 BRAM。
- 2 SI 到 2 MI,AXI4-Stream,256 位数据宽度:约 800 LUT、1500 FF。
- 最大频率:
- 7 系列(-1 速度等级):250 MHz。
- UltraScale+:400 MHz 或更高。
应用场景
AXI SmartConnect IP 适用于以下场景:
-
复杂 SoC 系统:
- 在 Zynq UltraScale+ MPSoC 或 Versal 中,连接 PS(处理器系统)与 PL(可编程逻辑)的多外设网络。
- 支持多核处理器与 DDR 控制器、DMA 和外设的互连。
-
视频处理:
- 在 AXI4-Stream 视频流水线中,连接 VDMA、视频处理模块和显示接口。
- 支持高带宽视频流(如 4K、8K)的数据传输。
-
PCIe 通信:
- 在 PCIe 设计中,连接 PL 侧 DMA 到 PS 或外部存储器。
- 支持多主设备的事务路由和协议转换。
-
高性能计算:
- 在 Versal AI Core 中,连接多个加速器到共享内存。
- 优化宽数据路径(如 512 位、1024 位)的吞吐量。
-
跨时钟域设计:
- 桥接运行在不同时钟频率的模块,如 PL(200 MHz)和 PS(400 MHz)。
- 支持动态时钟管理的嵌入式系统。
注意事项
-
协议配置:
- 确保
C_Sxx_AXI_PROTOCOL
和C_Mxx_AXI_PROTOCOL
与主从设备匹配。 - AXI4-Lite 不支持突发,勿配置突发相关参数(如
ARLEN
、AWLEN
)。
- 确保
-
接口数量:
- 限制 SI 和 MI 数量(≤16),避免资源占用过高。
- 对于简单拓扑,考虑使用共享总线模式以减少 LUT 和 FF。
-
时钟与复位:
- 确保
aclk
和aclk1
(若启用)与主从接口时钟同步。 aresetn
需保持至少 16 个时钟周期,同步释放以防亚稳态。
- 确保
-
地址映射:
- 正确配置 MI 的地址范围,避免事务路由错误。
- 使用 Vivado 地址编辑器验证地址分配。
-
性能优化:
- 启用 Fully Registered 模式以提升 Fmax,但注意增加的延迟。
- 根据带宽需求调整数据宽度和仲裁策略。
总结
AXI SmartConnect IP(PG247)是一款高性能的 AXI 互连软核,支持 AXI4、AXI3、AXI4-Lite 和 AXI4-Stream 协议,通过动态拓扑优化、协议转换、数据宽度转换和时钟域转换,简化复杂 SoC 系统设计。其低延迟、高吞吐量和灵活配置使其成为 Zynq MPSoC、Versal 架构、视频处理和 PCIe 通信的理想选择。
用户在配置时需注意协议类型、接口数量、时钟设置和地址映射,合理优化流水线和仲裁策略,并通过仿真验证互连性能。结合 Vivado 工具、AXI Verification IP 和 ILA 调试,AXI SmartConnect 可显著提升系统性能和设计效率。
FPGA设计工具推荐
-
SZ901:
SZ901 是一款基于XVC协议的FPGA网络下载器。- 最高支持53M
- 支持4路JTAG独立使用
- 支持端口合并
- 支持国产FLASH烧写
- 下载器无限扩展
- 配备专属程序固化软件,一键烧写,能大大减小程序固化时间!
-
SZ501(PRO_A7):
- SZ501 是一款适合初学者FPGA开发板,包含低速高速接口!
- 双网口(RGMII)
- 双SFP+
- DDR
- UART
- IIC