【RDMA】无损网络 RoCE v2

 1.什么是QoS

QoS是一种机制,它给一个网络流赋予一个优先级,并且管理它的最低需求(guarantees),极限能力(limitations)和它相比其他网络流的优先级服务。这是通过一个2/3阶段的过程将用户层的优先级映射到一个硬件层流量类(hardware Traffic Class)上实现的。流量类(traffic class)被赋予QoS属性(缓存分配,流控制,排队,调度,随机早期检测,显式拥塞通知等等),并且不同的流按照这些对应的属性被服务。

2.为什么RoCE网络需要QoS

为什么需要无损网络:长期以来,HPC(高性能计算)的RDMA都是在Infiniband集群中使用,数据包丢失在此类群集中很少见,因此RDMA Infiniband传输层(在NIC上实现)的重传机制很简陋,既:go-back-N重传,但是现在RDMA的使用更广泛,在其他网络中,丢包的概率大于Infiniband集群,一旦丢包,使用RDMA的go-back-N重传机制效率非常低,会大大降低RDMA的传输效率,所以要想发挥出RDMA真正的性能,势必要为RDMA搭建一套不丢包的无损网络环境,而Qos是确保网络不丢包的手段之一。

go-back-N重传,见2.1 Infiniband RDMA and RoCE:https://blog.csdn.net/bandaoyu/article/details/115620365

### ROCE V2与InfiniBand(IB)网络协议特点和差异 #### 一、基础特性对比 对于ROCE V2而言,其作为RDMA over Converged Ethernet版本二的技术实现,在继承了RoCE v1的基础上进行了改进。具体来说,RoCE v2通过修改数据包封装方式引入了IP和UDP头部信息,这使得它不仅能在Layer 2 (L2) 层面工作,还能够跨越Layer 3 (L3),即三层路由边界运行[^3]。 相比之下,传统的IB交换体系架构利用了RDMA技术,提供了高性能低延迟的HPC网络解决方案,并拥有自己独特的架构体系及IB特定协议规范[^1]。这意味着InfiniBand不仅仅是一种简单的通信机制,更是一套完整的端到端解决方案,涵盖了从物理层直到应用层面的各种细节规定。 #### 二、性能表现分析 当涉及到实际应用场景中的性能指标时,两者各有千秋: - **延迟方面**:由于InfiniBand采用了专门优化过的硬件组件以及精简版TCP/IP栈处理流程,因此通常情况下能提供更低的数据传输延迟。 - **带宽利用率**:得益于无损以太网技术和PFC(优先级流控制)、ECN(显式拥塞通知)等功能的支持,即使是在标准Ethernet基础设施之上构建起来的RoCE v2也能达到相当高的链路效率;不过需要注意的是,这些功能的有效性依赖于整个网络环境中所有设备的良好配置和支持情况[^4]。 #### 三、部署灵活性考量 关于哪一种方案更适合具体的业务需求,则取决于多个因素: - 对于那些已经具备成熟稳定的纯Ethernet环境的企业来说,采用RoCE v2可能意味着较低的成本投入和技术门槛,因为不需要额外购置专用硬件即可享受到接近原生IB水平的服务质量; - 而如果目标是追求极致计算密集型任务下的最佳效能——比如大规模分布式存储集群或是超级计算机内部互联——那么基于专有设计思路打造而成的InfiniBand无疑会成为首选项之一[^2]。 ```python # Python伪代码用于展示两种协议下发送消息的方式区别 def send_message_roce_v2(message, destination_ip): packet = create_udp_packet_with_ip_header(message, destination_ip) transmit(packet) def send_message_ib(message, qpn): # Queue Pair Number ib_send_request(qpn=qpn, data=message) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值