通信方式、点对点通信、集合通信-CSDN博客

本文链接：https://blog.csdn.net/LIZHUOLONG1/article/details/145420251

文章目录

B站视频

在这里插入图片描述

集合通讯思维导图：通信算法、通信链路、通信操作（原语）、通信域管理

在这里插入图片描述

传统组网互联

在这里插入图片描述

大模型组网互联：超高带宽、超低延迟、超高可靠性

在这里插入图片描述

☆☆☆ AI计算集群互联方式：Die间、片间、集群间

AI计算集群互联演变方式：Die间互联、片间、集群间

在这里插入图片描述

Die间：SoC架构转向 Chilplet 异构（多Die）、UCIe标准

在这里插入图片描述

IO Die & Base Die

在这里插入图片描述

在这里插入图片描述

一个die 一个rank

节点内 NPU 间互联：PCIe、共享内存、私有协议直连

在这里插入图片描述

在这里插入图片描述
形成一个环，执行一个 all reduce、reduce together、all gather 的操作，都是要形成一个环

Ascend 服务器形态

在这里插入图片描述
这一代还没有NVLink的出现

☆☆☆ 片内互联挑战与技术壁垒

在这里插入图片描述

其他AI厂商可以做AI芯片，AI芯片比较新
但是通讯这玩意儿，不是想做就能做的，国内估计只有华为能做
网络协议的适配，也需要大量的工程经验和技术积累的

Die间是已经有对应的技术标准的了
片间 AMD&谷歌提出的 UALink 协议

在这里插入图片描述

掌握片间高速互联网络和私有协议的公司，在AI训练服务器形成绝对垄断的地位！
华为这几年还是能走的非常的好

☆☆☆ 节点间互联：需要跨 RDMA 的就是1个节点

在这里插入图片描述

RDMA 主要实现方式，由第三方的公司可以买到！

在这里插入图片描述
__________________________

InfiniBand

在这里插入图片描述

RoCE

在这里插入图片描述

Altas 900 A2 PoD集群基础单元 - 计算节点

在这里插入图片描述

（1）NVIDIA NVL72 是一个机柜，那么这个机柜应该就属于是一个节点
（2）可能还不是，要是 L2 NVSwitch 的话还连接着别 NVL72 机柜，都是在NVSwitch下面，还没有跨RDMA 访问别的节点（可能是这个意思）

RDMA

在这里插入图片描述

（1）左边的图是TCP/IP，右边的是RDMA
（2）左边的几个蓝色方框，在传递的时候需要经过好几次的用户的内存拷贝，对大数据执行起来会非常的缓慢，数据量越大的时候，这个延迟是很难去接受的！
（3）而RDMA新的协议，就是用户直接跳过kernel层，直接传到远端的服务器，数据绕过CPU，直接通过RDMA设备，对远端的虚拟内存直接进行访问读和写；

（4）既然是机器间通信，那么不同机器间是通过以太网连接的
（5）Q：RDMA是通过网线连接的吗？
在这里插入图片描述

~

从硬件PCIE、NVLINK、RDMA原理到通信NCCL、MPI原理！

通信实现方式：机器内通信、机器间通信

计算机通网络通讯中最重要的两个衡量指标是：带宽、延迟

在这里插入图片描述

内存共享：比如多个应用共享手机里面的同一块内存
PCIe：最明显的方式就是 gpu 与 cpu 之间的通信，大部分都通过之间的PCIe插槽进行的
NVLink（直连模式）：GPU 与 GPU 之间进行一个互通

在这里插入图片描述
Q：不同机柜之间的GPU的访问，不是通过NVSwitch进行全互联的吗。那这个机器间的通信，都传输什么信息呢？通讯、互传数据、等待和同步相关的问题，这些信息是走什么传输的呢？
---- 如果是NVLink通信的话，它应该还是属于机器内通信，而不是机器间通讯（TCP/IP、RDMA）