NVIDIA NVLink Fusion

Infrastruttura IA semi-personalizzata con prestazioni di scalabilità IA collaudate nel settore e architettura rack-scale.

Panoramica

Fabbriche IA semi-personalizzate con NVLink Fusion

NVIDIA NVLink™ Fusion è la tecnologia connettiva e l'IP ad alta larghezza di banda e bassa latenza che consente agli hyperscaler e ai nativi dell'IA di distribuire XPU e CPU personalizzate nella piattaforma di infrastruttura IA leader mondiale di NVIDIA. Sfrutta lo stack tecnologico e l'ecosistema collaudati di NVIDIA, nonché l'architettura su scala rack MGX, per ridurre la complessità dello sviluppo, aumentare le prestazioni e accelerare il time-to-market per le fabbriche IA semi-personalizzate. Standardizzandosi su una singola architettura unificata, NVLink Fusion semplifica le operazioni nel data center, consente la riallocazione flessibile della capacità del data center e permette alle XPU personalizzate di integrarsi perfettamente con le GPU per il calcolo eterogeneo. 

AWS integra l'infrastruttura IA con NVIDIA NVLink Fusion per la distribuzione di Trainium4

Scopri come AWS utilizza NVLink Fusion per accelerare la distribuzione di Trainium4.

Integrare il calcolo semi-personalizzato nell'architettura rack-scale con NVIDIA NVLink Fusion

Scopri come NVIDIA NVLink Fusion consente agli hyperscaler di creare un'infrastruttura IA semi-personalizzata, integrando i propri ASIC o CPU con le GPU NVIDIA, standardizzando al contempo su una singola infrastruttura hardware scalabile.

Utilizzando NVLink Fusion, le fabbriche IA ad alte prestazioni possono scalare rapidamente, beneficiando di tutti i componenti della soluzione che costituiscono l'architettura NVIDIA rack-scale.

Vantaggi

Vantaggi di NVLink Fusion

Prestazioni di scalabilità di livello mondiale

Sbloccare il pieno potenziale delle fabbriche IA richiede una comunicazione rapida e fluida tra tutti gli acceleratori. NVIDIA NVLink 6 può connettere 72 XPU all-to-all a 3,6 TB/s per XPU, con configurazioni di roadmap future che includono dimensioni di dominio fino a 1.152, per aumentare le prestazioni dell'IA e il ritorno sull'investimento.

Ecosistema tecnologico e supply chain collaudati in produzione

L'ecosistema completo della tecnologia NVLink Fusion, tra cui partner di progettazione XPU, partner CPU e fornitori IP, aiuta gli hyperscaler e i nativi IA a ottimizzare i progetti XPU e a semplificare lo sviluppo. L'ecosistema MGX fornisce un'architettura completa a livello di rack e collega gli hyperscaler degli utenti alla stessa supply chain collaudata utilizzata da NVIDIA per i propri sistemi basati su MGX, eliminando la complessità dei nuovi design di rack e della gestione dei fornitori e accelerando il time-to-market.

Reprovisioning flessibile e mitigazione dei rischi di distribuzione

Un vantaggio chiave dell'adozione dell'architettura rack MGX è che i sistemi basati su XPU e GPU (come Vera Rubin NVL72) possono essere facilmente progettati nello stesso data center, condividendo gli stessi rack e ingombri dei rack, la rete, il raffreddamento, l'alimentazione e i sistemi di gestione. Questo approccio unificato consente agli utenti di NVLink Fusion di separare il design e la costruzione dei data center dalla disponibilità e dalla fornitura del silicio, oltre a permettere loro di effettuare il reprovisioning della capacità del data center con un mix diverso di sistemi basati su XPU o GPU in base all'evoluzione delle esigenze.

Architettura unificata per l'infrastruttura IA eterogenea

Gli utenti di NVLink Fusion possono distribuire diversi tipi di XPU, o XPU e GPU, nello stesso data center per il calcolo eterogeneo per l'inferenza disaggregata e altri carichi di lavoro asimmetrici.

Ne risulta una singola fabbrica IA semi-personalizzata che nessuna azienda potrebbe creare da sola.

Piattaforma

Tecnologia NVIDIA NVLink Fusion

NVIDIA NVLink

NVIDIA NVLink 6 e NVLink Switch Chip consentono 260 TB/s di larghezza di banda in un singolo dominio NVLink a 72 acceleratori (NVL72) e offrono un'efficienza 4 volte superiore della larghezza di banda con il supporto NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8.

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C estende la tecnologia NVLink leader di settore all'interconnessione chip-to-chip. Ciò consente la creazione di una nuova classe di prodotti integrati con i partner NVIDIA, realizzati tramite chiplet, consentendo alle GPU o alle CPU NVIDIA di avere una connessione coerente ad alta larghezza di banda con silicio personalizzato.

Piattaforma di infrastruttura IA

NVIDIA fornisce un portfolio modulare di tecnologie per fabbriche IA, tra cui GPU NVIDIA, CPU NVIDIA Vera, switch ottici co-packaged (CPO), ConnectX® SuperNICs™, DPU BlueField® e software Mission Control™ per l'ottimizzazione dei flussi di lavoro IA e la gestione dell'infrastruttura IA.

Sono inoltre disponibili soluzioni a rack completo per l'integrazione delle fabbriche IA semi-personalizzate, tra cui il rack Vera Rubin NVL72, che può essere combinato con sistemi basati su XPU per l'inferenza disaggregata, il rack CPU Vera per il supporto dei sistemi di IA agentica e dell'apprendimento per rinforzo, il rack NVIDIA LPX per l'inferenza ad alto contesto e a bassa latenza, il rack NVIDIA STX per lo storage nativo IA e il rack NVIDIA SPX per la rete scale-out.

Utilizzatori

Ecosistema NVLink Fusion

Scalare le prestazioni dell'inferenza IA con NVLink Fusion

Scopri come NVIDIA NVLink Fusion affronta le crescenti esigenze dei modelli IA complessi.