Il co-fondatore e CEO di Nvidia Jensen Huang ha presentato il superchip AI Vera Rubin alla GPU Technology Conference di Washington, segnando il passaggio dell’azienda all’hardware AI nel mezzo del boom dell’intelligenza artificiale, aumentandone il valore di mercato a quasi 5 trilioni di dollari. La piattaforma Vera Rubin è destinata ai carichi di lavoro di intelligenza artificiale generativa ad alta intensità. Integra una singola CPU Vera dotata di 88 core ARM personalizzati che supportano 176 thread. Questa CPU si accoppia con due GPU Rubin per raggiungere fino a 100 petaFLOPS di prestazioni di calcolo FP4. Come computer rack-scale Nvidia di terza generazione NVLink 72, Vera Rubin succede ai modelli GB200 e GB300. Il sistema utilizza il raffreddamento a liquido e incorpora sei trilioni di transistor. Include inoltre 2 TB di memoria SOCAMM2 a bassa latenza per gestire in modo efficiente attività di elaborazione AI impegnative. Nella sua configurazione di base, Vera Rubin fornisce circa 100 volte le prestazioni di calcolo grezze rispetto al DGX-1 basato su Volta. Quella piattaforma precedente, il sistema di deep learning iniziale di Nvidia, ha fornito 170 teraflop di prestazioni di picco FP16. Questo aumento sostanziale sottolinea l’evoluzione della capacità computazionale per le applicazioni di intelligenza artificiale nel corso degli anni. Nvidia prevede di rilasciare Vera Rubin in varie configurazioni per soddisfare le diverse esigenze. La configurazione NVL144 include due GPU delle dimensioni di un reticolo, che consentono fino a 3,6 exaflop di inferenza FP4 e 1,2 exaflop di prestazioni di allenamento FP8. Per funzionalità avanzate, la configurazione NVL144 CPX raggiunge 8 exaflop, che rappresentano 7,5 volte la potenza dei sistemi GB300 NVL72 dell’attuale generazione. Per soddisfare i requisiti dei data center iperscalabili per l’elaborazione di carichi di lavoro di contesto modello più ampi, Nvidia introduce il sistema Rubin Ultra NVL576. Questa variante utilizza quattro GPU delle dimensioni di un reticolo insieme a un massimo di 365 TB di memoria ad alta velocità. Fornisce fino a 15 exaflop di inferenza FP4 e 5 exaflop di prestazioni di allenamento FP8, che equivalgono a un aumento di 8 volte rispetto al GB300. Ogni GPU Rubin è composta da due chiplet di elaborazione e otto stack di memoria HBM4, ottimizzando il throughput dei dati e il calcolo. La scheda GPU dispone di cinque connettori backplane NVLink. Due connettori nella parte superiore collegano le GPU allo switch NVLink per l’interconnettività ad alta velocità. I tre connettori inferiori gestiscono l’erogazione di potenza, l’interfaccia PCIe e la connettività CXL per supportare l’integrazione all’interno di sistemi più ampi. Huang prevede che le GPU Rubin entreranno in produzione di massa durante la seconda metà del 2026. Il lancio dei sistemi NVL144 è previsto per la fine del 2026 o all’inizio del 2027. Nel frattempo, i sistemi NVL576 dovrebbero diventare disponibili nella seconda metà del 2027, in linea con la roadmap di Nvidia per il progresso dell’infrastruttura AI. https://www.youtube.com/watch?v=lQHK61IDFH4





