Microsoft annunciato il chip Maia 200 lunedì per scalare l’inferenza AI, con oltre 100 miliardi di transistor per velocità più elevate ed efficienza maggiore rispetto al Maia 100 del 2023. Il Maia 200 offre più di 10 petaflop con precisione a 4 bit e circa 5 petaflop con prestazioni a 8 bit. Microsoft lo definisce un cavallo di battaglia in silicio progettato specificamente per attività di inferenza AI. Questo processo prevede l’esecuzione di modelli di intelligenza artificiale addestrati per generare risultati, distinti dalla fase di formazione che costruisce tali modelli. Con l’espansione delle operazioni di intelligenza artificiale, l’inferenza rappresenta ora una quota crescente delle spese totali di elaborazione, spingendo gli sforzi per semplificarla. L'azienda posiziona Maia 200 per ridurre le interruzioni operative e il consumo energetico nelle implementazioni di intelligenza artificiale. Un singolo nodo dotato del chip gestisce i più grandi modelli di intelligenza artificiale attuali, lasciando spazio per quelli sostanzialmente più grandi. Microsoft ha dichiarato: “In termini pratici, un nodo Maia 200 può eseguire senza sforzo i modelli più grandi di oggi, con ampio margine per modelli ancora più grandi in futuro.” Questa versione si allinea con un modello tra le principali aziende tecnologiche che sviluppano processori personalizzati per ridurre la dipendenza dalle unità di elaborazione grafica di Nvidia, che dominano i carichi di lavoro AI. Le GPU Nvidia sono diventate fondamentali per il successo dell’intelligenza artificiale, suggerendo alternative per gestire le spese hardware. Google offre unità di elaborazione tensore, o TPU, non come chip autonomi ma come risorse di calcolo basate su cloud. Amazon fornisce chip acceleratori AI Trainium, con il Trainium 3 di terza generazione rilasciato a dicembre. Queste opzioni consentono alle aziende di spostare alcuni carichi di lavoro lontano dall'hardware Nvidia, riducendo i costi complessivi. Microsoft afferma che Maia 200 supera i concorrenti in parametri chiave. Raggiunge tre volte le prestazioni FP4 dei chip Trainium di terza generazione di Amazon. Le sue prestazioni FP8 superano quelle dei TPU di settima generazione di Google, come dettagliato nel comunicato stampa di lunedì dell'azienda. Il chip supporta già gli sforzi di intelligenza artificiale interna. Alimenta i modelli sviluppati dal team di Superintelligence di Microsoft. Anche le operazioni per il chatbot Copilot si basano sull'hardware Maia 200. Da lunedì Microsoft ha esteso gli inviti agli utenti esterni. Sviluppatori, accademici e laboratori di intelligenza artificiale di frontiera possono ora accedere al kit di sviluppo software Maia 200 per integrarlo nei propri carichi di lavoro.





