OpenAI, la società dietro ChatGPT, sta espandendo i suoi sforzi per garantire una potenza di calcolo affidabile ed economicamente vantaggiosa per i suoi modelli di intelligenza artificiale. Sviluppando silicio personalizzato, OpenAI mira a ridurre la dipendenza da fornitori esterni come NVIDIA, le cui GPU dominano il mercato dei chip AI. Secondo Reuters OpenAI ha collaborato con Broadcom e si è assicurata capacità produttiva con Taiwan Semiconductor Manufacturing Company (TSMC), incorporando al tempo stesso i chip AMD nella sua configurazione di Microsoft Azure.
OpenAI per creare chip AI personalizzati con Broadcom e TSMC
Il viaggio di OpenAI verso lo sviluppo dei propri chip AI è iniziato con la riunione di un team di circa 20 persone, inclusi i migliori ingegneri che in precedenza avevano lavorato sulle Tensor Processing Unit (TPU) di Google. Questo team interno di chip, guidato da ingegneri esperti come Thomas Norrie e Richard Ho, sta lavorando a stretto contatto con Broadcom per progettare e produrre silicio personalizzato che si concentrerà sui carichi di lavoro di inferenza. Si prevede che i chip saranno prodotti da TSMC, la più grande fonderia di semiconduttori al mondo, a partire dal 2026.
L’obiettivo dietro lo sviluppo interno del silicio è duplice: garantire una fornitura stabile di chip ad alte prestazioni e gestire i costi crescenti associati ai carichi di lavoro dell’intelligenza artificiale. Sebbene la domanda di chip di addestramento sia attualmente più elevata, gli esperti del settore prevedono che la necessità di chip di inferenza supererà quella dei chip di addestramento man mano che sempre più applicazioni di intelligenza artificiale raggiungeranno la fase di implementazione. L’esperienza di Broadcom nell’aiutare a mettere a punto i progetti di chip per la produzione di massa e nel fornire componenti che ottimizzano il movimento dei dati lo rende un partner ideale per questo ambizioso progetto.
OpenAI aveva precedentemente preso in considerazione la possibilità di costruire proprie fonderie di chip, ma alla fine ha deciso di abbandonare tali piani a causa degli immensi costi e tempo richiesti. OpenAI si sta invece concentrando sulla progettazione di chip personalizzati, affidandosi a TSMC per la produzione.
Incorporando chip AMD per la diversificazione
Oltre alla partnership con Broadcom, OpenAI sta incorporando anche le novità di AMD MI300X chip nella sua configurazione di Microsoft Azure. AMD ha introdotto questi chip lo scorso anno come parte della sua strategia di espansione del data center, con l’obiettivo di conquistare parte della quota di mercato attualmente detenuta da NVIDIA. L’inclusione dei chip AMD consentirà a OpenAI di diversificare la propria offerta di chip, riducendo la dipendenza da un unico fornitore e contribuendo a gestire i costi in modo più efficace.
I chip MI300X di AMD fanno parte della sua spinta per competere con NVIDIA, che attualmente detiene oltre l’80% della quota di mercato nell’hardware AI. I chip MI300X sono progettati per supportare i carichi di lavoro dell’intelligenza artificiale, in particolare nell’inferenza e nell’addestramento dei modelli. Aggiungendo chip AMD alla sua infrastruttura, OpenAI spera di alleviare alcuni dei vincoli di fornitura che ha dovuto affrontare con le GPU NVIDIA, che sono state molto richieste e soggette a carenze.
Questa mossa strategica è anche una risposta all’aumento dei costi di elaborazione, che sono diventati una sfida importante per OpenAI. L’azienda ha dovuto affrontare spese elevate per hardware, elettricità e servizi cloud, che quest’anno hanno portato a perdite previste per 5 miliardi di dollari. Ridurre la dipendenza da un unico fornitore come NVIDIA, che ha aumentato i prezzi, potrebbe aiutare OpenAI a gestire meglio questi costi e a continuare a sviluppare i suoi modelli di intelligenza artificiale senza ritardi o interruzioni significativi.
La strada da percorrere
Nonostante l’ambizioso piano di sviluppo di chip personalizzati, OpenAI deve affrontare sfide significative. Costruire una soluzione di silicio interna richiede tempo e denaro e non si prevede che i primi chip progettati su misura saranno in produzione fino al 2026. Questa linea temporale colloca OpenAI dietro alcuni dei suoi concorrenti più grandi come Google, Microsoft e Amazon, che hanno già hanno fatto progressi sostanziali nello sviluppo del proprio hardware AI personalizzato.
La partnership con Broadcom e TSMC rappresenta un importante passo avanti, ma evidenzia anche le difficoltà incontrate dalle aziende che cercano di sfondare nel mercato dei chip. La produzione di chip IA ad alte prestazioni richiede competenze approfondite, strutture di produzione avanzate e investimenti considerevoli. TSMC, in qualità di partner produttivo, svolgerà un ruolo chiave nel determinare il successo di questa impresa. La tempistica per la produzione dei chip potrebbe ancora cambiare, a seconda di fattori quali la complessità della progettazione e la capacità produttiva.
Un’altra sfida risiede nell’acquisizione di talenti. OpenAI è cauta nel sottrarre talenti a NVIDIA, poiché vuole mantenere un buon rapporto con il produttore di chip, soprattutto perché fa ancora molto affidamento su NVIDIA per i suoi modelli AI di generazione attuale. Si prevede che i chip Blackwell di NVIDIA saranno cruciali per i prossimi progetti di intelligenza artificiale e il mantenimento di una relazione positiva è essenziale per l’accesso continuo di OpenAI a queste GPU all’avanguardia.
Perché OpenAI ha bisogno di silicio personalizzato
Il fattore principale dietro l’iniziativa di chip personalizzato di OpenAI è il costo. L’addestramento e l’implementazione di modelli di intelligenza artificiale di grandi dimensioni come GPT-4 richiedono un’enorme potenza di calcolo, che si traduce in elevate spese infrastrutturali. Si prevede che i costi di elaborazione annuali di OpenAI costituiranno una delle spese maggiori, con la società che prevede una perdita di 5 miliardi di dollari quest’anno nonostante abbia generato entrate per 3,7 miliardi di dollari. Sviluppando i propri chip, OpenAI spera di tenere sotto controllo questi costi, ottenendo un vantaggio competitivo nell’affollato mercato dell’intelligenza artificiale.
Il silicio personalizzato offre anche vantaggi in termini di prestazioni. Personalizzando i chip appositamente per le esigenze dell’inferenza dell’intelligenza artificiale, OpenAI può ottimizzare le prestazioni, migliorare l’efficienza e ridurre la latenza. Ciò è particolarmente importante per fornire risposte in tempo reale e di alta qualità in prodotti come ChatGPT. Sebbene le GPU NVIDIA siano altamente performanti, l’hardware progettato su misura può fornire un’ottimizzazione più mirata, portando potenzialmente a miglioramenti significativi in termini di prestazioni ed efficienza dei costi.
L’approccio di combinare soluzioni di chip interni ed esterni fornisce a OpenAI una maggiore flessibilità nel modo in cui ridimensiona la propria infrastruttura. Collaborando con Broadcom su progetti personalizzati e incorporando anche GPU AMD e NVIDIA, OpenAI si sta posizionando per affrontare meglio le sfide legate all’elevata domanda e alle limitazioni della catena di fornitura. Questo approccio diversificato aiuterà l’azienda ad adattarsi alle mutevoli condizioni del mercato e garantirà di disporre delle risorse informatiche necessarie per continuare a spingersi oltre i confini dell’intelligenza artificiale.
Credito immagine in primo piano: Andrew Neel/Unsplash