OpenAI presenta il primo chip di inferenza personalizzato denominato Jalapeño

OpenAI ha rivelato il suo primo processore di inferenza personalizzato, denominato Jalapeño, sviluppato in collaborazione con Broadcom. Il processore soddisfa specificamente i requisiti specifici dei sistemi di inferenza di OpenAI, e la società afferma che i propri modelli di intelligenza artificiale hanno contribuito al suo sviluppo.

Il chip è ancora in fase di test, ma i primi risultati indicano un miglioramento significativo delle prestazioni per watt rispetto alle attuali alternative principali. La partnership di OpenAI con Broadcom è stata annunciata ufficialmente in ottobre e la creazione di chip personalizzati è stata vista come una strategia per ridurre la dipendenza dalle unità di elaborazione grafica di Nvidia.

Google e Amazon hanno creato chip personalizzati comparabili, chiamati “acceleratori AI”, per accelerare le attività di apprendimento automatico. In un podcast interno, il presidente di OpenAI Greg Brockman ha discusso della strategia di sviluppo dei chip dell’azienda dopo aver annunciato la partnership con Broadcom. “Abbiamo una profonda conoscenza del carico di lavoro”, ha affermato Brockman. “Abbiamo davvero cercato carichi di lavoro specifici che sono sottoserviti, [e ci siamo chiesti] come possiamo costruire qualcosa che sarà in grado di accelerare ciò che è possibile?”

Jalapeño è progettato su misura per attività di inferenza, che comportano l’applicazione di modelli di intelligenza artificiale predefiniti basati sui comandi dell’utente. Secondo OpenAI, il chip offre bassi costi operativi nella gestione di modelli di codifica in tempo reale. Tuttavia, i processi ad alta prestazione come il pre-training potrebbero comunque richiedere l’hardware Nvidia. Anche piccole riduzioni dei costi di inferenza potrebbero aumentare significativamente la redditività di OpenAI.

L’ottimizzazione del sistema di inferenza è fondamentale per il futuro economico dell’intelligenza artificiale e l’azienda sta espandendo le proprie capacità nell’intero stack tecnologico. OpenAI sta contemporaneamente sviluppando prodotti come Codex e i modelli che li supportano, oltre a creare data center per l’implementazione dei modelli. Si prevede che il passaggio al silicio personalizzato migliorerà ulteriormente queste efficienze operative.

OpenAI ha spiegato in dettaglio che la sua strategia comprende la progettazione di componenti infrastrutturali, tra cui architettura dei chip, kernel, sistemi di memoria, reti, sistemi di pianificazione e distribuzione. Questo approccio completo consente l’ottimizzazione a tutti i livelli della tecnologia, con l’obiettivo di fornire agli utenti modelli più veloci, più affidabili e convenienti.

Credito immagine in primo piano