Il laboratorio cinese di intelligenza artificiale DeepSeek ha annunciato il rilascio del suo modello DeepSeek-R1-Lite-Preview, che secondo lui rivaleggia con il modello o1 di OpenAI. Il nuovo modello offre una caratteristica unica: la trasparenza nel processo di ragionamento, consentendo agli utenti di vedere i suoi metodi di risoluzione dei problemi passo dopo passo. Questo annuncio arriva due mesi dopo il lancio di OpenAI o1-anteprima modello, evidenziando una crescente concorrenza nello spazio del ragionamento dell’intelligenza artificiale.
DeepSeek lancia un modello di ragionamento per rivaleggiare con OpenAI
È possibile accedere a DeepSeek-R1-Lite-Preview tramite un chatbot web, Chat di DeepSeekdove gli utenti possono interagire con la modella, limitatamente a 50 messaggi al giorno. Sebbene i benchmark dettagliati e una scheda modello debbano ancora essere rilasciati, le prime valutazioni indicano che il modello di ragionamento mostra prestazioni paragonabili ai benchmark di OpenAI sui compiti AIME e MATH. DeepSeek afferma di raggiungere una precisione all’avanguardia del 91,6% sul benchmark MATH.
L’introduzione di DeepSeek-R1 arriva mentre le tradizionali leggi di ridimensionamento dell’intelligenza artificiale, che suggeriscono che l’aumento dei dati e della potenza computazionale migliorerà le prestazioni, iniziano a mostrare rendimenti decrescenti. In risposta, le aziende stanno cercando nuovi approcci, come i modelli di ragionamento alla base come DeepSeek-R1. A differenza dei modelli tradizionali, i modelli di ragionamento estendono la loro elaborazione computazionale durante l’inferenza per migliorare le capacità decisionali.
Nonostante le sue caratteristiche promettenti, il nuovo modello aderisce anche ai rigidi protocolli di censura comuni nella tecnologia AI cinese. Le osservazioni hanno confermato che DeepSeek-R1 evita argomenti politici delicati, come le domande su Xi Jinping o Taiwan. Gli utenti hanno segnalato tentativi riusciti di aggirare queste restrizioni, consentendo al modello di fornire contenuti non filtrati in determinati scenari. Questo aspetto solleva domande continue sull’equilibrio tra funzionalità e conformità normativa per i modelli di intelligenza artificiale sviluppati in regioni con una rigorosa supervisione governativa.
DeepSeek afferma che il suo modello DeepSeek-R1, o più specificamente, DeepSeek-R1-Lite-Preview, corrisponde al modello o1-preview di OpenAI su due importanti benchmark AI, AIME e MATH. AIME valuta le prestazioni di un modello utilizzando altri modelli di intelligenza artificiale, mentre MATH verifica la risoluzione dei problemi con una raccolta di problemi di parole. Tuttavia, il modello ha i suoi difetti. Alcuni utenti su X ha sottolineato che DeepSeek-R1, come o1, affronta sfide con il tris e altri compiti basati sulla logica.
Guardando al futuro, DeepSeek prevede di rilasciare versioni open source dei suoi modelli R1 ed estendere l’accesso tramite API, continuando il suo impegno nei confronti della comunità AI open source. La società è supportata da High-Flyer Capital Management, che segue una strategia di integrazione dell’intelligenza artificiale nelle decisioni commerciali. Le operazioni di High-Flyer includono investimenti sostanziali nell’infrastruttura hardware, vantando cluster di GPU Nvidia A100 per l’addestramento dei modelli.
Credito immagine in primo piano: DeepSeek