DeepSeek V3.1 Rivals GPT-5 con modello di parametro 685B

Nel gennaio 2025, DeepSeek, una startup cinese AI, lanciò R1, un modello di intelligenza artificiale che rivaleggiava con LLM di alto livello di Openai e Antropic. Costruito a una frazione del costo con un minor numero di chip Nvidia, DeepSeek ha ora rilasciato V3.1, un aggiornamento al suo modello V3 di punta, al prezzo di Undercut Openi e ottimizzato per chip di fabbricazione cinese.

La V3.1 di Deepseek è stata lanciata tranquillamente tramite un messaggio su WeChat, un’importante messaggistica cinese e un’applicazione sociale e sulla piattaforma di abbracci. Questo sviluppo sottolinea diverse narrazioni chiave nell’attuale panorama dell’IA. Gli sforzi di Deepseek sono fondamentali per l’ambizione della Cina di sviluppare e controllare i sistemi AI avanzati indipendentemente dalla tecnologia straniera.

Il nuovo modello DeepSeek V3 è specificamente ottimizzato per funzionare efficacemente sui chip di fabbricazione cinese, riflettendo il movimento strategico della Cina verso l’autosufficienza tecnologica. Mentre le aziende statunitensi hanno mostrato riluttanza all’adozione dei modelli di DeepSeek, hanno guadagnato una notevole trazione in Cina e vengono sempre più utilizzate in altre regioni a livello globale. Alcune aziende americane hanno persino integrato il modello di ragionamento R1 di Deepseek nelle loro applicazioni. I ricercatori, tuttavia, avvertono che i risultati di questi modelli spesso si allineano da vicino con le narrazioni approvate dal Partito Comunista cinese, sollevando preoccupazioni per quanto riguarda la loro neutralità e affidabilità.

Le ambizioni cinesi di AI si estendono oltre DeepSeek, con altri modelli notevoli tra cui Qwen di Alibaba, Kimi di Moonshot AI e Ernie di Baidu. La recente versione di Deepseek, che segue da vicino Lancio GPT-5 di Openisottolinea l’impegno della Cina a mantenere il ritmo con o superare, guidare i laboratori di intelligenza artificiale statunitense. L’implementazione di GPT-5 non è all’altezza delle aspettative del settore, evidenziando ulteriormente il significato dei progressi di Deepseek.

Il CEO di Openi Sam Altman ha riconosciuto che la concorrenza dei modelli cinesi Open-Source, DeepSeek, ha influenzato la decisione di Openi di rilasciare i propri modelli a peso aperto. Durante una recente discussione con i giornalisti, Altman ha dichiarato che se Openai non avesse fatto questo passo, il panorama dell’IA sarebbe probabilmente dominato da modelli cinesi open source. Ha sottolineato che questa considerazione è stata un fattore significativo nel loro processo decisionale.

Il governo degli Stati Uniti ha concesso licenze NVIDIA e AMD per esportare chip AI specifici in Cina, tra cui l’H20 di NVIDIA. Queste licenze sono subordinate alle società che accettano di rimettere il 15% delle entrate da queste vendite al governo degli Stati Uniti. In risposta, Pechino si è mossa per limitare gli acquisti di chip Nvidia. Ciò ha seguito la dichiarazione del segretario al commercio Howard Lutnick su CNBC Che gli Stati Uniti non vengano la Cina la migliore, la seconda migliore o anche la terza migliore tecnologia.

L’ottimizzazione di DeepSeek per i chip di fabbricazione cinese indica una mossa strategica per contrastare i controlli di esportazione statunitensi e ridurre la dipendenza da Nvidia. La società ha dichiarato nel suo annuncio di WeChat che il nuovo formato modello è ottimizzato per “chip interni di prossima generazione presto rilasciati”.

Altman ha espresso preoccupazione per il fatto che gli Stati Uniti possano sottovalutare la complessità e il significato dei progressi della Cina nell’IA. Ha avvertito che i controlli di esportazione da soli potrebbero non essere sufficienti per affrontare le sfide poste dai rapidi progressi della Cina. Ha espresso le sue preoccupazioni per le crescenti capacità della Cina nel campo dell’intelligenza artificiale.

Il modello DeepSeek v3.1 incorpora progressi tecnici che sono principalmente vantaggiosi per gli sviluppatori. Queste innovazioni mirano a ridurre i costi operativi e migliorare la versatilità rispetto a molti modelli concorrenti chiusi e più costosi. V3.1 ha 685 miliardi di parametri, posizionandolo tra i migliori modelli “frontier”. Il suo design “miscela di esperti” attiva solo una frazione del modello per ciascuna query, riducendo i costi di elaborazione per gli sviluppatori. A differenza dei precedenti modelli DeepSeek che hanno separato compiti che richiedono risposte istantanee da coloro che necessitano di ragionamento passo-passo, V3.1 integra entrambe le capacità in un singolo sistema.

GPT-5, insieme a modelli recenti di Antropic e Google, presentano anche questa capacità integrata. Tuttavia, pochi modelli a peso aperto hanno raggiunto questo livello di integrazione. Ben Dickson, fondatore del blog di TechTalks, descrive l’architettura ibrida di V3.1 come “la più grande caratteristica di gran lunga”.

William Falcon, fondatore e CEO di Lightning AI, ha osservato che i continui miglioramenti di Deepseek sono degni di nota, anche se V3.1 non è un salto così significativo come il precedente modello R1. Ha dichiarato che la società continua a apportare “miglioramenti non marginali”, il che è impressionante. Falcon prevede che Openai risponderà se il suo modello open source inizia a ritardare in modo significativo. Ha anche sottolineato che il modello DeepSeek è più impegnativo per gli sviluppatori da distribuire in produzione rispetto alla versione di Openi, che è relativamente facile da distribuire.

La versione di Deepseek evidenzia la crescente percezione dell’IA come componente chiave di una competizione tecnologica tra Stati Uniti e Cina. Il fatto che le società cinesi stiano sostenendo di costruire modelli di intelligenza artificiale superiori a un costo ridotto fornisce ai concorrenti statunitensi motivi per valutare attentamente la loro strategia per mantenere la leadership sul campo.

Credito d’immagine in primo piano

Tags: AI Deep -Week In primo piano

DeepSeek V3.1 Rivals GPT-5 con modello di parametro 685B

Related Posts

Microsoft testa la nuova funzionalità di analisi approfondita del PC di Copilot in Windows 11

OpenAI ritira il browser Atlas per concentrarsi sulla nuova superapp ChatGPT

La perdita di Pixel 11 mostra audaci colori magenta e pesca

La casella di ricerca di Windows 11 ottiene meno confusione e più controllo

L’aggiornamento dell’algoritmo X mira a rendere le risposte più amichevoli

Xiaomi presenta il SUV range extender SkyNomad N90

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

DeepSeek V3.1 Rivals GPT-5 con modello di parametro 685B

Related Posts

Microsoft testa la nuova funzionalità di analisi approfondita del PC di Copilot in Windows 11

OpenAI ritira il browser Atlas per concentrarsi sulla nuova superapp ChatGPT

La perdita di Pixel 11 mostra audaci colori magenta e pesca

La casella di ricerca di Windows 11 ottiene meno confusione e più controllo

L’aggiornamento dell’algoritmo X mira a rendere le risposte più amichevoli

Xiaomi presenta il SUV range extender SkyNomad N90

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us