DeepSeek è destinato ad accelerare il lancio del suo nuovo modello AI, R2, in seguito al successo del suo modello precedente, R1, che ha recentemente spinto un sell-off di $ 1 trilione nei mercati azionari globali a causa delle sue prestazioni competitive contro le controparti occidentali.
DeepSeek accelera il lancio del modello R2 AI dopo il successo di R1
La startup con sede a Hangzhou inizialmente mirava a rilasciare R2 all’inizio di maggio, ma ora sta spingendo per un lancio accelerato, secondo tre fonti che hanno familiarità con la società. Il nuovo modello dovrebbe migliorare le capacità di codifica e supportare il ragionamento in più lingue oltre l’inglese. DeepSeek non ha commentato questi sviluppi.
R1, sviluppato utilizzando chip Nvidia meno potenti, rimane competitivo con i modelli creati dalle principali aziende tecnologiche statunitensi che hanno investito centinaia di miliardi di tecnologie AI. Vijayasimha Alilughatta, COO di Zensar, ha dichiarato che il rilascio di R2 potrebbe avere un impatto significativo sull’industria dell’intelligenza artificiale, sfidando il dominio dei leader di mercato esistenti.
Fondatore ed ethos operativo
Liang Wenfeng, fondatore di DeepSeek e un miliardario del suo hedge fund quantitativo, ha mantenuto un profilo basso dal luglio 2024. Gli ex dipendenti descrivono DeepSeek come operando più come un laboratorio di ricerca che un business convenzionale, caratterizzato da uno stile di gestione piatto che contrasta con la struttura gerarchica comune nel settore tecnologico cinese.
Liang, che ha iniziato la sua carriera in Smart Imaging e in seguito ha gestito un team di ricerca, è stato elogiato per aver assunto ingegneri di algoritmo di alto livello e promuovere un ambiente collaborativo. I dipendenti hanno notato che molti hanno lavorato per otto ore, sentendosi autorizzati a contribuire a progetti chiave. Liang sottolinea la qualità rispetto allo sviluppo di app, avendo commentato l’evitamento di spese forti a favore dei modelli di intelligenza artificiale.
Secondo quanto riferito, la compensazione a Deepseek e High-Flyer è generosa; I data scientist senior di High-Flyer possono guadagnare fino a 1,5 milioni di yuan all’anno, significativamente più alti rispetto ai concorrenti. Lo stesso Flyer è riconosciuto come uno dei migliori fondi quantici della Cina, gestendo decine di miliardi di yuan nonostante le pressioni normative sul settore.
DeepSeek ha scosso il mercato una volta ed ecco perché potrebbe succedere di nuovo
Il vantaggio competitivo di Deepseek deriva dai significativi investimenti di High-Flyer nella potenza di ricerca e calcolo. L’azienda ha assegnato il 70% delle sue entrate per la ricerca AI, costruendo due cluster di AI supercomputer, tra cui uno composto da 10.000 chip Nvidia A100 durante il 2020 e il 2021. Il governo cinese ha inizialmente sollevato preoccupazioni riguardo alle massicce acquisizioni di chip, ma alla fine ha permesso alle operazioni di procedere, che hanno successivamente beneficiato di profondità quando gli Stati Uniti hanno bandito a100 a China durante la China.
Con una concorrenza limitata per tali risorse, DeepSeek ha attirato ricercatori leader. L’applicazione di tecniche economiche, come la miscela di esperti (MOE) e l’attenzione latente multihead (MLA), ha permesso alla società di ridurre i costi di calcolo pur rimanendo competitivi. Si stima che i prezzi di DeepSeek siano 20-40 volte più economici rispetto ai modelli simili da Openi, secondo gli analisti di Bernstein.
Dall’introduzione di R1, i giganti della tecnologia occidentale hanno adeguato le loro strategie, riflettete nei tagli ai prezzi da Openai e l’introduzione di livelli di accesso scontati da parte di Google. I test di riferimento da UST hanno notato che R1 ha spesso richiesto tre volte i token per il ragionamento rispetto ai modelli ridimensionati di Openi.
Supporto governativo
DeepSeek ha guadagnato favore con il governo cinese, come evidenziato da Liang che ha partecipato a un incontro di alto profilo con il premier Li Qiang come rappresentante del settore dell’IA. I governi locali e diverse imprese statali hanno iniziato a integrare i modelli di Deepseek, indicando una forte approvazione da parte della leadership cinese, che mira a dimostrare la superiorità sulla tecnologia statunitense.
Questo aumento arriva in un momento in cui i modelli di Deepseek affrontano la rimozione dagli app store in alcuni paesi, tra cui la Corea del Sud e l’Italia, a causa di problemi di privacy. Gli esperti avvertono che se DeepSeek diventa il modello di AI preferito per le entità statali cinesi, i regolatori occidentali possono rispondere con intensità di restrizioni alle esportazioni e alle collaborazioni della tecnologia AI.
Liang ha riconosciuto le sfide poste dall’embargo sui chip AI avanzati, sottolineando il finanziamento non è stato il problema principale per DeepSeek.
Credito immagine in primo piano: Matheus Bertelli/Pexels