L'unicorno cinese basato sull'intelligenza artificiale DeepSeek tiene il settore nel dubbio riguardo al rilascio dei suoi modelli di prossima generazione, V4 e R2. Nonostante le intense speculazioni su un potenziale lancio durante il prossimo Capodanno lunare, la società ha rifiutato di commentare date specifiche.
Invece, l'azienda lascia che sia la sua ricerca a parlare. Nelle ultime settimane, DeepSeek ha pubblicato numerosi documenti tecnici che delineano nuovi metodi per aggirare le attuali limitazioni hardware. Con le sanzioni statunitensi che limitano l’accesso della Cina alle GPU Nvidia avanzate, L'ultima ricerca di DeepSeek si concentra sull'efficienza algoritmica.
Il martedì, l'azienda ha presentato”Engramma,” una tecnica di memoria condizionale progettata per risolvere le carenze di memoria della GPU con larghezza di banda elevata: un collo di bottiglia critico nel ridimensionamento dell'intelligenza artificiale. Ciò fa seguito a un articolo scritto in collaborazione dal CEO Liang Wenfeng sulle “iperconnessioni vincolate a molteplici forme” (mHC), un quadro volto ad addestrare sistemi massicci in modo più efficiente in termini di costi.
Gli analisti ritengono che queste innovazioni siano mosse strategiche per mantenere lo slancio nonostante le difficoltà geopolitiche. “DeepSeek vuole solo dimostrare che l'innovazione dell'infrastruttura AI favorirebbe l'efficienza,” disse Zhang Ruiwang, un architetto di sistemi informativi con sede a Pechino.
Mentre la data di rilascio dei successori dei modelli V3 e R1 rimane un mistero, la società ha confermato che il suo team principale rimane intatto. Un documento aggiornato sul modello R1 ha rilevato che tutti i 18 scienziati del nucleo originale sono ancora in azienda, sfidando gli elevati tassi di turnover del settore cinese.





