DeepSeek, un’importante società di intelligenza artificiale cinese, ha dovuto affrontare ritardi inaspettati nel rilasciare il suo modello R2 a causa di difficoltà tecniche persistenti con le chip ascende di Huawei. Le autorità cinesi avevano incoraggiato DeepSeek a utilizzare i processori nazionali sui sistemi H20 di NVIDIA.
Nonostante l’assistenza in loco degli ingegneri di Huawei, DeepSeek non è stato in grado di completare una corsa di formazione di successo utilizzando i chip ascendi. Di conseguenza, la società si è basata su hardware NVIDIA per i processi di formazione durante la distribuzione di chip ascendi per le attività di inferenza. Questo approccio a doppio hardware sottolinea le sfide nel passare completamente all’infrastruttura di intelligenza artificiale domestica per operazioni complesse.
Il lancio del modello R2, inizialmente previsto per il maggio 2025, è stato rinviato. Questo ritardo derivava dagli ostacoli tecnici irrisolti associati ai chip Ascend e ai requisiti di etichettatura dei dati estesi per il set di dati di formazione aggiornato. Secondo quanto riferito, il fondatore di Deepseek Liang Wenfeng ha articolato l’insoddisfazione per i progressi dello sviluppo del modello, indicando la necessità di ulteriori tempo per garantire che il modello possa mantenere la posizione competitiva di Deepseek.
I concorrenti hanno sfruttato le battute d’arresto dello sviluppo di Deepseek. Il Qwen3 di Alibaba, ad esempio, ha integrato gli algoritmi di addestramento centrale simili a quelli di DeepSeek, migliorando contemporaneamente l’efficienza e la flessibilità nei propri sistemi. Questo sviluppo evidenzia la rapida evoluzione all’interno degli ecosistemi di AI e il potenziale per i rivali di capitalizzare le difficoltà incontrate dalle singole startup.
La più ampia iniziativa strategica di Pechino per l’autosufficienza AI ha intensificato la pressione sulle imprese nazionali per adottare hardware prodotto localmente. Questa spinta mira a ridurre la dipendenza dalla tecnologia straniera, in particolare da aziende come Nvidia. Tuttavia, l’implementazione di questa strategia ha rivelato disparità esistenti in stabilità, connettività inter-chip e maturità del software nel confrontare i chip di Huawei con i prodotti affermati di Nvidia.
Nvidia ha sottolineato l’importanza strategica di mantenere l’accesso per gli sviluppatori cinesi, rilevando che le restrizioni sull’adozione della tecnologia potrebbero influire negativamente sugli interessi di sicurezza economica e nazionale. Le società di intelligenza artificiale cinesi stanno navigando in un paesaggio complesso, bilanciando direttive governative per utilizzare hardware domestico con le realtà pratiche dello sviluppo e della distribuzione di modelli di grandi dimensioni, che spesso richiedono capacità di elaborazione avanzate e affidabili.
Nonostante queste sfide, il modello R2 di Deepseek potrebbe ancora vedere un rilascio nelle prossime settimane. Le prestazioni eventuali del modello probabilmente subiranno un controllo, in particolare se valutate contro rivali che sono stati addestrati usando hardware più maturo e consolidato. Questa situazione esemplifica la tensione in corso tra obiettivi politici nazionali, capacità tecniche disponibili e le esigenze pratiche del dispiegamento dell’IA nel mondo reale.





