Alibaba rilasciato Qwen3, una famiglia di modelli di intelligenza artificiale che l’azienda afferma che corrisponde e talvolta supera i migliori modelli di Google e Openai, lunedì. I modelli vanno da dimensioni da 0,6 miliardi di parametri a 235 miliardi di parametri e sono disponibili per il download con una licenza “aperta” dalla piattaforma AI Dev Abbracciare la faccia E Github.
I modelli QWEN3 sono descritti come “ibridi” perché possono richiedere del tempo per “ragionare” attraverso problemi complessi o rispondere rapidamente richieste più semplici. Questa capacità di ragionamento consente ai modelli di verificare in modo efficace, simili al modello O3 di Openi, ma con latenza più elevata. Secondo il team di Qwen, hanno “modalità di pensiero e non pensieri senza soluzione di continuità, offrendo agli utenti la flessibilità di controllare il budget del pensiero”.
Alcuni modelli QWEN3 adottano una miscela di architettura di esperti (MOE), che può essere più efficiente dal punto di vista computazionale per rispondere alle domande. MOE suddivide le attività in sottoinsieme e le delega a modelli “esperti” più piccoli e specializzati. I modelli supportano 119 lingue e sono stati addestrati su un set di dati di quasi 36 trilioni di token, tra cui libri di testo, coppie di domande-domande, frammenti di codice e dati generati dall’IA.

Alibaba afferma che le capacità di Qwen3 sono notevolmente migliorate rispetto al suo predecessore, Qwen2. Il più grande modello QWEN3, QWEN-3-235B-A22B, si esibisce in modo competitivo sulle valutazioni di riferimento, battendo O3-Mini di Openi e Google Gemini 2.5 Pro su Codeforces, una piattaforma per i concorsi di programmazione. Supera anche O3-Mini sull’ultima versione di AIME, un punto di riferimento matematico impegnativo e BFCL, un test per valutare la capacità di un modello di ragionare sui problemi.

Mentre QWEN-3-235B-A22B non è disponibile al pubblico, il più grande modello QWEN3 pubblico, QWEN3-32B, è ancora competitivo con diversi modelli di AI proprietari e aperti. Qwen3-32B supera il modello O1 di Openi in diversi test, incluso il benchmark di codifica LiveCodebench. Alibaba afferma che Qwen3 eccelle nelle capacità di calma degli strumenti, le seguenti istruzioni e la copia di formati di dati specifici.
Tuhin Srivastava, co-fondatrice e CEO di AI Cloud Host Baseten, ha osservato che Qwen3 è un altro esempio di modelli aperti che mantengono il ritmo con sistemi a source chiusa come Openai. Ha aggiunto che modelli come QWEN3 saranno probabilmente utilizzati a livello nazionale, nonostante le restrizioni statunitensi sulle vendite di chip in Cina.
Qwen3 è disponibile per il download e tramite fornitori di cloud, tra cui i fuochi d’artificio AI e Hyperbolic.