Google ha aperto la sua ultima suite modello di intelligenza artificiale, Gemini 2.0, al pubblico, segnando un passo significativo nella sua spinta verso agenti AI avanzati. La suite include Gemini 2.0 Pro Experimental, progettata per codifica e attività complesse e pensiero flash Gemini 2.0, ora disponibile nell’app Gemini.
La famiglia Gemini 2.0 è ora aperta a tutti
Gemini 2.0 Pro Experimental è descritto come il modello più capace di Google, eccellendo nella codifica e nella gestione di intricati istruzioni. Vanta una finestra di contesto di 2 milioni di token, consentendole di elaborare circa 1,5 milioni di parole contemporaneamente. Il modello può chiamare strumenti come Google Search ed eseguire il codice per conto degli utenti. Inizialmente preso in giro nel Changelog dell’app Gemini la scorsa settimana, è ora accessibile tramite le piattaforme di sviluppo AI di Google, Vertex AI e Google AI Studio, nonché gli abbonati avanzati Gemini nell’app Gemini.
Gemini 2.0 Flash, introdotto a dicembre, è ora generalmente disponibile. Fatturato come un “modello di cavallo di battaglia”, è ottimizzato per attività ad alto volume, ad alta frequenza e costi per gli sviluppatori 10 centesimi per milione di token per input di testo, immagine e video. Inoltre, Google ha svelato Gemini 2.0 Flash-Lite, il suo modello più economico, che corrisponde alle prestazioni del suo predecessore, Gemini 1.5 Flash, allo stesso prezzo e velocità. Flash-Lite costa 0,75 centesimi per milione di token.
Concentrati sugli agenti AI
IL pubblicazione In linea con la più ampia strategia di Google di avanzamento di AI agente: modelli in grado di svolgere autonomamente compiti complessi e multistep. In un post sul blog di dicembre, Google ha sottolineato la sua attenzione allo sviluppo di modelli che “comprendono di più sul mondo che ti circonda, pensa a più passi in anticipo e agiscono per tuo conto”. Gemini 2.0 introduce nuove funzionalità multimodali, tra cui un’output di immagini e audio nativi, nonché l’uso dello strumento, avvicinando Google alla sua visione di un assistente universale.
Questo spinge Google in diretta concorrenza con altri giganti tecnologici e startup come Meta, Amazon, Microsoft, Openi e Antropic AI agente. Gli agenti AI di Antropic, ad esempio, possono navigare in modo simile ai computer, completando le attività con decine o centinaia di passaggi. Openai ha recentemente rilasciato l’operatore, un agente in grado di automatizzare attività come la pianificazione delle vacanze e l’ordinamento della drogheria, mentre la ricerca profonda compila report complessi per gli utenti.
Google ha anche lanciato il proprio strumento di ricerca profondo a dicembre, che funziona come assistente di ricerca che esplora argomenti e compila report dettagliati. Il CEO Sundar Pichai ha sottolineato l’importanza dell’esecuzione sull’essere il primo, affermando in una riunione di strategia di dicembre, “Penso che sia quello che è il 2025”.
Competizione con DeepSeek
Le uscite di Google arrivano tra la crescente attenzione da DeepSeek, la startup cinese AI i cui modelli competono o superano quelle delle principali aziende americane. Il modello R1 di DeepSeek ha guadagnato una trazione significativa grazie alla sua convenienza e alle prestazioni. Per contrastare questo, Google sta rendendo il suo modello di pensiero flash Gemini 2.0 più accessibile tramite l’app Gemini, potenzialmente mirando a attirare maggiore attenzione alle sue offerte.