Il laboratorio di ricerca e sviluppo dell’IA di Google, DeepMind, ha svelato Alphaevols, un sistema di intelligenza artificiale progettato per affrontare problemi complessi in matematica e scienza con soluzioni “integrabili in macchina”. Il sistema sfrutta i modelli “all’avanguardia”, in particolare i modelli Gemelli, per generare, criticare e valutare possibili risposte a un determinato problema.
Alphaevolve introduce un meccanismo per ridurre le allucinazioni nei modelli di intelligenza artificiale utilizzando un sistema di valutazione automatico. Questo sistema segna le risposte generate per l’accuratezza, consentendole di funzionare in modo efficace su problemi che possono essere autovalutati, in particolare in campi come l’informatica e l’ottimizzazione del sistema.

Da utilizzare Alphaevolvegli utenti devono fornire una dichiarazione problematica insieme a dettagli opzionali come istruzioni, equazioni e letteratura pertinente. Devono inoltre fornire un meccanismo per valutare automaticamente le risposte del sistema, in genere sotto forma di una formula. La capacità del sistema è limitata alla descrizione delle soluzioni come algoritmi, rendendolo meno adatto a problemi non numerici.
Nei test di benchmarking, Alphaevolve è stato presentato con circa 50 problemi di matematica su vari rami, tra cui geometria e combinatoria. Il sistema ha “riscoperto” le risposte più conosciute del 75% delle volte e ha scoperto soluzioni migliorate nel 20% dei casi. DeepMind ha anche applicato Alphaevove a problemi pratici, come l’ottimizzazione dell’efficienza del data center di Google e l’accelerazione delle esecuzioni del modello.
Video: Google DeepMind
Secondo DeepMindAlphaevolve ha generato un algoritmo che ha recuperato in media lo 0,7% delle risorse di calcolo in tutto il mondo di Google e ha suggerito un’ottimizzazione che ha ridotto il tempo complessivo per formare i modelli di gemelli dell’1%. Mentre Alphaevolve non sta facendo scoperte rivoluzionarie, si afferma che risparmia tempo e liberi esperti per concentrarsi su compiti più critici.
DeepMind prevede di creare un’interfaccia utente per AlphaEovols e di avviare un programma di accesso precoce per accademici selezionati prima di considerare un lancio più ampio. Il laboratorio afferma che le capacità di AlphaEovove lo rendono uno strumento prezioso per gli esperti di dominio.