Una nuova ricerca indica che il trasferimento dell’apprendimento può accelerare significativamente la ricerca di nuova fisica, riducendo la necessità di costose simulazioni. Tuttavia, secondo uno studio pubblicato sul Journal of Cosmology and Astroparticle Physics (JCAP), la dipendenza da modelli consolidati potrebbe far sì che l’intelligenza artificiale trascuri fenomeni realmente nuovi.
Il modello standard della cosmologia, noto come ΛCDM, spiega molte caratteristiche dell’universo ma non è esaustivo. Nuove osservazioni hanno sollevato interrogativi su concetti come neutrini massicci, gravità modificata ed energia oscura in evoluzione. Lo studio di questi richiede estese simulazioni al computer, che sono sia computazionalmente costose che dispendiose in termini di tempo.
Il gruppo di ricerca mirava a determinare se l’apprendimento basato sul trasferimento potesse migliorare l’efficienza della simulazione. Il trasferimento dell’apprendimento consente a un’intelligenza artificiale di applicare la conoscenza da compiti più semplici a compiti più complessi, riducendo così i costi. Inizialmente, l’intelligenza artificiale è stata addestrata su simulazioni ΛCDM di base prima di passare a modelli più complessi che incorporavano potenziali nuove fisiche.
Adrian Bayer, coautore del Flatiron Institute e dell’Università di Princeton, ha descritto questo metodo come una scorciatoia alla tradizionale formazione sull’intelligenza artificiale. “Di solito le persone addestrano l’intelligenza artificiale direttamente sulle simulazioni più costose dal punto di vista computazionale. Ciò che facciamo invece è utilizzare prima simulazioni ΛCDM più semplici e meno costose per dare all’intelligenza artificiale un’idea di ciò che sta accadendo”, ha affermato Bayer.
Questa strategia di pre-addestramento ha aiutato l’IA a gestire la complessità senza essere sopraffatta. Lo studio ha rilevato che in alcuni casi l’apprendimento basato sul trasferimento ha ridotto il numero di simulazioni costose necessarie di oltre un fattore dieci.
I ricercatori hanno anche identificato una sfida nota come trasferimento negativo, che si verifica quando l’intelligenza artificiale interpreta erroneamente nuove informazioni sulla base della sua conoscenza preesistente. L’intelligenza artificiale spesso faticava a discernere nuovi effetti quando assomigliavano a modelli allineati con i parametri ΛCDM esistenti. Ciò era evidente nelle simulazioni che coinvolgevano neutrini massicci, dove l’intelligenza artificiale aveva difficoltà a differenziare le nuove firme da quelle che aveva già associato a parametri noti.
Veena Krishnaraj, l’autrice principale dello studio, ha spiegato che il trasferimento negativo deriva da degenerazioni fisiche sottostanti nei modelli. “Diversi processi fisici possono produrre firme osservabili molto simili”, ha osservato, indicando la necessità di cautela nell’interpretazione dei risultati dell’IA.
Lo studio sottolinea sia i potenziali vantaggi che i limiti del trasferimento dell’apprendimento nel dominio della fisica. Sebbene la formazione preliminare possa accelerare l’analisi dei dati, potrebbe ostacolare la capacità dell’intelligenza artificiale di riconoscere scoperte rivoluzionarie. La fase successiva riguarderà l’applicazione della tecnica del trasferimento di apprendimento alle osservazioni astronomiche reali.
I ricercatori prevedono che l’apprendimento del trasferimento sarà fondamentale per le prossime indagini cosmologiche destinate a raccogliere dati ad alta precisione. L’articolo intitolato “Trasferire l’apprendimento oltre il modello standard”, scritto da Veena Krishnaraj e colleghi, è ora pubblicato su JSTAT.





