I modelli di linguaggio di grandi dimensioni (LLM) stanno diventando più intelligenti, ma c’è un grosso problema: non sanno come imparare in modo efficiente. Magellan è un nuovo quadro di intelligenza artificiale che imita l’apprendimento umano prevedendo i propri progressi, chiamandolo per navigare su enormi spazi obiettivi senza rimanere bloccati su ciò che è troppo facile o troppo difficile.
Sviluppato da ricercatori di Inria e MIT, tra cui Loris Gaven, Thomas Carta, Clément Romac, Cédric Colas, Sylvain Lamprier, Olivier Sigaud e Pierre-Yves Oudeyer, lo studio “Magellan: previsioni metacognitive della Guida all’apprendimento Guida Autotelica LLM Agenti in grandi spazi obiettivi“Introduce un framework che dà all’IA un’abilità metacognitiva, essenzialmente, l’abilità di prevedere quanto migliorerà praticando un compito. Ciò consente all’IA priorita la priorità agli obiettivi di apprendimento in modo aperto, proprio come fanno gli umani quando si affrontano nuove abilità.
L’intelligenza artificiale non dà la priorità all’apprendimento bene
I metodi di apprendimento dell’intelligenza artificiale tradizionali lottano in vasti spazi obiettivi. Neanche loro:
- Perdere tempo per le attività che hanno già imparatofare progressi lenti.
- Tentano obiettivi troppo difficiliportando a fallimenti ripetuti.
- Richiedere categorie di obiettivi definiti dall’uomoche è inefficiente e non si ridimensiona.
Gli umani, d’altra parte, istintivamente Cerca sfide che allungano le loro capacità senza essere impossibile. Magellan porta questo approccio umano alla formazione LLM.
Come funziona Magellan: prevedere i progressi, non solo prestazioni
Anche la maggior parte dei sistemi di formazione AI:
- Misura le prestazioni passate (che non aiuta con nuovi obiettivi).
- Usa valutazioni di difficoltà fisse (che non si adattano alle mutevoli abilità).
Magellan prende una strada più intelligente. Stima dinamicamente Quanto un’intelligenza artificiale migliorerà su un obiettivo se lo pratichi. Ciò consente ai modelli AI di selezionare compiti di apprendimento che massimizzano il progresso piuttosto che tentare le cose in modo casuale.
Il metodo funziona attraverso un processo chiamato Absolute Learning Progress (ALP)—Tracking di quanto un’intelligenza artificiale migliora nel tempo un determinato compito. Usando ALP, obiettivi di Magellan Clusters in categorie significative senza intervento umano, lasciare che l’IA si generalizza attraverso le abilità correlate.
I punteggi delle prestazioni LLM sono gonfiati: un nuovo metodo mostra la verità
Insegnare all’intelligenza artificiale per imparare come un essere umano
Per testare Magellan, i ricercatori hanno utilizzato un ambiente AI interattivo chiamato Piccolo Zoodove un agente LLM ha dovuto imparare vari compiti, come riconoscere gli oggetti, le piante in crescita e persino interagire con gli animali.
I risultati erano chiari:
- L’IA addestrata con Magellan ha sovraperformato tutti gli altri metodi, padroneggiando più compiti più velocemente.
- Si è generalizzato meglionel senso che potrebbe affrontare nuove sfide invisibili in modo più efficace.
- Non richiedeva categorie di obiettivi con etichetta umanadimostrando la sua scalabilità.
Al contrario, l’apprendimento tradizionale si avvicina al plateai in anticipo o richiesto Gruppi di obiettivi definiti da espertirendendoli rigidi e inefficienti.
Perché questo è importante
La più grande svolta di Magellan è l’apprendimento auto-diretto. Invece di fare affidamento sugli ingegneri umani per selezionare gli obiettivi, l’IA può determinare autonomamente cosa imparare in seguito in base ai propri progressi. Ciò sposta l’intelligenza artificiale dall’essere addestrata passivamente a migliorare attivamente se stesso, rendendolo un approccio trasformativo su più campi.
Gli assistenti di intelligenza artificiale possono insegnarsi nuove abilità identificando le aree in cui lottano, migliorando la loro capacità di adattarsi senza intervento umano. In robotica, le macchine possono perfezionare le loro capacità concentrandosi su compiti con il più alto potenziale di apprendimento, portando a sistemi autonomi più efficienti e capaci. Nell’istruzione, i tutor di AI possono adeguare le lezioni in tempo reale, non solo sulla base delle prestazioni passate ma sul miglioramento previsto, offrendo un’esperienza di apprendimento più personalizzata.
Magellan dimostra che l’IA può Pensa al proprio apprendimentorendendolo molto più efficiente in ambienti aperti. Il prossimo passo potrebbe essere ape xpanding di questo metodo oltre gli obiettivi basati sul testo in campi come robotica, scoperta scientifica e persino educazione umana.
Credito immagine in primo piano: Kerem Gülen/ideogramma