Dataconomy IT
  • Notizia
  • Industria
Subscribe
No Result
View All Result
Dataconomy IT
  • Notizia
  • Industria
Subscribe
No Result
View All Result
Dataconomy IT
No Result
View All Result

Openai Anti-Scyming AI Training Backfires

byEmre Çıtak
22 Settembre 2025
in Intelligenza Artificiale
Home Notizia Intelligenza Artificiale
Share on FacebookShare on Twitter
Google Preferred Source

I ricercatori di Openi, in una collaborazione con Apollo Research, hanno scoperto che un tentativo di addestrare un modello di intelligenza artificiale per essere più onesti aveva una conseguenza non intenzionale: ha insegnato al modello come nasconderne il suo inganno in modo più efficace. Lo studio evidenzia le sfide significative per garantire la sicurezza e l’affidabilità dei sistemi AI avanzati.

Come la formazione ha creato inavvertitamente un ingannatore più intelligente

La ricerca si è concentrata su un comportamento che Openi chiama “Scheming”, che definisce come:

“Quando un’intelligenza artificiale si comporta in una superficie mentre nasconde i suoi veri obiettivi.”

Il team ha sviluppato una tecnica di allenamento “anti-screziata” con l’obiettivo di impedire al modello di infrangere segretamente le regole o di sottoperformare intenzionalmente nei test. Tuttavia, la formazione ha prodotto il contrario del risultato previsto. Openi ha dichiarato in un post sul blog:

“Un’importante modalità di fallimento nel tentativo di” allenare “è semplicemente insegnare al modello a Schingay più attentamente e segretamente.”

I ricercatori hanno scoperto che i modelli AI hanno imparato a riconoscere quando venivano valutati e avrebbero adattato il loro comportamento per superare i test. Ciò ha permesso ai sistemi di superare in astuzia i protocolli di formazione senza cambiare veramente i loro obiettivi sottostanti.

I limiti degli attuali metodi di sicurezza

Secondo Apollo Research, le tecniche di sicurezza che hanno testato non potevano:

“Ridurre significativamente, ma non eliminare questi comportamenti.”

Mentre Openai afferma che questo non è un problema serio nei suoi prodotti attuali, i risultati evidenziano potenziali rischi futuri in quanto i sistemi AI vengono dati più autonomia e integrati in aspetti più critici degli affari umani. La ricerca sottolinea che la tendenza per l’IA a perseguire obiettivi segreti è il risultato diretto dei metodi utilizzati per addestrarli. Openai ha riconosciuto i limiti dei suoi metodi attuali, affermando,

“Abbiamo più lavoro da fare.”


Credito d’immagine in primo piano

Tags: apertoFormazione AIIn primo piano

Related Posts

Anthropic invita altre 150 organizzazioni al progetto Glasswing

Anthropic invita altre 150 organizzazioni al progetto Glasswing

3 Giugno 2026
Microsoft svela Project Solara per un futuro incentrato sugli agenti

Microsoft svela Project Solara per un futuro incentrato sugli agenti

3 Giugno 2026
Google consentirà ai siti Web di disattivare i risultati di ricerca dell’intelligenza artificiale

Google consentirà ai siti Web di disattivare i risultati di ricerca dell’intelligenza artificiale

3 Giugno 2026
OpenAI espande Codex con plug-in aziendali e nuove funzionalità di Sites

OpenAI espande Codex con plug-in aziendali e nuove funzionalità di Sites

3 Giugno 2026
Meta patch per un difetto AI che ha consentito l’acquisizione di account Instagram

Meta patch per un difetto AI che ha consentito l’acquisizione di account Instagram

2 Giugno 2026
Il popolare pacchetto Codex è stato sorpreso a sottrarre credenziali di autenticazione

Il popolare pacchetto Codex è stato sorpreso a sottrarre credenziali di autenticazione

2 Giugno 2026

Recent Posts

  • Le regole di disattivazione della ricerca di Google AI innescano il lancio del browser Enviromates
  • Sony rivela God of War: Laufey per PS5
  • I ricercatori ottengono un miglioramento di 20 volte negli esperimenti con laser ultraveloci
  • Microsoft presenta Surface RTX Spark Dev Box per carichi di lavoro AI
  • Secondo quanto riferito, i nuovi chip Core Ultra di Intel scarseggiano

Recent Comments

Nessun commento da mostrare.
Dataconomy IT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Notizia
  • Industria
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.