OpenAI potrebbe presto rilasciare uno strumento AI in grado di prendere il controllo dei PC degli utenti ed eseguire azioni per loro conto, denominato strumento Operatore. L’ingegnere del software Tibor Blaho, noto per aver divulgato con precisione i prossimi prodotti di intelligenza artificiale, affermazioni aver trovato prove a sostegno di questo sviluppo.
OpenAI prevede il lancio a gennaio per l’operatore dello strumento AI
Secondo quanto riferito, OpenAI mira a a Gennaio lancio di Operator. Le recenti scoperte di Blaho includono opzioni nascoste nel client ChatGPT di OpenAI per macOS che consentono agli utenti di definire scorciatoie per “Attiva/disattiva operatore” e “Forza uscita operatore”. Inoltre, Blaho nota che OpenAI ha aggiunto riferimenti a Operator sul suo sito web, sebbene questi riferimenti non siano ancora visibili pubblicamente.
OpenAI lancerà a gennaio un operatore autonomo con agenti AI
Secondo Blaho, il sito web contiene anche tabelle inedite che confrontano le prestazioni di Operator con altri sistemi di intelligenza artificiale che utilizzano computer. Se i numeri sono accurati, indicano che l’Operatore non è del tutto affidabile, a seconda dell’attività. Ad esempio, in un benchmark su OSWorld, che simula un ambiente informatico reale, “OpenAI Computer Use Agent (CUA)” ha ottenuto un punteggio del 38,1%, migliore del modello di Anthropic ma significativamente inferiore al punteggio del 72,4% ottenuto dagli esseri umani. OpenAI CUA supera gli agenti umani nel test WebVoyager, che valuta le capacità di navigazione web di un’intelligenza artificiale, ma ha prestazioni inferiori su un altro benchmark, WebArena.
L’operatore sembra avere difficoltà con compiti tipicamente facili per gli esseri umani. Nei test che richiedevano all’Operatore di iscriversi a un fornitore di servizi cloud e di avviare una macchina virtuale, l’operazione ha avuto successo nel 60% dei casi. Nel frattempo, secondo quanto trapelato, è riuscita a creare un portafoglio Bitcoin solo il 10% delle volte parametri di riferimento.
OpenAI sta entrando nello spazio degli agenti AI in un momento in cui anche concorrenti come Anthropic e Google stanno avanzando in questo settore. La società di analisi Markets and Markets prevede che il mercato degli agenti IA potrebbe raggiungere i 47,1 miliardi di dollari entro il 2030. Sebbene gli agenti IA rimangano in una fase primitiva di sviluppo, alcuni esperti esprimono preoccupazione per la loro sicurezza, soprattutto se la tecnologia migliorerà rapidamente.
Un grafico trapelato indica che l’Operatore ottiene buoni risultati in alcune valutazioni di sicurezza, in particolare nel resistere ai tentativi di impegnarsi in attività illecite e cercare dati personali sensibili. Secondo quanto riferito, i test di sicurezza hanno contribuito al lungo ciclo di sviluppo di Operator. Il cofondatore di OpenAI Wojciech Zaremba criticato Il recente rilascio dell’agente di Anthropic per la mancanza di misure di sicurezza, indica un potenziale contraccolpo se OpenAI dovesse accelerare un rilascio simile.
Le critiche sono state rivolte a OpenAI da ricercatori di intelligenza artificiale ed ex personale per aver presumibilmente dato priorità alla rapida produzione della tecnologia rispetto alle misure di sicurezza.
Credito immagine: Tibor Blaho