Anthropic ha annunciato il lancio di due nuovi modelli di intelligenza artificiale: un Claude 3.5 Sonnet aggiornato e un nuovo Claude 3.5 Haiku. Il Claude 3.5 Sonnet aggiornato offre miglioramenti a tutti i livelli, con miglioramenti significativi nelle capacità di codifica. Il nuovo Claude 3.5 Haiku offre funzionalità AI avanzate a un prezzo accessibile, eguagliando le prestazioni del precedente modello di punta di Anthropic, Claude 3 Opus, pur mantenendo velocità e costi simili a quelli del suo predecessore.
Claude 3.5 Sonetto
Il Claude 3.5 Sonnet aggiornato si basa sul successo del suo predecessore con prestazioni migliorate in varie attività, in particolare nella codifica. Anthropic ha sottolineato che Claude 3.5 Sonnet è leader nelle attività di ingegneria del software, mostrando notevoli miglioramenti in benchmark come Banco SWE verificatodove è migliorato dal 33,4% al 49,0%, superando gli altri modelli presenti sul mercato.
Il modello ha ottenuto buoni risultati anche nell’uso degli strumenti agentici, migliorando i punteggi su Panca TAU dal 62,6% al 69,2% nel settore della vendita al dettaglio e dal 36,0% al 46,0% nel settore delle compagnie aeree. Secondo i primi tester come GitLab e Cognition, questi aggiornamenti rappresentano un sostanziale passo avanti per la codifica e l’automazione basate sull’intelligenza artificiale, con migliori capacità di ragionamento e una latenza aggiuntiva minima.
Claude 3.5 Haiku
Claude 3.5 Haiku è progettato per offrire prestazioni all’avanguardia mantenendo bassi i costi. Il modello ottiene ottimi punteggi in benchmark come SWE-bench Verified, raggiungendo il 40,6%, superando molti agenti che utilizzano altri modelli all’avanguardia, tra cui l’originale Claude 3.5 Sonnet e GPT-4o. Il modello mira a servire applicazioni che necessitano di un’intelligenza artificiale veloce e affidabile, come prodotti rivolti all’utente e attività che richiedono esperienze personalizzate.
Anthropic rilascerà Claude 3.5 Haiku alla fine di questo mese, inizialmente disponibile come modello di solo testo con piani per il supporto dell’input di immagini in futuro. Sarà disponibile tramite l’API di Anthropic, Amazon Bedrock e Vertex AI di Google Cloud.
Claude AI di Anthropic è ora sul tuo iPad
L’uso del computer è disponibile come beta pubblica sperimentale
Anche l’antropologico ha introdotto una nuova funzionalità sperimentale chiamata “uso del computer”, disponibile nella versione beta pubblica. Gli sviluppatori possono indirizzare Claude 3.5 Sonnet a utilizzare i computer come un essere umano, guardando gli schermi, spostando i cursori e digitando. Questa funzionalità è ancora sperimentale, con alcune limitazioni, ma sviluppatori come Replit e The Browser Company hanno già iniziato a esplorare come potrebbe automatizzare processi complessi che comportano molti passaggi.
Questa funzionalità mira a insegnare competenze informatiche generali all’intelligenza artificiale, rendendola più versatile nel completare attività che in precedenza richiedevano strumenti personalizzati. Gli sviluppatori possono accedere a questa beta tramite l’API di Anthropic e altre importanti piattaforme cloud. Anche se i primi risultati sono promettenti, Anthropic riconosce che la tecnologia è ancora in fase di sviluppo, con difficoltà nell’esecuzione di alcune attività comuni del computer come lo scorrimento e il trascinamento.
Aziende come Asana, Canva, Cognition e DoorDash stanno sperimentando le nuove funzionalità, esplorando il potenziale dell’intelligenza artificiale per automatizzare i processi che tradizionalmente richiedevano l’input umano. I primi test condotti dall’AI Safety Institute degli Stati Uniti e dall’UK Safety Institute hanno rilevato che il Claude 3.5 Sonnet aggiornato soddisfa gli standard di sicurezza di Anthropic ed è adatto all’uso pubblico.
Anthropic sta anche affrontando i potenziali rischi associati alla capacità dell’intelligenza artificiale di interagire con i computer. Per garantire un’implementazione responsabile, l’azienda ha implementato nuove misure di sicurezza per identificare gli usi impropri, inclusi classificatori per rilevare azioni potenzialmente dannose. Anthropic incoraggia gli sviluppatori a utilizzare la funzionalità beta per attività a basso rischio mentre la tecnologia matura.
Il rilascio da parte di Anthropic degli aggiornamenti Claude 3.5 Sonnet e Claude 3.5 Haiku evidenzia la spinta dell’azienda ad espandere le capacità di intelligenza artificiale pur mantenendo norme di sicurezza. L’aggiunta di capacità sperimentali di utilizzo del computer rappresenta un nuovo passo avanti nel potenziale dell’intelligenza artificiale per eseguire compiti di uso generale, offrendo agli sviluppatori nuove possibilità da esplorare.
Crediti immagine: Antropico