Antropico ha lanciato Claude 3.7, il primo modello AI al mondo in grado di produrre output standard o una quantità controllabile di “ragionamento” per affrontare problemi complessi. Questo modello ibrido è progettato per migliorare l’interazione degli utenti e degli sviluppatori consentendo un equilibrio tra risposte istintive e ragionamento metodico.
Antropico svelante Claude 3.7: il primo modello di AI di ragionamento ibrido

Michael Gerstenhaber, protagonista del prodotto presso Antropic, ha dichiarato: “Il [user] Ha molto controllo sul comportamento: quanto tempo pensa e può scambiare ragionamento e intelligenza con il tempo e il budget. ” Claude 3.7 introduce una funzione “ScratchPad” che visualizza il processo di ragionamento del modello, trarre ispirazione dal popolare modello di AI cinese Deep -Week. Questa funzionalità aiuta gli utenti a comprendere l’approccio del modello alla risoluzione dei problemi, facilitando gli aggiustamenti rapidi.
Dianne Penn, piombo del prodotto della ricerca in antropico, ha sottolineato l’efficacia del graffio in tandem con la capacità di ragionamento regolabile. Gli utenti possono istruire il modello ad allocare più tempo per la risoluzione dei problemi se i tentativi iniziali non producono la rottura desiderata.

La struttura ibrida di Claude 3.7 lo distingue dai concorrenti. Mentre Openai ha rilasciato un modello di ragionamento chiamato O1 nel settembre 2024 e successivamente una versione più robusta denominata O3, entrambi richiedono agli utenti di passare da un mezzo ai modelli per accedere alle funzionalità di ragionamento. Claude 3.7 di Antropico consente di attivare le risposte convenzionali e un ragionamento esteso, un vantaggio significativo.
Il modello ibrido si allinea con i framework di ragionamento descritti dall’economista vincitore del premio Nobel Daniel Kahneman nel suo libro “Pensiero, veloce e lento”, offrendo processi cognitivi sia istintivi che deliberati. I modelli standard, come i modelli di grandi dimensioni (LLM), generano in genere risposte istantanee ma possono vacillare in compiti che richiedono ragionamenti approfonditi, come i calcoli aritmetici.
Per migliorare le capacità di Claude 3.7, l’apprendimento del rinforzo impiegato antropico per addestrare il modello con dati aggiuntivi incentrati su applicazioni aziendali come la codifica e le richieste legali. Penn ha osservato che “le cose su cui abbiamo apportato miglioramenti sono […] soggetti o soggetti tecnici che richiedono un lungo ragionamento. ” Il modello ha sovraperformato l’O1 di Openi in quadri specifici come SWE-Bench quando si affrontano sfide di codifica complesse.
Claude Ai ora può rispecchiare perfettamente il tuo stile di scrittura
Codice Claude
La società ha introdotto Claude Code, un nuovo strumento progettato per aiutare con attività di codifica guidate dall’IA, che si comporta bene in scenari complessi. “Il modello è già bravo nella codifica”, ha aggiunto Penn. “[But] Il pensiero aggiuntivo sarebbe buono per i casi che potrebbero richiedere una pianificazione molto complessa: ad esempio stai guardando una base di codice estremamente grande per un’azienda. “

Claude 3.7 Sonnet è disponibile in tutti i piani di Claude – Free, Pro, Team e Enterprise – nonché attraverso l’API antropica, Amazon Bedrock e il vertice AI di Google Cloud. Il modello mantiene la stessa struttura dei prezzi dei suoi predecessori: $ 3 per milione di token di input e token di uscita di $ 15 per milione, che include token di pensiero.
Antropico ha sviluppato Claude 3.7 Sonet con una filosofia che integra il ragionamento come componente principale del modello. Funziona sia come LLM ordinario aggiornato che come modello di ragionamento, consentendo agli utenti di scegliere quando desiderano risposte dirette o risposte più basse e più riflessive. In modalità di pensiero esteso, Claude 3.7 perfeziona le sue risposte, migliorando le prestazioni su attività in matematica, fisica, following delle istruzioni e codifica.
Utilizzando Claude 3.7 Sonnet tramite l’API, gli utenti possono controllare il loro budget “pensiero” specificando un numero massimo di token. Questa flessibilità consente agli utenti di dare la priorità alla velocità rispetto alla qualità del risultato.
Le recenti valutazioni di Claude indicano la leadership nelle capacità di codifica su più piattaforme. Il cursore ha riconosciuto Claude come il migliore per le attività di codifica del mondo reale, con progressi nella gestione di intricate basi di codice. La cognizione ha riportato prestazioni superiori nelle alterazioni del codice di pianificazione, mentre Vercel ha notato la sua precisione nella navigazione di flussi di lavoro di agenti complessi. REPLIT ha effettivamente impiegato Claude per lo sviluppo di sofisticate applicazioni Web e i test condotti da Canva hanno rivelato che Claude offre costantemente un codice pronto per la produzione con una migliore qualità del design e un minor numero di errori.
Claude Code, attualmente in anteprima di ricerca limitata, funziona come uno strumento collaborativo in grado di leggere, modificare il codice, eseguire test e interagire con GitHub, semplificando il processo di codifica. I primi test hanno dimostrato che il codice Claude può svolgere attività in una singola sessione che di solito richiede un ampio sforzo manuale. I miglioramenti futuri si concentreranno sull’affidabilità degli strumenti, sul supporto a lungo comando e sulle prestazioni migliorate.
Antropico ha sottolineato il suo impegno nello sviluppo di Sonetto Claude 3.7 con particolare attenzione alla sicurezza, alla sicurezza e all’affidabilità. Claude 3.7 ha fatto distinzioni riconoscibili tra richieste benigne e dannose, ottenendo una riduzione del 45% dei rifiuti inutili rispetto al suo predecessore. Le valutazioni della sicurezza dei dettagli della carta di sistema di accompagnamento che potrebbero beneficiare di altre iniziative di ricerca e affrontano rischi emergenti, inclusi rapidi attacchi di iniezione.
Claude 3.7 Sonnet e Claude Codice rappresentano progressi significativi nei confronti dei sistemi AI che possono supportare efficacemente le capacità umane integrando un ragionamento profondo e una collaborazione autonoma.
Credito immagine in primo piano: antropico