Anthropic, un’azienda di intelligenza artificiale fondata da un gruppo di ex dipendenti di OpenAI, lo ha fatto annunciato che la sua ultima serie, la famiglia di modelli AI Claude 3, mostra prestazioni che corrispondono o superano quelle dei principali concorrenti di Google e OpenAI. Distinguendolo dai suoi predecessori, Claude 3 vanta capacità multimodali, consentendogli di interpretare sia input testuali che visivi.
Introduzione a Claude 3
Questa IA di ultima generazione di Anthropic, nota come Claude 3, comprende vari modelli tra cui Haiku, Sonetto e Opuscon Opus è il più avanzato. Anthropic afferma che questi modelli dimostrano “maggiori capacità” in attività che coinvolgono analisi e previsioni, mostrando prestazioni superiori in benchmark specifici rispetto a modelli come ChatGPT, GPT-4 e Gemini 1.0 Ultra di Google (escluso Gemini 1.5 Pro).
Un progresso significativo di Claude 3 è la sua introduzione come GenAI multimodale inaugurale di Anthropic, in grado di elaborare sia testo che immagini. Ciò posiziona Claude 3 accanto ad alcune versioni di GPT-4 e Gemini in termini di capacità, consentendogli di gestire fotografie, diagrammi, grafici e diagrammi tecnici provenienti da PDF, presentazioni e altri tipi di documenti.

Capacità multimodali
Il nuovo modello Claude stabilisce un nuovo standard tra i peer GenAI offrendo la possibilità di analizzare più immagini all’interno di un’unica richiesta, con la capacità di elaborare fino a 20 immagini contemporaneamente. Questa funzionalità consente a Claude 3 di eseguire analisi comparative e contrastanti delle immagini, secondo Anthropic.
Tuttavia, le capacità di Claude 3 nell’elaborazione delle immagini incontrano alcune limitazioni.
Anthropic ha implementato misure per impedire ai modelli Claude 3 di riconoscere gli individui, una decisione probabilmente influenzata da considerazioni etiche e legali. L’azienda riconosce che Claude 3 può elaborare in modo impreciso immagini di “bassa qualità” (sotto i 200 pixel) e deve affrontare sfide con compiti che richiedono ragionamento spaziale, come l’interpretazione del quadrante di un orologio analogico e il conteggio degli oggetti, con i modelli incapaci di fornire conteggi precisi degli oggetti. all’interno delle immagini.
Per ora, Claude 3 è progettato esclusivamente allo scopo di analizzare le immagini e non si avventurerà nella generazione di opere d’arte. Ciò delinea il suo ruolo nell’ambito delle capacità dell’intelligenza artificiale.
Quando si gestiscono sia testo che immagini, Anthropic lo segnala Claude 3 mostra un netto miglioramento nell’esecuzione di istruzioni multi-passo e nella generazione di output strutturato in formati come JSON. Vanta anche capacità di conversazione migliorate in lingue diverse dall’inglese rispetto alle versioni precedenti. Inoltre, questo modello è dotato di una “comprensione più sfumata delle richieste”, che riduce al minimo la sua propensione a rifiutarsi di rispondere alle domande. Nel prossimo futuro, i modelli verranno aggiornati per citare le fonti delle loro risposte, consentendo agli utenti di verificare le informazioni fornite.

Claude 3 lo è caratterizzato dalla sua capacità di produrre risposte che non sono solo più espressive e coinvolgenti, ma anche più reattive ai suggerimenti diretti. Ciò rende più semplice per gli utenti guidare l’intelligenza artificiale per ottenere i risultati desiderati con istruzioni concise e chiare.
Questi miglioramenti sono attribuiti a Claude 3 comprensione contestuale più ampiasottolineando l’impegno di Anthropic nel perfezionare l’interazione e le capacità prestazionali del modello.
Dovresti comprare Claude Pro per $ 20?
Il concetto di contesto di un modello, o finestra di contesto, è cruciale in quanto riguarda l’ampiezza dei dati di input (come il testo) che un modello valuta prima di generare un output. I modelli vincolati da finestre di contesto ristrette spesso faticano a mantenere la sostanza delle interazioni recenti, portando a risposte che potrebbero andare fuori tema o incontrare problemi problematici. Al contrario, i modelli dotati di ampie finestre contestuali sono in grado di mantenere un flusso narrativo coeso, consentendo loro di creare risposte contestualmente ricche e sfumate.
Anthropic rivela che inizialmente questo modello è destinato a supportare un’impressionante Finestra di contesto da 200.000 tokenche si traduce approssimativamente 150.000 parole. Questa capacità sarà estesa fino a Finestra di contesto da 1 milione di token (circa 700.000 parole) per un gruppo selezionato di clienti, una funzionalità che allinea Claude 3 con le capacità dell’ultimo modello GenAI di Google, Gemini 1.5 Pro, noto per la sua finestra di contesto da milioni di token.
Riconoscere le imperfezioni di Claude 3
Nonostante i progressi che i nuovi modelli Claude rappresentano rispetto ai modelli precedenti, non è privo di imperfezioni. In un whitepaper tecnico dettagliato, Anthropic ammette che Claude 3 condivide vulnerabilità comuni con altri modelli GenAI, come pregiudizi e una tendenza alle allucinazioni, ovvero alla fabbricazione di informazioni. Distinto da alcuni dei suoi omologhi, questo modello non ha la capacità di condurre ricerche sul web, basandosi invece su dati precedenti all’agosto 2023 per generare risposte. Inoltre, sebbene sia competente in più lingue, la sua padronanza di alcune lingue “a scarse risorse” non corrisponde alla sua conoscenza dell’inglese.
Anthropic si impegna a fornire aggiornamenti regolari per Claude 3, con l’obiettivo di perfezionare e migliorare le prestazioni e le capacità del modello nei prossimi mesi. Questo continuo sforzo di sviluppo sottolinea l’impegno di Anthropic nel mitigare i limiti del modello e nell’ampliare la sua utilità attraverso diverse applicazioni.

Dettagli sui prezzi di Claude
Attualmente, Anthropic ha realizzato sia i modelli Opus che Sonnet di Claude 3 accessibile attraverso varie piattaforme tra cui la propria interfaccia web, console di sviluppo e API, nonché tramite la piattaforma Bedrock di Amazon e Vertex AI di Google. Si prevede che il modello Haiku verrà rilasciato entro la fine dell’anno.
Anthropic ha fornito una struttura tariffaria dettagliata per questi modelli come segue:
Modello | Prezzo per milione di token di input | Prezzo per milione di token di output |
Opus | $ 15 | $75 |
Sonetto | $ 3 | $ 15 |
Haiku | $ 0,25 | $ 1,25 |
Credito immagine in primo piano: Antropico