Anthropic ha introdotto strumenti innovativi progettati per semplificare il processo di prompt engineering, un lavoro che ha ottenuto una notevole trazione lo scorso anno. L’ultima release dell’azienda mira ad automatizzare parzialmente questo compito cruciale, migliorando lo sviluppo di applicazioni utilizzando il suo modello di linguaggio, Claude.
Martedì, Anthropic ha annunciato diverse nuove funzionalità tramite un post sul blogevidenziando le capacità di Claude 3.5 Sonnet. Questa versione aggiornata consente agli sviluppatori di generare, testare e valutare i prompt in modo più efficiente, sfruttando tecniche avanzate di progettazione dei prompt per perfezionare gli input e migliorare le risposte di Claude per attività specifiche.
I modelli linguistici sono generalmente adattabili quando vengono fornite istruzioni, ma piccoli aggiustamenti nella formulazione dei prompt possono migliorare significativamente i risultati. Tradizionalmente, gli sviluppatori avrebbero dovuto determinare la formulazione ottimale da soli o impiegare un tecnico dei prompt. La nuova funzionalità di Anthropic fornisce un feedback rapido, semplificando il processo di identificazione e implementazione dei miglioramenti.
Come valutare i prompt in Anthropic Console?
I nuovi strumenti sono integrati in Anthropic Console, in particolare nella nuova scheda Evaluate. Console funge da piattaforma di sviluppo per le aziende che mirano a creare prodotti con Claude. Una caratteristica degna di nota, introdotta a maggio, è il generatore di prompt integrato, che trasforma brevi descrizioni di attività in prompt completi utilizzando le tecniche proprietarie di Anthropic. Sebbene questi strumenti non siano pensati per sostituire completamente i prompt engineer, sono progettati per assistere i principianti e velocizzare il flusso di lavoro per i professionisti esperti.

Nella scheda Valuta, gli sviluppatori possono valutare l’efficacia dei loro prompt AI in vari scenari. Possono caricare esempi del mondo reale in una suite di test o richiedere a Claude di generare diversi casi di test. Questa configurazione consente agli sviluppatori di confrontare diversi prompt affiancati e di valutare le risposte risultanti su una scala a cinque punti.
L’assistente AI Claude di Anthropic ora sta nella tua tasca
Ad esempio, in uno scenario condiviso sul blog di Anthropic, uno sviluppatore ha notato che la sua applicazione produceva risposte eccessivamente brevi. Modificando una singola riga nel prompt, è stato in grado di generare risposte più lunghe in tutti i casi di test contemporaneamente. Questa funzionalità può ridurre significativamente il tempo e lo sforzo richiesti, in particolare per coloro con competenze ingegneristiche limitate in prompt.
Ecco alcuni casi di utilizzo reali dei nuovi strumenti di Anthropic nell’ingegneria dei prompt:
- Automazione del supporto clienti:
- Compito: Gestire le richieste di assistenza clienti in entrata.
- Soluzione: Utilizzando il generatore di prompt integrato, un team di assistenza clienti può descrivere il proprio compito e far generare a Claude prompt di alta qualità. È possibile creare casi di test per simulare varie richieste dei clienti, consentendo al team di perfezionare i propri prompt per risposte automatiche più accurate e utili.
- Moderazione dei contenuti:
- Compito: Identifica e segnala i contenuti inappropriati su una piattaforma di social media.
- Soluzione: Gli sviluppatori possono usare la funzionalità di generazione di casi di test di Claude per creare scenari di diversi tipi di contenuti. Eseguendo questi casi di test, possono perfezionare i prompt per migliorare l’accuratezza e l’affidabilità della moderazione dei contenuti, assicurando che i contenuti dannosi vengano effettivamente segnalati.
- Personalizzazione dell’e-commerce:
- Compito: Consiglia prodotti in base alle preferenze dell’utente e alla cronologia di navigazione.
- Soluzione: Un sito di e-commerce può sfruttare il generatore di prompt per creare prompt dettagliati che catturano le preferenze dell’utente. La funzionalità Evaluate consente agli sviluppatori di testare questi prompt con vari input di dati utente, ottimizzando i consigli per esperienze di acquisto personalizzate.
- Sistemi di tutoraggio educativo:
- Compito: Fornire tutoraggio personalizzato in base alle richieste degli studenti.
- Soluzione: Le aziende di tecnologia educativa possono usare il generatore di prompt per creare prompt che rispondano alle domande comuni degli studenti. Generando casi di test con una varietà di domande degli studenti e valutando le risposte, possono migliorare la capacità del sistema di tutoraggio di fornire spiegazioni accurate e utili.
- Consulenza sanitaria:
- Compito: Fornire consigli sanitari preliminari in base ai sintomi del paziente.
- Soluzione: Le app sanitarie possono descrivere diversi scenari di sintomi per generare prompt che guidano i pazienti verso potenziali passaggi successivi. La funzionalità Evaluate consente di testare questi prompt su numerosi casi di sintomi, perfezionando il consiglio per garantire che sia accurato e sicuro.
Credito immagine in evidenza: Antropico