Disponibile su Amazon Bedrock, la gamma Amazon Nova include Nova Micro, un modello da testo a testo altamente efficiente, Nova Lite, Nova Pro e Nova Premier, modelli multimodali che elaborano testo, immagini e video per generare contenuto di testo.
Amazon ha inoltre presentato due modelli aggiuntivi: Tela di Amazon Novaprogettato per produrre immagini di qualità professionale e Bobina Amazon Novache genera video di livello professionale.
Rohit Prasad, vicepresidente senior di Amazon Artificial General Intelligence, ha evidenziato la prospettiva unica di Amazon, affermando:
“In Amazon utilizziamo quasi 1.000 applicazioni IA. Questo ci fornisce una comprensione di alto livello di dove gli sviluppatori continuano ad affrontare le sfide. I nostri nuovi modelli Amazon Nova mirano ad aiutare gli sviluppatori sia all’interno che all’esterno di Amazon a superare queste barriere. Offrono eccezionali capacità di intelligence e generazione di contenuti, migliorando allo stesso tempo la latenza, il rapporto costo-efficacia, la personalizzazione, la generazione aumentata di recupero (RAG) e le funzionalità basate su agenti.
Amazon Nova: Intelligenza e velocità in azione
La gamma Nova comprende quattro modelli: Amazon NovaMicro lead con latenza e costi estremamente bassi, che lo rendono ideale per applicazioni di solo testo che richiedono risposte rapide. I restanti tre modelli spingono i confini dell’IA multimodale:
- Amazon Nova Lite è un’opzione conveniente per l’elaborazione di immagini, video e testo a velocità notevoli.
- Amazon Nova Pro combina precisione, velocità ed efficienza dei costi per un’ampia gamma di attività, offrendo funzionalità avanzate in più modalità.
- Amazon NovaPremier rappresenta il modello multimodale più potente di Amazon, eccellendo in compiti di ragionamento complessi e fungendo da “insegnante” ideale per distillare modelli più piccoli e specializzati.
Amazon Nova Micro, Nova Lite e Nova Pro sono già disponibili per uso generale, mentre Nova Premier verrà lanciato nel primo trimestre del 2025.
Risultati dei benchmark delle prestazioni
I modelli Nova sono stati rigorosamente testati rispetto ai benchmark standard del settore. I risultati mostrano che questi modelli funzionano costantemente alla pari o superano le principali alternative.
- Amazon NovaMicro fornito risultati competitivi, eguagliando o sovraperformando Meta LLaMa 3.1 8B su 11 benchmark e Google Gemini 1.5 Flash-8B su 12 benchmark. Con una velocità di output leader del settore di 210 token al secondo, è ideale per le applicazioni che richiedono risposte rapide.
- Amazon Nova Lite ha dimostrato ottime prestazioni rispetto ai benchmark, inclusa la precisione per le attività di testo e la comprensione di video, grafici e documenti, eccellendo nei test VATEX, ChartQA e DocVQA.
- Amazon Nova Pro ha messo in mostra le sue capacità superando OpenAI GPT-4o in 17 benchmark su 20 e fornendo risultati eccezionali per i flussi di lavoro RAG, il rispetto delle istruzioni e le attività basate su agenti.
Supporto di attività a lungo contesto, multilingue e multimodali
I modelli Amazon Nova Micro, Lite e Pro supportano oltre 200 lingue. Nova Micro gestisce contesti di input fino a 128.000 token, mentre Nova Lite e Nova Pro supportano fino a 300.000 token o elaborazione video di 30 minuti. Amazon prevede di espanderlo a oltre 2 milioni di token all’inizio del 2025.
Prestazioni convenienti e ad alta velocità
I modelli Amazon Nova sono progettati per offrire velocità eccezionali ed efficienza dei costi. Rispetto ad altri modelli con le migliori prestazioni nelle loro classi di intelligenza su Amazon Bedrock, Nova Micro, Nova Lite e Nova Pro sono almeno 75% più conveniente offrendo allo stesso tempo le prestazioni più veloci.
Integrazione perfetta con Amazon Bedrock
I modelli Amazon Nova si integrano direttamente con Amazon Bedrock, il servizio completamente gestito di AWS che offre ai clienti l’accesso ai modelli di base dei principali fornitori di intelligenza artificiale e di Amazon stessa tramite un’unica chiamata API. Con Bedrock, gli sviluppatori possono facilmente testare e valutare i modelli Nova insieme ad altre opzioni per determinare la soluzione migliore per le loro applicazioni.
Personalizzazione attraverso la messa a punto
I modelli Amazon Nova supportano la messa a punto personalizzata, consentendo ai clienti di migliorare la precisione guidando i modelli con esempi tratti dai propri dati. I modelli apprendono ciò che conta di più per un cliente, che si tratti di testo, immagini o video, e Amazon Bedrock fornisce quindi risposte personalizzate e ottimizzate.
Distillazione efficiente per modelli più piccoli e specializzati
Oltre alla messa a punto, Nova supporta modello di distillazioneconsentendo il trasferimento di conoscenze da modelli di grandi dimensioni e ad alta capacità a modelli più piccoli, più veloci e più convenienti senza sacrificare la precisione.
Miglioramento della precisione con la generazione aumentata di recupero
I modelli Amazon Nova si integrano perfettamente con Base di conoscenza di Amazon Bedrockconsentendo la generazione aumentata di recupero (RAG) per fornire risposte basate sui dati di un’organizzazione per i massimi livelli di precisione.
Ottimizzato per le applicazioni dell’agente
Progettati per eccellere in attività in più fasi, i modelli Nova sono ottimizzati per applicazioni basate su agenti che richiedono l’interazione con sistemi e dati proprietari tramite più API.
Contenuti visivi di qualità produttiva
Tela di Amazon Nova genera immagini di qualità professionale da istruzioni di testo o immagini, con controlli integrati per la modifica, la regolazione del colore e i layout. Le misure di salvaguardia integrate includono il watermarking e la moderazione dei contenuti per garantire un uso responsabile dell’IA. Nelle valutazioni, Nova Canvas ha sovraperformato modelli come OpenAI DALL·E 3 e Stable Diffusion.
Bobina Amazon Nova consente ai clienti di creare video di alta qualità da testo e immagini. Progettato per contenuti pubblicitari, di marketing e didattici, consente il controllo su stili visivi, ritmo ed effetti della fotocamera. Nova Reel ha costantemente sovraperformato i concorrenti, con i revisori che hanno preferito il suo risultato rispetto a Runway Gen-3 Alpha. Sebbene attualmente supporti video da sei secondi, Nova Reel si espanderà alla generazione di video da due minuti nei prossimi mesi.
Guardando al futuro: discorso e modelli da multimodale a multimodale
Nel primo trimestre del 2025, Amazon prevede di rilasciare a modello discorso-parlato progettato per trasformare le applicazioni AI per interazioni vocali naturali. Il modello interpreterà il linguaggio parlato, il tono e il ritmo per fornire risposte simili a quelle umane con una latenza minima.
Inoltre, Amazon sta sviluppando un modello multimodale-multimodale in grado di prendere testo, immagini, audio e video come input e produrre output attraverso una qualsiasi di queste modalità. Questo modello, previsto per la metà del 2025, semplificherà le applicazioni che richiedono traduzione, editing e comprensione multimodale dei contenuti.
Adozione anticipata
Diverse organizzazioni leader stanno già adottando i modelli Nova:
- LINFA integra i modelli Nova in SAP AI Core per potenziare soluzioni basate sull’intelligenza artificiale nell’automazione, personalizzazione e pianificazione della catena di fornitura.
- Deloitte sta sfruttando le capacità avanzate di personalizzazione di Nova per fornire servizi di intelligenza artificiale generativa su misura a livello globale.
- Dentsu Digital Inc. utilizza Nova Reel per semplificare la produzione video creativa, riducendo le tempistiche delle campagne da settimane a giorni.
- Musixmatch incorpora Nova Reel nella sua piattaforma per aiutare gli artisti emergenti a generare video musicali di alta qualità.
- 123RF sta semplificando i processi di progettazione per i creatori di contenuti con Nova Canvas e Nova Reel.
- Caylent utilizza i modelli Nova per accelerare i flussi di lavoro di comprensione dei video per clienti del settore media, sport e vendita al dettaglio.
- Tecnologie Palantir integra Nova Pro con il suo sistema ontologico per migliorare i flussi di lavoro decisionali basati sull’intelligenza artificiale in tutti i settori.
- Shutterstock incorpora Nova Canvas nel suo generatore di immagini AI per offrire una soluzione intuitiva per la creazione di contenuti visivi di alta qualità.
AWS ha rilasciato informazioni dettagliate Carte Servizi AI per i modelli Nova, fornendo trasparenza su casi d’uso, limitazioni e pratiche di intelligenza artificiale responsabile: