Databricks presenta DBRX, un innovativo modello linguistico open source pronto a rivoluzionare la comprensione del linguaggio. Costruito su un’architettura avanzata, DBRX mostra notevoli progressi in attività come la codifica e la risoluzione di problemi di matematica. Superando alcuni modelli, pensi che siano i migliori nel mercato LLM!
Ma cosa distingue DBRX dal resto? Approfondiamo il suo processo di sviluppo ed esploriamo le interessanti funzionalità che offre.
Cos’è il DBRX?
DBRX è un modello LLM (Large Language Model) open source sviluppato da Databricks, con l’obiettivo di offrire un’alternativa competitiva nel panorama in rapida evoluzione dell’intelligenza artificiale. Costruito su un’architettura mista di esperti (MoE) a grana fine, DBRX dimostra notevoli progressi nella comprensione del linguaggio, in particolare nelle attività di programmazione e ragionamento matematico. In particolare, supera alcuni modelli consolidati come GPT-3.5 e compete ragionevolmente con modelli chiusi come Gemini 1.0 Pro.
Modello | DBRX Istruire |
GPT-3.5 | GPT-4 | Claude 3 Haiku | Claude 3 Sonetto | Claude 3 Opus | Gemelli 1.0 Pro | Gemelli 1.5 Pro | Maestrale medio | Mistral Grande |
Panca MT (inflessione corretta, n=5) | 8,39 ± 0,08 | — | — | 8,41 ± 0,04 | 8,54 ± 0,09 | 9,03 ± 0,06 | 8,23 ± 0,08 | — | 8,05 ± 0,12 | 8,90 ± 0,06 |
MMLU 5 colpi | 73,7% | 70,0% | 86,4% | 75,2% | 79,0% | 86,8% | 71,8% | 81,9% | 75,3% | 81,2% |
HellaSwag 10 colpi | 89,0% | 85,5% | 95,3% | 85,9% | 89,0% | 95,4% | 84,7% | 92,5% | 88,0% | 89,2% |
HumanEval 0-Shot passaggio@1 (Programmazione) |
70,1%
temperatura=0, N=1 |
48,1% | 67,0% | 75,9% | 73,0% | 84,9% | 67,7% | 71,9% | 38,4% | 45,1% |
GSM8k CoT maj@1 | 72,8% (5 colpi) | 57,1% (5 colpi) | 92,0% (5 colpi) | 88,9% | 92,3% | 95,0% | 86,5%
(maj1@32) |
91,7% (11 colpi) | 66,7% (5 colpi) | 81,0% (5 colpi) |
VinoGrande 5 colpi | 81,8% | 81,6% | 87,5% | — | — | — | — | — | 88,0% | 86,7% |
DBRX è stato sviluppato attraverso un processo intensivo durato tre mesi, basandosi su mesi di ricerca e sperimentazione precedenti. La formazione è stata condotta su una potente infrastruttura composta da 3072 Nvidia H100È connesso tramite Infiniband da 3,2 Tbps. Sfruttando la suite di strumenti di Databricks, tra cui Unity Catalog per la governance dei dati, Lilac AI per l’esplorazione dei dati, Apache Spark e notebook Databricks per l’elaborazione dei dati e librerie di formazione ottimizzate come MegaBlocks e LLM Foundry, DBRX è stato addestrato e messo a punto su migliaia di GPU che utilizzano il servizio Mosaic AI Training. I risultati sono stati registrati utilizzando MLflow e il feedback umano è stato raccolto per il miglioramento della qualità tramite Mosaic AI Model Serving e Inference Tables.
Allora, cosa può fare DBRX?? Può fare molte cose, come rispondere a domande, scrivere codice, risolvere problemi di matematica e analizzare dati. Può anche aiutare nella scrittura correggendo la grammatica e suggerendo miglioramenti. DBRX può comprendere diverse lingue e persino analizzare i sentimenti nel testo. È come un assistente intelligente che può svolgere molte attività che coinvolgono linguaggio e dati. Inoltre, gli utenti possono personalizzarlo per esigenze specifiche. DBRX potrebbe sorprenderti con le sue prestazioni rispetto ad altri popolari LLM.

Accessibile a sviluppatori e aziende, DBRX fornisce sia il modello base che le versioni ottimizzate con licenza aperta, incoraggiando l’esplorazione collaborativa e l’innovazione. La sua enfasi sull’efficienza sia nell’addestramento che nell’inferenza, insieme alle sue dimensioni gestibili, lo rendono una soluzione potenzialmente conveniente per varie applicazioni di intelligenza artificiale.
Come utilizzare DBRX
L’utilizzo di DBRX è reso accessibile tramite vari mezzi forniti da Databricks:
- API del modello di base: offerte di Databricks API del modello di base, che consentono agli utenti di interagire con DBRX attraverso una semplice interfaccia. Gli utenti possono sfruttare queste API per integrare DBRX nelle proprie applicazioni e flussi di lavoro.
- Interfaccia chat del parco giochi AI: Per sperimentazioni e test rapidi, gli utenti possono accedere a DBRX tramite Parco giochi IA interfaccia di chat. Questa interfaccia fornisce un ambiente intuitivo per interagire con il modello ed esplorarne le capacità.
Nel complesso, sfruttando gli strumenti e le risorse forniti da Databricks, gli utenti possono facilmente incorporare DBRX nei propri flussi di lavoro e sfruttare le sue capacità per un’ampia gamma di applicazioni nell’elaborazione del linguaggio naturale e nell’intelligenza artificiale.
Per informazioni più dettagliate, fare clic su Qui.
Credito immagine in primo piano: Databricks