I produttori di chip Nvidia e Groq inserito un accordo di licenza tecnologica non esclusivo la scorsa settimana per accelerare e ridurre i costi di esecuzione di modelli linguistici di grandi dimensioni pre-addestrati utilizzando i chip delle unità di elaborazione linguistica di Groq. I chip dell’unità di elaborazione del linguaggio di Groq alimentano le query dei chatbot in tempo reale durante la fase di inferenza delle operazioni di intelligenza artificiale, distinta dal processo di addestramento del modello. Questi chip consentono ai modelli di intelligenza artificiale di generare rapidamente risposte in applicazioni come i chatbot. I chip di Nvidia attualmente gestiscono gran parte della fase di formazione dell’IA in tutto il settore. L’inferenza rappresenta un collo di bottiglia che Nvidia non controlla completamente. I chip di Groq mirano specificamente a questa fase di inferenza, in cui i modelli di intelligenza artificiale applicano la conoscenza acquisita dalla formazione per produrre risultati su nuovi dati. Groq progetta i suoi chip per l’inferenza per spostare i modelli di intelligenza artificiale dalla sperimentazione di laboratorio all’implementazione pratica. L’inferenza avviene dopo l’addestramento, quando i modelli elaborano input invisibili per fornire output in scenari reali. Gli investitori indirizzano i fondi verso startup di inferenza per collegare la ricerca sull’intelligenza artificiale con applicazioni quotidiane su larga scala. Il giornalista di Axios Chris Metinko si è occupato di questo trend di investimento all’inizio di quest’anno. Le funzionalità di inferenza migliorate consentono alle aziende di perseguire ulteriori progetti di intelligenza artificiale aziendale su scala più ampia. Queste iniziative aumentano la domanda di processi di formazione, che a sua volta aumenta la necessità di chip di formazione di Nvidia. I modelli di intelligenza artificiale funzionano attraverso due fasi: addestramento e inferenza. Durante l’addestramento, i modelli elaborano estesi set di dati tra cui testo, immagini e video per costruire rappresentazioni interne della conoscenza. Nella fase di inferenza, i modelli identificano modelli all’interno di dati mai visti prima e producono risposte a suggerimenti specifici basati su tali modelli. Questo processo assomiglia a uno studente che studia il materiale per un esame e poi applica quella conoscenza durante il test. Groq ha avuto origine nel 2016 sotto la guida fondatrice di Jonathan Ross. L’azienda non ha alcuna relazione con il chatbot xAI di Elon Musk chiamato Grok. Jonathan Ross, il presidente di Groq Sunny Madra e altri dipendenti selezionati intendono unirsi a Nvidia, come affermato in precedenza Il sito web di Groq. Groq intende mantenere operazioni indipendenti dopo queste transizioni. L’accordo costituisce un “accordo di licenza non esclusivo sulla tecnologia di inferenza”. Questo accordo assomiglia ad un’acquisizione o ad un’acquisizione. Secondo Stacy Rasgon, in una nota ai clienti, la struttura mantiene la finzione della concorrenza CNBC. Le aziende utilizzano tali strutture di accordo per affrontare le revisioni antitrust garantendo al tempo stesso personale specializzato in IA.
- Esempio Microsoft: Reclutò Mustafa Suleyman, co-fondatore di DeepMind.
- Esempio di Google: Riingaggiato Noam Shazeer, co-inventore dell’architettura Transformer centrale nei modelli GPT.
Jonathan Ross, che ora passa a Nvidia, ha precedentemente sviluppato la Tensor Processing Unit di Google, nota come TPU. I costi di implementazione determinano la misura in cui le aziende utilizzano modelli sviluppati attraverso precedenti sforzi di formazione.





