L’impresa di intelligenza artificiale di Elon Musk, xAIsta attirando l’attenzione con il rilascio di una versione aggiornata del suo modello linguistico Grok. Soprannominato Grok-1.5quest’ultima iterazione vanta una memoria a breve termine sostanzialmente migliorata e capacità di ragionamento migliorate.
La potenza della memoria di Grok-1.5
Un aspetto fondamentale dell’aggiornamento di Grok-1.5 è un aumento significativo della capacità di memoria a breve termine. Nei modelli linguistici di grandi dimensioni (LLM), questa memoria è misurata in “gettoni“.
In parole povere, i token possono essere pensati come le unità di significato di base all’interno del testo, siano esse parole o parti di parole. Grok-1.5 ora può elaborare fino a 128.000 tokenUN Aumento di 16 volte rispetto al suo predecessore.
Perché questa capacità di memoria estesa è importante?
Consente a Grok-1.5 di conservare ed elaborare blocchi di informazioni sostanzialmente più grandi durante l’esecuzione dei suoi compiti. Immagina di provare a comprendere un contratto legale complesso quando ti è consentito leggere solo un singolo paragrafo alla volta.
Un’intelligenza artificiale con una forte memoria a breve termine può “vedere” il quadro più ampioconsentendogli di prendere decisioni migliori e generare risposte più approfondite.

Il ragionamento fa un salto
Oltre alla memoria potenziata, Grok-1.5 dimostra capacità di ragionamento migliorate. Ciò si traduce nella capacità di comprendere meglio le complesse relazioni tra informazioni e trarre conclusioni logiche.
Per gli utenti, ciò significa che Grok-1.5 potrebbe essere più capace di:
- Comprendere le sfumature e le complessità di un testo lungo
- Seguire una catena di istruzioni o richieste, anche se non perfettamente lineari
- Fornire riepiloghi che riflettano accuratamente i punti chiave di un documento
La codifica e i calcoli ottengono una spinta
Sembra che xAI abbia preso di mira specificamente le capacità matematiche e di codifica di Grok-1.5. Secondo i test condotti da xAI, le prestazioni sui benchmark che misurano queste competenze sono notevolmente migliorate. Nel benchmark MATH (una raccolta di problemi di matematica a livello di scuola elementare e di competizione), Grok-1.5 ha ottenuto il 50,6%. Ha anche dimostrato un punteggio del 90% sul benchmark GSM8K (un altro set di problemi di matematica).
Inoltre, Grok-1.5 ha ottenuto un punteggio del 74,1% nel benchmark HumanEval, che misura la capacità dell’intelligenza artificiale di generare codice e risolvere problemi basati sulla codifica. Questi sono numeri promettenti, anche se xAI non ha ancora dettagliato i progressi o i punteggi in altre aree di competenza.
Cosa può significare questo per gli utenti?
Anche se i dettagli tecnici dell’aggiornamento di Grok-1.5 sono impressionanti, cosa significa tutto questo per gli utenti? Ecco alcune potenziali aree in cui i miglioramenti potrebbero apportare vantaggi:
- Analisi dei documenti: Grok-1.5 potrebbe essere meglio equipaggiato per riassumere testi e resoconti lunghi e complessi. Ciò potrebbe far risparmiare tempo a coloro che hanno bisogno di ottenere rapidamente l’essenza di documenti lunghi.
- Scrittura creativa: Il miglioramento del ragionamento e della memoria potrebbe consentire a Grok-1.5 di generare formati di testo più coerenti e strutturati, siano essi storie creative, script o persino poesie.
- Risoluzione dei problemi: Le potenziate capacità matematiche e di codifica dell’IA potrebbero aiutare con attività che richiedono calcoli o la generazione di codice per scopi specifici.

Ma riuscirà a detronizzare i giganti?
Analizziamo come la memoria di Grok-1.5 si confronta con gli altri principali attori nel campo LLM:
- Grok-1.5: Con la sua capacità di memoria a breve termine di 128.000 token, Grok vanta un vantaggio significativo in questo specifico reparto.
- GPT-4: Sebbene le cifre esatte non siano confermate pubblicamente, le stime suggeriscono che ChatGPT 4 abbia un numero di token di decine di migliaia, notevolmente inferiore a Grok-1.5.
- Google Gemini Avanzato: Si dice che il modello AI di Google abbia un numero di token superiore a 100.000. Sebbene sia ancora inferiore a Grok-1.5, la differenza è inferiore a quella vista con ChatGPT 4.
Sebbene l’aumento di memoria di Grok-1.5 offra un netto vantaggio, non garantisce che possa detronizzare gli attuali giganti come ChatGPT 4 o Google Gemini Advanced. Il successo nel settore LLM è una complessa interazione di fattori.
La corsa continua
Il rilascio di Grok-1.5 arriva in un periodo di rapido progresso nel settore dell’intelligenza artificiale. Le aziende e gli istituti di ricerca spingono costantemente i limiti di cosa LLM può fare.
È un momento entusiasmante poiché la concorrenza guida l’innovazione. Dovremmo anticipare ulteriori perfezionamenti di Grok e l’introduzione di modelli di intelligenza artificiale completamente nuovi nei mesi e negli anni a venire.
Credito immagine in primo piano: X.ai