Oggi, l’impresa di Elon Musk svelato Grok-2 e la sua controparte compatta, Grok-2 Mini, in una versione beta, vantano capacità di ragionamento migliorate. Queste iterazioni all’avanguardia del modello Grok AI ora supportano la generazione di immagini direttamente sul social network X. Attualmente, l’accesso a Grok è esclusivo per gli abbonati Premium e Premium+ su X. Può essere visto come un significativo progresso nell’integrazione dell’IA con le piattaforme dei social media.
“Siamo entusiasti di rilasciare un’anteprima anticipata di Grok-2, un significativo passo avanti rispetto al nostro precedente modello Grok-1.5, con funzionalità di frontiera in chat, codifica e ragionamento. Allo stesso tempo, stiamo introducendo Grok-2 mini, un piccolo ma capace fratello di Grok-2. Una prima versione di Grok-2 è stata testata sulla classifica LMSYS con il nome “sus-column-r”. Al momento di questo post del blog, sta superando sia Claude 3.5 Sonnet che GPT-4-Turbo.”
-xAI
Grok-2 supera altri LLM popolari secondo i parametri di riferimento
xAI ha condiviso approfondimenti sui modelli Grok-2, rivelando le loro solide prestazioni in una varietà di benchmark accademici. Secondo xAI, sia Grok-2 che Grok-2 mini hanno oscurato i precedenti Modello Grok-1.5che mostra notevoli miglioramenti in aree come ragionamento, comprensione della lettura, matematica, scienza e codifica. Questi modelli sono alla pari con altri sistemi di intelligenza artificiale all’avanguardia, eccellendo nella scienza di livello universitario (GPQA), nella cultura generale (MMLU, MMLU-Pro) e nei problemi di matematica competitivi (MATH). Inoltre, Grok-2 ha dimostrato capacità di alto livello in attività basate sulla vista, ottenendo risultati all’avanguardia nel ragionamento matematico visivo (MathVista) e nelle risposte alle domande basate su documenti (DocVQA).

L’impresa AI di Musk mira ad ampliare l’accessibilità sia di Grok-2 che di Grok-2 Mini, pianificando un’espansione per includere gli sviluppatori tramite la sua API aziendale entro la fine del mese. Nel frattempo, i primi utilizzatori su X hanno già iniziato a sperimentare le capacità di generazione di immagini di Grok, in particolare senza restrizioni sulla creazione di rappresentazioni di personaggi politici. La mancanza di filtri di questa funzionalità ha innescato un utilizzo diffuso, in particolare con l’avvicinarsi delle elezioni presidenziali statunitensi, spingendo potenzialmente la necessità di limiti normativi.
Ulteriori sviluppi intriganti rivelano che questi modelli sfruttano FLUSSO.1 tecnologia di Black Forest Labs per la creazione di immagini, che allude a sofisticati algoritmi sottostanti. Tuttavia, i dettagli sull’intero spettro di capacità di Grok 2 rimangono scarsi. Il ricercatore di app e noto tester di funzionalità X, Nima Owji, suggerisce miglioramenti nella generazione di codice, scrittura e sintesi di notizie rispetto al suo predecessore, sebbene queste affermazioni attendano una convalida sostanziale. Nonostante i suoi progressi, la versione iniziale di Grok ha riscontrato notevoli imprecisioni nella sintesi delle notizie, evidenziando le sfide in corso nella generazione di contenuti guidata dall’intelligenza artificiale.

Le capacità di generazione di immagini senza restrizioni di Grok pongono un rischio crescente di diffondere disinformazione su X e potenzialmente su altre piattaforme, in particolare perché non è ancora chiaro se le immagini basate su Grok contengano metadati che denotino le loro origini AI. Sono state presentate richieste a X in merito a misure per limitare l’uso improprio di queste funzionalità, sebbene le risposte siano state poco frequenti dopo l’acquisizione di Musk.
Generazione di immagini Grok AI: foto.twitter.com/mjzSMEJ5Df
— Jungle Inc: Deaton 4 Senato (@jungleincxrp) 14 agosto 2024
Ricordate quella lotta mai avvenuta tra Zuckerberg e Musk nel Colosseo romano? Bene, ne abbiamo generato le immagini su Grok-2. Esatto, usando il giocattolo di intelligenza artificiale di Elon Musk, abbiamo creato uno scontro storico tanto fasullo quanto divertente.
E adesso, Elon?

Sono all’orizzonte espansioni per Grok-2 e Grok-2 Mini, poiché xAI prevede di integrare questi modelli in vari miglioramenti basati sull’intelligenza artificiale su X. Questi miglioramenti includono funzioni di ricerca più abili, analisi dettagliate dei post e, possibilmente, risposte generate dall’intelligenza artificiale, segnalando uno spostamento verso interazioni utente più interattive e automatizzate. Inoltre, l’imminente anteprima della comprensione multimodale promette di approfondire l’integrazione di Grok nell’ecosistema di X e nella sua API.
Crediti delle immagini: Kerem Gülen/xAI