Openai sembra deprezzare i contenuti da Reddit per la formazione di CHATGPT, segnalando un perno verso fonti di informazione più affidabili e verificabili. Questa decisione riflette un cambiamento fondamentale nel modo in cui si sta sviluppando il modello AI, dando la priorità all’accuratezza rispetto ai dati di conversazione con crowdsourcing.
Il motivo del turno
Per anni, Reddit è stata una risorsa preziosa per la formazione dell’IA perché la sua vasta gamma di discussioni ha fornito uno stile naturale e conversazionale che ha aiutato i modelli a imparare il dialogo. Tuttavia, questi dati includevano anche svantaggi significativi, come disinformazione, contenuti di bassa qualità e utenti che tentavano attivamente di manipolare le discussioni per influenzare le risposte di intelligenza artificiale. Questa modifica segnalata fa parte di una più ampia tendenza del settore che spinge per l’uso di fonti di dati affidabili e verificabili. L’obiettivo è migliorare l’accuratezza dei contenuti generati dall’IA, ridurre la diffusione della disinformazione e rendere i modelli più difficili da manipolare.
Cosa significa per gli utenti
Il passaggio da Reddit comporta un compromesso. Gli utenti possono aspettarsi di ricevere risposte più coerenti e basate sui fatti Chatgpt. D’altra parte, la personalità eccentrica e guidata dalla comunità che i diversi contenuti di Reddit hanno portato alle risposte del modello potrebbe svanire nel tempo. Questa attenzione alla credibilità sottolinea il futuro dello sviluppo dell’IA, in cui la trasparenza e la fiducia nei dati di formazione stanno diventando essenziali. Poiché i modelli di intelligenza artificiale sono sempre più integrati in ambienti professionali, accademici e aziendali, la domanda di affidabilità ha la precedenza sulla natura caotica e imprevedibile dei forum online non avvertiti.





