Dataconomy IT
  • News
  • Industry
Subscribe
No Result
View All Result
Dataconomy IT
  • News
  • Industry
Subscribe
No Result
View All Result
Dataconomy IT
No Result
View All Result

GPT-4.5 Outumans umani in nuovi test

byKerem Gülen
3 Aprile 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

GPT-4.5 di Openai sovraperformato Gli umani in un recente test di Turing di UC San Diego, mostrando quanto facilmente le persone possono confondere l’IA per una vera conversazione impegnandosi in chat fianco a fianco.

Il test Turing ha misurato a lungo se una macchina può passare come umana attraverso l’interazione basata sul testo. In questa versione aggiornata, quasi 300 partecipanti dalla lingua e dal laboratorio di cognizione di UC San Diego hanno chiacchierato con un essere umano e un’intelligenza artificiale prima di decidere quale fosse.

GPT-4.5, dotato di una persona esperta di cultura pop, ha convinto i partecipanti che era umano il 73 percento delle volte, bever sopra il benchmark del 50 % storicamente usato per definire un passaggio. Gli esseri umani reali non hanno ingannato i partecipanti così spesso.

Altri sistemi includevano Meta’s Llama 3, Openi’s GPT-4o ed Eliza, uno dei primi chatbot. Senza una persona definita, il tasso di successo di GPT-4,5 è sceso al 36 percento e GPT-4O ha segnato solo il 21 percento.

I ricercatori notano che il superamento del test di Turing non significa che un’intelligenza artificiale capisca veramente la lingua come una persona. Tuttavia, i risultati sottolineano quanto in modo convincente questi modelli possano imitare la conversazione umana, soprattutto quando assegnati ruoli specifici. I risultati sono attualmente pubblicati su un server preprint, con una versione peer-reviewed in sospeso.


Credito d’immagine in primo piano

Tags: apertoGPT-4.5

Related Posts

Microsoft invia l'aggiornamento OOB di emergenza per correggere il ciclo di riavvio di Windows 11

Microsoft invia l'aggiornamento OOB di emergenza per correggere il ciclo di riavvio di Windows 11

19 Gennaio 2026
Threads raggiunge 141 milioni di utenti giornalieri per rivendicare il trono mobile di X

Threads raggiunge 141 milioni di utenti giornalieri per rivendicare il trono mobile di X

19 Gennaio 2026
Le integrazioni di Google Wallet e Tasks emergono nella nuova perdita di Pixel 10

Le integrazioni di Google Wallet e Tasks emergono nella nuova perdita di Pixel 10

19 Gennaio 2026
iOS 27: tutto ciò che sappiamo finora

iOS 27: tutto ciò che sappiamo finora

19 Gennaio 2026
Walmart mantiene il divieto di Apple Pay nei negozi statunitensi per il 2026

Walmart mantiene il divieto di Apple Pay nei negozi statunitensi per il 2026

19 Gennaio 2026
Nvidia raggiunge i 200 teraFLOP emulati FP64 per il calcolo scientifico

Nvidia raggiunge i 200 teraFLOP emulati FP64 per il calcolo scientifico

19 Gennaio 2026

Recent Posts

  • Microsoft invia l'aggiornamento OOB di emergenza per correggere il ciclo di riavvio di Windows 11
  • Musk cerca 134 miliardi di dollari da OpenAI e Microsoft
  • Threads raggiunge 141 milioni di utenti giornalieri per rivendicare il trono mobile di X
  • Le integrazioni di Google Wallet e Tasks emergono nella nuova perdita di Pixel 10
  • iOS 27: tutto ciò che sappiamo finora

Recent Comments

Nessun commento da mostrare.
Dataconomy IT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • News
  • Industry
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.