Più i modelli AI sono potenti, più sembrerebbero inclini alle allucinazioni

Tra i molti esempi, o4-mini mostrerebbe un tasso di allucinazione che raggiunge il 48%

1 min.

Più i modelli AI sono potenti, più sembrerebbero inclini alle allucinazioni

Più le AI sono potenti, più parrebbero presentare problemi di allucinazioni. La questione, già dibattuta in passato, è tornata in auge dopo un’indagine del New York Times. I nuovi modelli di punta di aziende come OpenAI, Google o DeepSeek, sono in grado di analizzare molti più dati ma presentano più errori nei loro output. Sono aumentate le loro capacità matematiche, ma la presa sui fatti è diventata più incerta.

OpenAI ha respinto la teoria secondo cui i nuovi modelli di ragionamento presentino più allucinazioniin modo intrinseco”. Tuttavia nei suoi stessi ultimi test, l’azienda ha appurato che il suo sistema o3 ha allucinato nel 33% dei casi durante il test ‘PersonQA’, composto da domande su personaggi pubblici. Ѐ più del doppio del tasso di allucinazione del precedente sistema di ragionamento di OpenAI, o1. E lo o4-mini mostrerebbe un tasso di allucinazione ancora più alto: fino al 48%. Per certe attività risulterebbe inutilizzabile, se non addirittura dannoso.

Gli esperti non sanno esattamente il perché di questa deriva, ma qualcuno aveva già ipotizzato che la mole di informazioni processate dalle AI avrebbe aumentato anche le probabilità di errore.

Alcuni dei principali esperti dell’intelligenza artificiale, come Emily Bender e Yann LeCun, sostengono da anni che le allucinazioni non sono qualcosa di arginabile, in quanto frutto dell’architettura stessa degli LLM. Lo stesso Altman fino a pochi anni definiva le allucinazioni ‘caratteristiche’ più che inconvenienti.

Da Oxford arriva un metodo per prevenire le allucinazioni

Un nuovo studio dei ricercatori di Oxford ha sviluppato un…


Ultime news


Con AI Translations Meta punta ad abbattere il muro della lingua nei suoi reels

Meta vuole superare le barriere linguistiche e culturali creando un…

Con AI Translations Meta punta ad abbattere il muro della lingua nei suoi reels
Spotify svilupperà musica prodotta con intelligenza artificiale

L'azienda ha stipulato accordi con alcune major come Sony, Universal,…

Spotify svilupperà musica prodotta con intelligenza artificiale
Secondo uno studio di Oxford l’AI rende gli studenti più pratici e veloci ma anche più superficiali

I ricercatori ritengono che l'AI generativa aiuti gli studenti nella…

Secondo uno studio di Oxford l’AI rende gli studenti più pratici e veloci ma anche più superficiali
Google ha lanciato un aggiornamento del suo strumento di generazione video AI Veo

L'aggiornamento apporta miglioramenti su realismo, controllo e continuità nelle scene…

Google ha lanciato un aggiornamento del suo strumento di generazione video AI Veo
Il paradosso di OpenAI: è sempre più centrale ma perde miliardi di dollari

I costi sono ancora fuori controllo, ma secondo Altman è…

Il paradosso di OpenAI: è sempre più centrale ma perde miliardi di dollari

In Evidenza


Arriva l’Italian Prompt Battle: il primo torneo italiano di prompting si terrà a Milano

Gli ideatori, Lucia Cenetiempo e Massimiliano Di Blasi, ci raccontano…

Arriva l’Italian Prompt Battle: il primo torneo italiano di prompting si terrà a Milano
Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang
I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13
L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Privacy policy| Cookie policy| Cookie setting| © 2025