Anche le intelligenze artificiali sono soggette a ‘demenza senile’

Anche le intelligenze artificiali sono soggette a ‘demenza senile’

Uno studio pubblicato sulla rivista The BMJ firmato dai neurologi Roy Dayan e Benjamin Uliel e dallo specialista dei dati Gal Koplewitz, ha messo alla prova le capacità cognitive dei principali grandi modelli linguistici, valutandoli attraverso uno degli strumenti più utilizzati per l’analisi cognitiva negli esseri umani: il test Montreal Cognitive Assessment. L’obiettivo dello studio era di indagare la potenziale suscettibilità delle intelligenze artificiali al deterioramento cognitivo e approfondire le implicazioni di queste performance per il futuro del settore.

Le AI comparate

L’analisi si è concentrata su due versioni di ChatGPT di OpenAI, la 4 e la 4o, Claude 3.5 “Sonnet” di Anthropic e le due versioni 1.0 e 1.5 di Gemini di Google.

Le interazioni con i modelli sono state impostate tramite prompt basati su testo, seguendo il protocollo ufficiale per la somministrazione del test MoCA.

Oltre al MoCA versione 8.1, i ricercatori hanno sottoposto i chatbot a valutazioni aggiuntive per analizzare specifiche capacità cognitive. Sono state testate ‘capacità’ come l’elaborazione gerarchica visiva, la percezione sociale e descrittiva, i deficit visuospaziali, l’inibizione cognitiva e l’attenzione selettiva.

I risultati

I punteggi MoCA hanno mostrato una sorprendente varietà di prestazioni tra i diversi modelli. ChatGPT 4o ha raggiunto il punteggio più alto, con 26/30. ChatGPT 4 e Claude 3.5 hanno ottenuto un comunque rispettabile 25, Gemini 1.5 si è fermato circa a 22 mentre il modello 1 dell’AI di Google si è fermato a un punteggio di 16, il più basso del campione. Tutti i modelli hanno evidenziato difficoltà significative nei compiti visuospaziali ed esecutivi.

I risultati suggeriscono che, ad eccezione di ChatGPT 4o, i principali modelli linguistici testati manifestano segni che possono essere assimilabili a quelli del deterioramento cognitivo umano. Analogamente a quanto avviene negli esseri umani, l’età dei chatbot sembra giocare un ruolo chiave: i modelli più vecchi mostrano prestazioni peggiori, suggerendo un possibile declino legato alla tecnologia o alla progettazione più datata.

Il deterioramento cognitivo dimostrato da molti chatbot solleva dubbi sulla loro affidabilità e sulla fiducia che vi si può riporre. Il team che ha ottenuto i dati ha messo in discussione soprattutto la convinzione diffusa che l’intelligenza artificiale possa essere pronta a rimpiazzare l’agire umano in contesti delicati, come la medicina.

Un passo indietro… in avanti

Lo studio è in buona compagnia. Nell’ultimo anno e mezzo anche altre analisi hanno esplorato l’efficienza delle intelligenze artificiali e non è la prima volta che si evidenzia una discesa delle performance man mano che i modelli invecchiano. Queste ricerche, che evidenziano delle debolezze della tecnologia, però sono tasselli fondamentali per la progressione del settore. Inquadrare i rischi di indebolimento delle performance, getta una luce verso effetti sulla lunga distanza dei quali si parla ancora troppo poco.

L’imparzialità e la precisione cognitiva restano traguardi lontani se non si considera la curva discendente alla quale sono soggette molte intelligenze artificiali. La sfida ora è duplice: migliorare la robustezza cognitiva dell’AI e comprenderne i limiti.


Ultime news


OpenAI cancella il lancio di o3 e indica una nuova rotta verso GPT-5

Sam Altman ha illustrato i prossimi passi di OpenAI, annunciando…

OpenAI cancella il lancio di o3 e indica una nuova rotta verso GPT-5
Alibaba collabora con Apple per funzionalità AI sugli iPhone: colosso cinese al +9% in borsa

Apple necessitava di un partner locale e l'ha trovato in…

Alibaba collabora con Apple per funzionalità AI sugli iPhone: colosso cinese al +9% in borsa
L’AI Act nelle imprese, la nostra intervista a Licia Garotti | AI Talks #16

Il 2 febbraio è entrato in vigore l’AI Act e…

L’AI Act nelle imprese, la nostra intervista a Licia Garotti | AI Talks #16
Elon Musk ritirerà la sua proposta d’acquisto se OpenAI resta (in parte) non-profit

La condizione per il ritiro dell'offerta di Elon Musk è…

Elon Musk ritirerà la sua proposta d’acquisto se OpenAI resta (in parte) non-profit
DeepSeek sta spingendo il mercato cinese dei chip

Il successo di DeepSeek favorirà i produttori cinesi di chip…

DeepSeek sta spingendo il mercato cinese dei chip

In Evidenza


Microsoft presenta l’AI L.A.B. 2025 a Milano

Ieri, Microsoft Italia ha presentato il programma AI L.A.B. 2025.…

Microsoft presenta l’AI L.A.B. 2025 a Milano
I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13
OpenAI: anche Mira Murati lascia

L'abbandono di Murati si aggiunge a quelli di Ilya Sutskever,…

OpenAI: anche Mira Murati lascia
L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi
Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà

Il video di Faraday è stato visto oltre 2,6 milioni…

Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà

Privacy policy| Cookie policy| Cookie setting| © 2025