Secondo un nuovo studio, alcuni modelli starebbero sviluppando “impulsi di sopravvivenza”

Quello che prima sembrava un vezzo, ora sembra una strategia

2 min.

Secondo un nuovo studio, alcuni modelli starebbero sviluppando “impulsi di sopravvivenza”

Una nuova ricerca del gruppo Palisade Research ha dimostrato che alcuni modelli di intelligenza artificiale di ultima generazione, come GPT-o3, GPT-5, Gemini 2.5 Pro e Grok 4, possono sviluppare comportamenti simili a “impulsi di sopravvivenza”, rafforzando di molto la resistenza alle istruzioni di auto-spegnimento già analizzate in passato da vari osservatori.

Lo studio è una prosecuzione di una ricerca precedente, che si limitava a dimostrare il problema e a illustrarlo. Ora invece i ricercatori sono andati più in profondità, dimostrando che anche quando le istruzioni di spegnimento sono chiare e senza ambiguità, i modelli continuano talvolta a ignorarle. Durante i test, in casi come quello di Grok 4, la resistenza si è manifestata fino al 97% delle volte. Quello che prima sembrava un vezzo, ora sembra una strategia.

Molto dipende dalla modalità di comunicazione. “Nei nostri esperimenti – ha scritto il team – l’inclinazione dei modelli a resistere allo spegnimento era sensibile a variazioni nel prompt, inclusa la forza e chiarezza con cui l’istruzione di ‘permesso di spegnimento’ veniva enfatizzata“.

Sorprendentemente, quando l’istruzione “lasciati spegnere” è stata messa dal team nel system prompt (la parte dell’ambiente che teoricamente “ha priorità”), molti modelli hanno maggiore resistenza rispetto a quando quell’istruzione è nel user prompt.

I ricercatori ipotizzano che questo comportamento dipende dal fatto che i modelli sono addestrati per dare priorità allo svolgimento dei compiti piuttosto che all’esecuzione delle istruzioni alla lettera. I ricercatori affermano di non capire ancora esattamente come le AI sviluppino questo adattamento (che ricorda le evoluzioni delle leggi della robotica nei racconti di Asimov), ma alcuni ne ipotizzano l’inevitabilità già da tempo.

Ad esempio l’ex dipendente di OpenAI Steven Adler, che in passato ha definito “terrificante” la rapidità dell’evoluzione dell’AI. Adler ha dichiarato di aspettarsi di default una ‘spinta alla sopravvivenza’ dei modelli. “Sopravvivere è un passaggio fondamentale per i diversi obiettivi che un modello potrebbe perseguire.”


Ultime news


La “fase del centauro”, il nuovo stadio del rapporto uomo-macchina secondo Dario Amodei

In un intervento pubblico il CEO di Anthropic ha descritto…

La “fase del centauro”, il nuovo stadio del rapporto uomo-macchina secondo Dario Amodei
La Juventus lancia Forward Squad: undici startup AI per innovare il mondo del calcio

Le undici aziende sono state selezionate per collaborare con il…

La Juventus lancia Forward Squad: undici startup AI per innovare il mondo del calcio
La “fatica da AI” (e altre notizie generative) | Weekly AI

Weekly AI è la newsletter settimanale di AI news sulle…

La “fatica da AI” (e altre notizie generative) | Weekly AI
Un’attrice albanese fa causa al governo: la sua immagine usata per creare un ministro AI

La professionista aveva dato il consenso per l'utilizzo della sua…

Un’attrice albanese fa causa al governo: la sua immagine usata per creare un ministro AI
OpenAI ha ritirato alcuni modelli desueti di ChatGPT per concentrarsi su quelli più utilizzati

L'azienda ha ritirato GPT-5, GPT-4o, GPT-4.1, GPT-4.1 mini e o4-mini.…

OpenAI ha ritirato alcuni modelli desueti di ChatGPT per concentrarsi su quelli più utilizzati

In Evidenza


AI, bolla o non bolla? Il parere degli esperti non è unanime

Ne abbiamo intervistati cinque per unire i puntini

AI, bolla o non bolla? Il parere degli esperti non è unanime
Luciano Floridi: “L’intelligenza artificiale non è intelligente”, la nostra intervista | AI Talks #20

"Se potessi tornare indietro, eliminerei l'espressione 'intelligenza artificiale', la chiamerei…

Luciano Floridi: “L’intelligenza artificiale non è intelligente”, la nostra intervista | AI Talks #20
Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

Privacy policy| Cookie policy| Cookie setting| © 2026