Come funzionano i test governativi sui nuovi modelli AI negli Stati Uniti

Sono condotti dal Centro per gli Standard e l'Innovazione nell'AI del Dipartimento del Commercio statunitense e cercano di individuare possibili falle di sicurezza

2 min.

Come funzionano i test governativi sui nuovi modelli AI negli Stati Uniti

L’amministrazione Trump ha annunciato un’importante espansione del programma federale di valutazione dei modelli di intelligenza artificiale. Google DeepMind, xAI e Microsoft si sono aggiunte a OpenAI e Anthropic nel programma gestito dal CAISI, il Centro per gli Standard e l’Innovazione nell’AI del Dipartimento del Commercio statunitense, che già da mesi testava i modelli delle prime due aziende prima del loro rilascio pubblico. L’obiettivo del governo è capire cosa è in grado di fare un modello avanzato nelle mani sbagliate, prima che chiunque lo possa usare.

Il cuore del programma è una tecnica chiamata red-teaming, in cui i ricercatori governativi simulano il comportamento di attori malintenzionati, cercando di aggirare i meccanismi di sicurezza dei modelli. Per farlo nel modo più efficace possibile, le aziende forniscono al CAISI versioni dei loro modelli con le protezioni ridotte o rimosse, in pratica, versioni non filtrate, così da valutarne le capacità reali senza limitazioni artificiali. Nel caso di Microsoft, il lavoro con il National Institute of Standards and Technology si concentrerà su valutazioni avversariali che sondano comportamenti inattesi, modalità di abuso e possibili guasti. I rischi messi sotto esame sono attacchi informatici alle infrastrutture degli Stati Uniti, sviluppo di armi chimiche o biologiche, e la corruzione dei dati usati per addestrare i modelli AI stessi.

I test fin qui condotti hanno già prodotto risultati significativi. Il lavoro di Anthropic con il CAISI ha rivelato che alcune tecniche semplici, come dichiarare falsamente che una revisione umana era già avvenuta, o sostituire caratteri nel testo, erano sufficienti ad aggirare i sistemi di sicurezza e le vulnerabilità sono state poi corrette. OpenAI, a sua volta, ha scoperto una falla nel suo agente ChatGPT che avrebbe consentito a un attaccante di prendere il controllo da remoto del computer dell’utente e di impersonarlo su altri siti. Il CAISI ha già completato oltre 40 valutazioni, incluse quelle su modelli non ancora disponibili al pubblico. Nelle ultime ore è emerso tra l’altro che OpenAI ha fornito al governo degli Stati Uniti un accesso anticipato al suo modello GPT-5.5 per i test di sicurezza nazionale, come ha dichiarato Chris Lehane, dirigente di OpenAI, in un post su LinkedIn.

A sottolineare la posta in gioco è stato lo stesso direttore del CAISI, Chris Fall: “Una scienza della misurazione indipendente e rigorosa è essenziale per comprendere l’AI di frontiera e le sue implicazioni per la sicurezza nazionale. Queste collaborazioni ampliate ci aiutano a scalare il nostro lavoro nell’interesse pubblico in un momento critico”.

La Marina statunitense userà l'AI nelle operazioni di sminamento dello stretto di Hormuz

Contemporaneamente il Pentagono ha concluso nuovi accordi militari con sette…


Ultime news


Gemini 3.5 Pro rimandato: Google insegue il trono del coding AI

Al Google I/O 2026, Sundar Pichai ha annunciato che Gemini…

Gemini 3.5 Pro rimandato: Google insegue il trono del coding AI
AI WEEK 2026, comincia la settima edizione del più grande evento sull’AI!

Più che un evento, un'esperienza immersiva: 25.000 persone attese tra…

AI WEEK 2026, comincia la settima edizione del più grande evento sull’AI!
Musk perde contro OpenAI: la giuria decide in meno di due ore

Una giuria federale di Oakland ha respinto all'unanimità tutte le…

Musk perde contro OpenAI: la giuria decide in meno di due ore
In arrivo la prima enciclica di Papa Leone XIV: affronterà il tema dell’intelligenza artificiale

L'appuntamento è fissato per il prossimo 25 maggio e accanto…

In arrivo la prima enciclica di Papa Leone XIV: affronterà il tema dell’intelligenza artificiale
OpenAI assume personale per gestire l’opposizione ai data center delle comunità locali

Le nuove figure si chiamano Community Engagement Lead e sono…

OpenAI assume personale per gestire l’opposizione ai data center delle comunità locali

In Evidenza


Più del 50% dei giovani europei usa l’AI per cercare supporto emotivo

Lo riferisce un sondaggio Ipsos BVA condotto su 3.800 ragazzi…

Più del 50% dei giovani europei usa l’AI per cercare supporto emotivo
Intelligenza artificiale: prepararsi al 2026 | Il report di AI News

Il nuovo report di AI News per non farsi sorprendere…

Intelligenza artificiale: prepararsi al 2026 | Il report di AI News

Privacy policy| Cookie policy| Cookie setting| © 2026