L’amministrazione Trump ha annunciato un’importante espansione del programma federale di valutazione dei modelli di intelligenza artificiale. Google DeepMind, xAI e Microsoft si sono aggiunte a OpenAI e Anthropic nel programma gestito dal CAISI, il Centro per gli Standard e l’Innovazione nell’AI del Dipartimento del Commercio statunitense, che già da mesi testava i modelli delle prime due aziende prima del loro rilascio pubblico. L’obiettivo del governo è capire cosa è in grado di fare un modello avanzato nelle mani sbagliate, prima che chiunque lo possa usare.
Il cuore del programma è una tecnica chiamata red-teaming, in cui i ricercatori governativi simulano il comportamento di attori malintenzionati, cercando di aggirare i meccanismi di sicurezza dei modelli. Per farlo nel modo più efficace possibile, le aziende forniscono al CAISI versioni dei loro modelli con le protezioni ridotte o rimosse, in pratica, versioni non filtrate, così da valutarne le capacità reali senza limitazioni artificiali. Nel caso di Microsoft, il lavoro con il National Institute of Standards and Technology si concentrerà su valutazioni avversariali che sondano comportamenti inattesi, modalità di abuso e possibili guasti. I rischi messi sotto esame sono attacchi informatici alle infrastrutture degli Stati Uniti, sviluppo di armi chimiche o biologiche, e la corruzione dei dati usati per addestrare i modelli AI stessi.
I test fin qui condotti hanno già prodotto risultati significativi. Il lavoro di Anthropic con il CAISI ha rivelato che alcune tecniche semplici, come dichiarare falsamente che una revisione umana era già avvenuta, o sostituire caratteri nel testo, erano sufficienti ad aggirare i sistemi di sicurezza e le vulnerabilità sono state poi corrette. OpenAI, a sua volta, ha scoperto una falla nel suo agente ChatGPT che avrebbe consentito a un attaccante di prendere il controllo da remoto del computer dell’utente e di impersonarlo su altri siti. Il CAISI ha già completato oltre 40 valutazioni, incluse quelle su modelli non ancora disponibili al pubblico. Nelle ultime ore è emerso tra l’altro che OpenAI ha fornito al governo degli Stati Uniti un accesso anticipato al suo modello GPT-5.5 per i test di sicurezza nazionale, come ha dichiarato Chris Lehane, dirigente di OpenAI, in un post su LinkedIn.
A sottolineare la posta in gioco è stato lo stesso direttore del CAISI, Chris Fall: “Una scienza della misurazione indipendente e rigorosa è essenziale per comprendere l’AI di frontiera e le sue implicazioni per la sicurezza nazionale. Queste collaborazioni ampliate ci aiutano a scalare il nostro lavoro nell’interesse pubblico in un momento critico”.

La Marina statunitense userà l'AI nelle operazioni di sminamento dello stretto di Hormuz
Contemporaneamente il Pentagono ha concluso nuovi accordi militari con sette…














