Una versione avanzata di Gemini 2.5 deep think ha raggiunto risultati da medaglia d’oro alle finali mondiali dell’International Collegiate Programming Contest, competizione internazionale di programmazione tenutasi all’inizio di questo mese in Azerbaigian. Pur non avendo superato due dei dodici compiti che costituivano il problema nella sua totalità, le prestazioni complessive dell’AI la portano al secondo posto tra i 139 programmatori universitari più forti al mondo.
Il problema reale
In particolare Gemini si è distinta risolvendo un problema del mondo reale (talmente complesso da mettere in difficoltà programmatori informatici umani) in soli 30 minuti. Gemini ha capito come soppesare un numero infinito di possibilità per inviare un liquido attraverso una rete di condotti a una serie di serbatoi interconnessi. L’obiettivo era distribuirlo il più rapidamente possibile. Nessuno dei team umani, composti dai migliori studenti delle università di Russia, Cina e Giappone, ha fatto la cosa giusta.

Secondo Google DeepMind il risultato rappresenta una svolta “storica” nell’intelligenza artificiale, paragonabile alla vittoria del computer Deep Blue su Garry Kasparov a scacchi nel 1996 e a quella di AlphaGo sul campione di Go Lee Se-dol nel 2016.
Anzi, secondo Quoc Le, vicepresidente di Google DeepMind, si tratta di un traguardo ancora più importante perché “si tratta di ragionare più incentrato sul mondo reale, non solo su un ambiente limitato… per questo motivo penso che questo progresso abbia il potenziale per trasformare molte discipline scientifiche e ingegneristiche”.
Voci scettiche
Alcuni scienziati però hanno invitato alla cautela nell’accogliere il risultato come “epocale”.
Stuart Russell, professore di informatica all’Università della California a Berkeley, l’entusiasmo di Google “sembra esagerato” e che il traguardo testimonia semplicemente l’ottimo funzionamento di un modello sempre più accurato. Ha ricordato come in generale questi episodi “decisivi” sono più una necessità narrativa che una vera svolta scientifica. Secondo Russell ad esempio il risultato di Deep Blue non ebbe “sostanzialmente alcun impatto sul mondo reale dell’intelligenza artificiale applicata” e che l’elemento più importante da tenere in considerazione in questi casi è che “La pressione esercitata sulle aziende di intelligenza artificiale affinché continuino a vantare innovazioni è enorme“.
Michael Wooldridge, professore di fondamenti dell’intelligenza artificiale presso l’Università di Oxford, pur avendo lodato il risultato nella sua interezza, ha espresso perplessità sulla reale quantità di potenza di calcolo necessaria per raggiungerlo. Google ha risposto che la sola versione del modello attualmente in commercio può raggiungere le stesse performance.
🤖
Leggi altri articoli sulle performance delle AI:
- L’intelligenza artificiale ha ufficialmente superato il test di Turing
- Tra pochi anni i robot entreranno nelle nostre case come Netflix?
- Uno studio di Apple rivela “limiti fondamentali” dell’AI di fronte a problemi complessi
- Secondo Apple, i modelli ragionanti non ragionano. È davvero così?
- Google lancia Gemma 3, l’open source con il più alto livello di prestazioni su una sola GPU
- Le AI stanno “barando” nei test di valutazione? Una teoria dice di sì