La presentazione di Google
In data 5 agosto 2025, Google ha presentato Genie 3, l’ultimo “world model” (generatore di mondi) prodotto da DeepMind, la società inglese di AI controllata da Alphabet. Genie 3 è uno strumento in grado di generare realtà virtuali partendo da prompt testuali e permettendo all’utente di navigare in tempo reale in ambienti tridimensionali.
Nonostante Genie 3 sia al momento in una fase di anteprima, presenti delle limitazioni operative e sia disponibile solo ad una cerchia selezionata di ricercatori e creatori tramite research preview per eseguire valutazioni di rischi e controlli, la società ha puntato moltissimo su questa presentazione in vista di un futuro lancio che resta ancora senza una data certa.
Le caratteristiche di Genie 3
Rispetto ai modelli precedenti prodotti da Google, Genie 3 permette una maggiore interazione. Innanzitutto, ogni mondo dinamico generato supporta sessioni continue di diversi minuti, a una risoluzione di 720p e con 24 fotogrammi al secondo. Inoltre gli eventi riprodotti sono modificabili via prompt in tempo reale, consentendo agli utenti di intervenire per fare delle modifiche o cambiare alcune condizioni come il meteo, aggiungere personaggi o altri oggetti durante l’interazione.
Il modello è inoltre in grado di ricordare con chiarezza ciò che ha generato in precedenza, mantenendo quindi una coerenza temporale all’interno dei mondi generati. Grazie a questa memoria, Genie 3 è anche in grado di sviluppare una comprensione della fisica simile a quella propria degli esseri umani, arrivando ad avere consapevolezza di come gli oggetti interagiscono con lo spazio e reagiscono ad eventuali colpi o contatti.
L’insieme di queste caratteristiche rende Genie 3, a detta dell’azienda produttrice, un modello utile all’addestramento di agenti intelligenti che può essere usato per la loro formazione assegnandogli determinati obiettivi da raggiungere nello spazio.
Le potenzialità di Genie 3
DeepMind non ha nascosto il fatto di considerare Genie 3 uno strumento chiave nel percorso verso il raggiungimento dell’AGI (intelligenza artificiale generale) e in generale verso sistemi IA generali capaci di apprendere in ambienti simulati complessi. Non a caso Jack Parker-Holder, ricercatore scientifico del team di DeepMind, ha parlato dell’inizio di una “nuova era” in riferimento alle possibilità rappresentate dal modello.
Meta ha nominato il co-creatore di ChatGPT a capo del suo Superintelligence Lab
L'obiettivo di Meta è quello di dotarsi del personale migliore…