Trends

News - Trend trimestrale

Volume trimestrale

... ..%

Volume semestrale

... ..%

OpenAI: diffusi (strategicamente) i primi test di Sora, nuova AI video

Mercato Edoardo Frasso 16 Febbraio 2024

3 minuti

Edoardo Frasso 16 Febbraio 2024
3 minuti

OpenAI ha presentato la sua nuova applicazione Sora, che genera video a partire da prompt di testo. Fino a qui niente di particolarmente nuovo, se non fosse per la strabiliante qualità del risultato finale. Le clip diffuse dall’azienda mostrano un’attenzione per i particolari che nessun tool text-to-video aveva mai mostrato prima.

Dal rumore statico alla clip

Sora è un modello di diffusione che genera un video partendo da un’immagine simile a del rumore statico e lo trasforma gradualmente eliminando il rumore in molti passaggi.

Il modello è in grado di generare video lunghi fino a un minuto e per adesso il suo utilizzo è limitato a pochi selezionatissimi utenti come artisti visuali, designer e registi per raccogliere feedback su come far progredire il progetto. Promette una profonda comprensione linguistica e una coerenza visiva del tutto inedita. Gli esempi diffusi dall’azienda sono impressionanti. Riproduzioni di parti del corpo, coerenza dei movimenti, credibilità dei volti, costruzione dei paesaggi: tutti gli elementi sembrano molto migliori rispetto a qualsiasi altra AI simile.
Il modello attuale ha delle debolezze – sottolinea l’azienda – Potrebbe avere difficoltà a simulare accuratamente la fisica di una scena complessa e potrebbe non comprendere istanze specifiche di causa ed effetto. Potrebbe avere difficoltà con descrizioni precise di eventi che si svolgono nel tempo, come seguire una traiettoria di telecamera specifica“.

Sicurezza in primis…ma abusi imprevedibili

Nonostante OpenAI intenda sviluppare il modello con un’attenzione molto specifica per la sicurezza, ammette anche di non poter prevedere tutti i casi di abuso della tecnologia. Promette però di cercare di di evitarne l’uso per disinformazione, contenuti offensivi e pregiudizi. L’azienda sta inoltre sviluppando strumenti per aiutare a rilevare contenuti ingannevoli e molti sforzi andranno nella progettazione di un classificatore di rilevamento che potrà identificare quando un video è stato generato da Sora.

Il classificatore di testo controllerà e rifiuterà testi che violano le politiche di utilizzo, come richieste di violenza estrema, contenuti sessuali, immagini offensive, immagini di celebrità o proprietà intellettuale altrui. L’azienda apre inoltre un dialogo con politici, educatori e artisti di tutto il mondo per “comprendere le loro preoccupazioni e identificare casi d’uso positivi per questa nuova tecnologia“.

Un’anticipazione strategica

Ma perché OpenAI ha diffuso in anticipo i risultati di un prodotto non ancora completo? L’azienda spiega di averlo fatto lo per “Iniziare a feedback da persone esterne a OpenAI e per dare al pubblico un’idea delle capacità dell’intelligenza artificiale all’orizzonte“.

Ma forse anche per riconnettersi con quella parte di utenti affezionata all’anima più sperimentale, visionaria e meno commerciale dell’azienda di Altman. Diverse persone, soprattutto negli USA, non vedono di buon occhio il recente avvicinamento del CEO a territori governativi scivolosi, su tutti il Pentagono. Proprio in questi giorni sotto alla sede di OpenAI si susseguono proteste per le accuse di supporto dell’azienda all’infrastruttura bellica statunitense. Forse la presentazione di un tool così interessante ha il duplice scopo di calmare le acque e spostare l’attenzione dalle polemiche.


In Evidenza


Quando le relazioni sono artificiali

Da un partner virtuale a una conversazione con una persona…

Chi fermerà l’AI? Riflessione sull’appello di Musk

Elon Musk e altri mille esperti chiedono una pausa di…

Elon Musk e altri mille esperti: “Allarme intelligenza artificiale”

Elon Musk e altri mille esperti hanno chiesto di sospendere…

Microsoft 365 Copilot, un’AI generativa per la produttività

Microsoft ha lanciato 365 Copilot, un servizio di intelligenza artificiale…

OpenAI rilascia GPT-4, più potente e multimodale

GPT-4 è arrivato. Un modello multimodale e con 100 trilioni…