L‘ultima trovata di Meta è un tool di nome AudioCraft, un’AI generativa interamente dedicata alla creazione di musica e audio. Un sito demo è già online e al suo interno si possono ascoltare numerosi esempi di porzioni audio realizzate con il programma.
I temi trattati all’interno dell’articolo
Da testo a musica
L’intelligenza artificiale generativa è al momento un codice open source e la sua diffusione rappresenta uno step importante nel mondo dell’audiofonia; il mondo della musica attendeva da un po’ un’applicazione che facesse compagnia a MusicLM di Google (per ora accessibile solo ai ricercatori).
Gran parte dei recenti sviluppi dell’AI generativa si sono concentrati sulla generazione di testo e immagini, in quanto si tratta di un processo relativamente più semplice. Così come il cugino di Google, AudioCraft sarà una delle prime sperimentazioni professionali su larga scala di una AI che lavori sul text-to-audio. E il nuovo strumento, dall’uso intuitivo, promette di arrivare a risultati qualitativi anche migliori rispetto a MusicLM.
Secondo l’annuncio di Meta, AudioCraft è dedicato specificatamente a musicisti e sound designer per “fornire ispirazione, aiutare le persone a fare rapidamente brainstorming e usare le loro composizioni in modi nuovi“.
La struttura
Al suo interno, sembra che il programma sarà dotato di tre varianti di nome MusicGen, AudioGen e EnCodec.
Con MusicGen si potrà comporre musica guidando l’algoritmo con suggerimenti testuali. Come ogni AI generativa, più che creare, AudioCraft rielaborerà; lo farà pescando esclusivamente su materiale reale senza rischiare di incorrere in nessun problema di copyright. L’addestramento è avvenuto direttamente su ventimila ore di musica di proprietà di Meta stessa o concessa in licenza appositamente per questo scopo.
La sezione AudioGen sarà invece dedicata alla creazione di effetti sonori. I suoni e gli effetti che il tool permetterà di elaborare potranno partire anche in questo caso da istruzioni scritte base; il tool potrà generare il suono di un oggetto che l’utente richiederà, come un motore acceso o il rumore di una cascata.
Infine EnCodec sfrutterà l’intelligenza artificiale per accompagnare l’utente nella compressione audio che supera qualitativamente il formato mp3 e permetterà dunque di creare suoni più realistici per usi più professionali.

Le prime opinioni
Lo strumento sta già suscitando dibattiti. Emilia David di The Verge ha notato consultando il sito che, se i rumori sembrano particolarmente naturali, non sempre questo avviene con i suoni degli strumenti, che tradiscono spesso la loro rielaborazione artificiale. Lo stesso articolo tuttavia sottolinea le capacità tecninche del tool e cita la posizione di Meta stessa secondo cui la portata rivoluzionaria del codice sarebbe accostabile a quella dei sintetizzatori a metà del novecento.
A detta nostra gli esempi dimostrano comunque che qualitativamente AudioCraft è ben più a fuoco di progetti simili creati da altre società nel corso degli ultimi mesi.
L’AI in ambito musicale è una tematica che solleva diverse perplessità tra la comunità internazionale dei musicisti. Da Damon Albarn e Nick Cave fino a John Lydon e a Sting, in molti hanno rilasciato in questi mesi dichiarazioni non molto favorevoli riguardo alla prospettiva che la musica umana venga integrata con una generativa di origine digitale.
Il posizionamento di Meta
Con questo AudioCraft, dopo il rilascio di Llama 2 di luglio, Meta si conferma come una delle aziende più attive nel fronteggiare la rivoluzione AI proponendo soluzioni e applicazioni.
Secondo alcune indiscrezioni l’azienda di Zuckerberg potrebbe anche rilasciare entro breve delle “personalità AI” da consultare direttamente attraverso i suoi Instagram, Facebook e WhatsApp.