Meta AI addestrata con i dati di Facebook e Instagram

Meta ha addestrato la l'AI che integrerà le varie app social del gruppo con dati provenienti da Facebook e Instagram. Lo ha detto Nick Clegg.
Meta AI addestrata con i dati di Facebook e Instagram

FB-insta

Durante un’intervista a Reuters il Presidente degli Affari Globali di Meta Nick Clegg ha dichiarato che la big tech ha usato contenuti degli utenti presenti su Facebook e Instagram per addestrare la sua Meta AI, l’assistente personale basato sull’intelligenza artificiale che integrerà le varie app social del gruppo. Il dirigente ha precisato che la compagnia ha però “tentato” di escludere le pubblicazioni private condivise con amici e familiari nel rispetto della privacy dei consumatori.

È un’esclusione così doverosa che quasi fa impressione l’esigenza di specificarla.

Meta insegue i competitor: un chatbot entro inizio 2024

Meta accelera sull'intelligenza artificiale: Zuck avrebbe intenzione di colmare il…

La controversa origine dei dati

Clegg è comunque apparso un po’ vago nel descrivere esattamente secondo quali parametri sarebbe stato selezionato il materiale da escludere. “Abbiamo cercato – ha detto – di escludere set di dati che contengono una forte preponderanza di informazioni personali“, ha detto. Secondo il portavoce la “straordinaria maggioranza” dei dati che Meta ha usato per l’addestramento è stata selezionata tra quella pubblicamente disponibile.

I dati in questione consistono in un insieme di elementi conversazionali sotto forma di testo e immagini, sono stati estratti soprattutto dalle pubblicazioni su Facebook e Instagram. Non sarebbero state utilizzate dunque né WhatsApp né Messenger.

Meta AI è un assistente creato sintetizzando un unico sistema in due diversi modelli: il linguaggio Llama 2 (che l’azienda ha rilasciato per l’uso commerciale pubblico a luglio) e il nuovo Emu, che genera immagini in risposta a prompt di testo.

Il prodotto sarà in grado di generare testo, audio e immagini e avrà accesso a informazioni in tempo reale grazie a una partnership con il motore di ricerca Bing di Microsoft.

Microsoft e Meta, partnership strategica per il lancio di Llama 2

Meta presenta Llama 2, una famiglia di modelli linguistici che…

Chi ha l’ultima parola?

Durante le prime settimane di settembre Meta ha introdotto un modulo di nome ‘Diritti dell’interessato per l’IA generativa‘ tramite il quale gli utenti possono validare o meno il consenso per l’utilizzo dei propri dati nell’addestramento dell’AI.

Ma ciò che sembra un segnale di trasparenza è più, forse, un’esigenza di posizionamento aziendale agli occhi dei consumatori. Nello stesso modulo Facebook scrive che ‘Non soddisferà automaticamente le richieste e le esaminerà in conformità alle leggi locali’. Una formula piuttosto comoda per dichiarare che l’ultima parola sullo sfruttamento o meno dei dati resta comunque dell’azienda, che non fornisce inoltre nessuna rassicurazione in merito a quelli già raccolti in quasi vent’anni di attività.

Lo stesso vale in fondo per l’improbabile ma possibile utilizzo dei dati raccolti dalle chat private di Whatsapp o Messenger. Le dichiarazioni secondo cui l’azienda ha ‘cercato di non utilizzarne i contenuti’ non sembrano fornire prove sufficienti per assicurare che sia effettivamente così. Nessuno ha davvero la possibilità di appurarlo.

GPT-5 in vista? OpenAI scandaglia il web per nuovi dati

OpenAI si prepara a ChatGPT-5 e lancia un nuovo bot…

La guerra dello scraping

La tematica della raccolta di materiale da addestramento è davvero alla base di tutto ciò che riguarda lo sviluppo delle AI nell’immediato futuro. La legittimità o meno della tecnica dello scraping è al centro di questo dibattito.

Di recente, proprio come Meta qualche mese fa, anche Bard di Google ha dato agli sviluppatori dei siti la possibilità di bloccare lo scraping indiscriminato inserendo manualmente un’opzione nel robots.txt.

Non è un caso che le aziende che propongono l’utilizzo di questi blocchi sono quelle che in effetti, almeno in questa fase della crescita del settore AI, non hanno poi così tanto bisogno di nuovi dati: negli ultimi due decenni ne hanno già raccolta una quantità più che considerevole.

C’è chi inizia a rendersi conto anzi che i dati sono talmente preziosi che non possono essere ceduti gratis. Di recente il New York Times ha espressamente diffidato OpenAI dall’utilizzare i suoi dati gratuitamente e ha parallelamente aperto un dialogo commerciale con Google.

Certo, vi sono poi aziende che non si pongono nemmeno troppo il problema della trasparenza. L’alveare di aziende di Musk è un esempio. Specialmente dopo l’acquisizione di Twitter/X, di cui tra poco ricorrerà il primo anniversario, gli interrogativi sull’utilizzo da parte del CEO di Tesla dei tantissimi dati degli utenti che si interfacciano con i suoi servizi si moltiplicano.

Elon Musk: l'impero AI che fa tremare la privacy

Elon Musk progetta da tempo di unificare le sue varie…

Le incognite del copyright

C’è poi lo spinoso tema del copyright. Stando alle parole di Clegg non si può dire che le grandi compagnie abbiano del tutto le idee chiare sui diversi scenari all’orizzonte. Clegg ha dichiarato che l’azienda ha imposto restrizioni sulla sicurezza per i contenuti generati da Meta AI, nel caso l’algoritmo creasse ad esempio immagini fotorealistiche di personaggi pubblici sfruttando illegalmente la loro immagine.

Ma egli stesso ha lasciato intendere che Meta non una vera e propria ricetta per contrastare in toto gli eventuali problemi di copyright causati dall’AI. Tanto che l’azienda si aspetta “Un buon numero di cause” . Tutto dipende dall’eventuale copertura dei contenuti creativi nelle “dottrine dell’uso lecito esistente“; il tema rimane aperto e interpretabile.

Copyright escluso per le opere generate dall'intelligenza artificiale

Una sentenza statunitense ha stabilito che le opere generate esclusivamente…

Sospetto fortemente che verrà affrontato attraverso azioni legali“, ha detto Clegg. Insomma, la compagnia ammette tranquillamente che quello del diritto d’autore in ambito AI è un tema che sarà affrontato solo man mano che inizierà a causare dispute vere e proprie.

Normare dopo ma mai prima: la mentalità della Silicon Valley non si smentisce.


Ultime news


Emirati Arabi Uniti: in arrivo il più grande campus di AI al di fuori degli USA

Gli Stati Uniti hanno concluso un accordo per la costruzione…

Emirati Arabi Uniti: in arrivo il più grande campus di AI al di fuori degli USA
Meta ritarda il rilascio del modello Behemoth per timori sulle capacità

Le preoccupazioni sugli effettivi miglioramenti del modello di AI Behemoth…

Meta ritarda il rilascio del modello Behemoth per timori sulle capacità
Italia ed Emirati Arabi Uniti svilupperanno un polo di intelligenza artificiale

L'accordo annunciato dal ministro Urso fra iGenius e G42 prevede…

Italia ed Emirati Arabi Uniti svilupperanno un polo di intelligenza artificiale
Siemens, Microsoft e Danieli Automation accelerano la digital transformation della manifattura italiana

Presentata una collaborazione tra Siemens e Microsoft. Al centro Siemens…

Siemens, Microsoft e Danieli Automation accelerano la digital transformation della manifattura italiana

In Evidenza


I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13
L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi
Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà

Il video di Faraday è stato visto oltre 2,6 milioni…

Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà
Quando le relazioni sono artificiali

Da un partner virtuale a una conversazione con una persona…

Quando le relazioni sono artificiali

Privacy policy| Cookie policy| Cookie setting| © 2025