Trends

News - Trend trimestrale

Volume trimestrale

... ..%

Volume semestrale

... ..%

Addestratori di intelligenza artificiale: le storture di un settore frammentato

addestratori ai

Nonostante lo sviluppo delle intelligenze artificiali nelle sue innumerevoli varianti sia raccontato da tutti i media e osservato dall’opinione pubblica mondiale, ancora relativamente poco si parla di figure fondamentali per questo settore: gli addestratori di AI. Poco se ne parla fondamentalmente perché poco si sa. Quello degli addestratori, oggi, è un settore geograficamente molto disomogeneo, chiuso in cappe di misteri e accordi di riservatezza.

Le ultime inchieste 

Negli ultimi mesi alcuni osservatori e giornalisti hanno cercato di ottenere informazioni più dettagliate. Ne hanno scritto Davey Alba per Bloomberg e Matteo Wong per The Atlantic, ed è ormai nota l’inchiesta del Time di gennaio sugli etichettatori di danni nocivi e violenti. 

Una delle indagini più interessanti uscite in tempi recenti è un articolo dettagliato su The Verge dal titolo ‘AI Is a Lot of Work’ scritto dal giornalista investigativo Josh Dzieza. L’articolo è composto da materiale ottenuto in gran parte tramite interviste agli appartenenti del vasto e strano mondo degli etichettatori di dati per AI, i cosiddetti tasker.

Noi avevamo dedicato una panoramica alla professione quando di AI ancora poco si parlava

Da allora un po’ di cose sono cambiate.

Le origini del RLHF

Fino a pochi mesi fa pareva che il settore fosse in crescita esponenziale e che promettesse ampie possibilità di opportunità per chi ne facesse parte. D’altronde erano già diversi anni che assistevamo ad un posizionamento di questa professione. Anzi, la nascita di aziende dedicate parte da molto lontano. 

Nel 2007 nacque ImageNet, un ampio contenitore di dati di immagini frutto del lavoro della piattaforma di Amazon Mechanical Turk, pensata per permettere di reclutare persone nell’intero mondo per piccoli lavori digitali a distanza e a basso costo. Il progetto ImageNet era nato quando la professoressa di Princeton Fei-Fei Li si rese conto che l’unico modo per far evolvere il campo delle reti neurali di riconoscimento delle immagini era etichettare manualmente milioni di immagini categorizzandole e ‘spiegandole’ alle macchine. Era un’impresa mai vista prima, realizzabile solo attraverso un lavoro capillare e organizzato.

Era nata la raccolta di dati per AI come la conosciamo oggi, quella che in pochi anni si sarebbe spostata dalle sole immagini per concentrarsi su svariate forme di linguaggio consolidando il cosiddetto ‘apprendimento per rinforzo da feedback umano’ (Reinforcement learning from human feedback, detto RLHF).

In anni più recenti sono nate aziende più specialistiche in questo senso a sancire l’esplosione di un lavoro del tutto nuovo come Scale AI, fondata nel 2016 dall’allora diciannovenne Alexandr Wang (tra i propri clienti oggi ha OpenAI e l’esercito statunitense), Sama AI (quella di cui parla l’articolo del Time) , Surge AI o Remotasks.

Come ai suoi albori, oggi è un settore caratterizzato dall’assoluta frammentazione della sua forza lavoro, una tendenza che nei mesi sembra andare aumentando.

Scatole cinesi

Ne è la prova il fatto che non esistono dati certi sui tasker. Non si sa bene quanti siano e ad oggi non c’è accesso pubblico a registri che ne documentino la distribuzione.

L’esplosione mediatica di ChatGPT ha scatenato la corsa all’oro dell’AI e tutte le aziende tech del mondo si sono buttate a capofitto nell’affinamento delle proprie versioni. Per farlo molte hanno assoldato addestratori attraverso aziende ‘filtro’, che a loro volte sono spesso suddivise in piccoli sotto-gruppi, in una strana struttura a scatole cinesi. Le ragioni sono molteplici. Molti addestratori lavorano da casa propria. Possono lavorare in sessioni che durano anche 36 ore di fila senza orari né retribuzioni fisse. Il loro lavoro consiste spesso nel colloquiare con i chatbot per classificare le loro risposte e insegnare loro quelle più corrette tramite imitazione.

L’aspetto più alienante di tutta la relazione professionale è che la maggior parte delle volte i tasker non sanno per quali aziende stanno lavorando. 

John Dzieza ha parlato con lavoratori statunitensi che hanno dichiarato che solo casualmente hanno scoperto che, per paghe pari a 2 o 3 dollari all’ora, stavano lavorando per colossi come Google o OpenAI. Alcuni sono riusciti a scoprirlo interrogando direttamente i chatbot che addestravano. Questa necessità di segretezza sembra provenire direttamente dalle big company, che non desiderano far conoscere a fondo all’opinione pubblica i loro processi. Qualcosa oggi si sa.

Ad esempio che portali come Taskup.ai, DataAnnotation.tech e gethybrid.io paiono appartenere alla stessa azienda, Surge AI. Il CEO Edwin Chen non ha mai confermato questa connessione. Ma ha dichiarato che per Surge lavorano circa 100.000 annotatori sparsi in giro per il mondo. 

Salari variabili

Le retribuzioni sono molto variabili, spesso sono adeguate in base alla provenienza geografica e in base alla specializzazione delle annotazioni. Per addestrare un chatbot sulla fisica quantistica o sulla filosofia occorrono esperti sulla materia e le aziende possono arrivare a pagarli 50 dollari o più all’ora. A maggio, Scale ha cercato dal proprio sito web specialisti in praticamente ogni settore che l’AI è destinata a conquistare. 

Sono state pubblicate inserzioni per addestratori di AI con competenze in consulenza sanitaria, risorse umane, finanza, economia, data science, programmazione, informatica, chimica, biologia, contabilità, tasse, nutrizione, fisica, viaggi, istruzione K-12, giornalismo sportivo e self-help. I tasker possono guadagnare 45 dollari all’ora insegnando legge ai robot o 25 insegnando loro poesia. Non mancavano nemmeno offerte di lavoro per persone con autorizzazioni di sicurezza, presumibilmente per aiutare ad addestrare l’AI militare.

Inseguendo il lavoro

Per molte mansioni considerate meno specializzate il mercato si affida a tasker dislocati in paesi in via di sviluppo, dove i salari sono bassi. Questo genera strani paradossi culturali: l’anno scorso Surge ha dovuto ri-etichettare il dataset di Google che classificava i post di Reddit a seconda delle emozioni. Google li aveva precedentemente inviati a lavoratori in India per l’annotazione, ma il 30% per cento delle etichette risultavano errate: i tasker indiani interpretavano differentemente le emozioni contenute nei post per via di una diversa lettura culturale dell’ironia o dei sottotesti.

Non esiste un flusso costante di lavoro e quindi non esiste una visibilità a lungo termine per questi lavoratori. Ci sono settimane in cui è possibile per loro non ricevere alcuna commissione.

Spesso interi dislocamenti vengono spostati di paese in paese a cercare le miglior condizioni salariali per i datori di lavoro (quindi quelle più basse per i lavoratori).

Il lavoro cambia costantemente, automatizzato e sostituito con nuove esigenze per nuovi tipi di dati. È una catena di montaggio che può essere configurata all’infinito e istantaneamente, spostandosi ovunque ci sia la giusta combinazione di competenze, banda larga e salari.

Negli ultimi mesi sono sempre più frequenti, pare, i casi di tasker che inseguono il lavoro ovunque vada, affittando server proxy per nascondere la loro posizione reale e comprando false identità per superare i controlli di sicurezza in modo da poter fingere di lavorare da Singapore, Paesi Bassi, Mississippi o ovunque i lavori siano disponibili. Alcuni gestiscono più account registrati in diversi paesi.

Secondo visionari come Elon Musk l’AI è destinata in breve tempo ad auto-alimentarsi trasformandosi in una superintelligenza artificiale; molti di coloro che lavorano all’interno del settore di classificazione dati e addestramento delle AI non sposano questa teoria, asserendo che il fattore umano resterà fondamentale. Ma le incognite sulle condizioni di lavoro sono ancora troppe.


In Evidenza


Quando le relazioni sono artificiali

Da un partner virtuale a una conversazione con una persona…

Chi fermerà l’AI? Riflessione sull’appello di Musk

Elon Musk e altri mille esperti chiedono una pausa di…

Elon Musk e altri mille esperti: “Allarme intelligenza artificiale”

Elon Musk e altri mille esperti hanno chiesto di sospendere…

Microsoft 365 Copilot, un’AI generativa per la produttività

Microsoft ha lanciato 365 Copilot, un servizio di intelligenza artificiale…

OpenAI rilascia GPT-4, più potente e multimodale

GPT-4 è arrivato. Un modello multimodale e con 100 trilioni…