Sostituire i lavoratori freelance con l’AI? Secondo una nuova ricerca è un’operazione fallimentare

Solamente nel 3% dei casi i chatbot sono stati in grado di svolgere i compiti assegnati con la stessa accuratezza umana

2 min.

Sostituire i lavoratori freelance con l’AI? Secondo una nuova ricerca è un’operazione fallimentare

La convinzione che i lavori svolti da remoto possano essere prima o poi totalmente sostituiti dall’intelligenza artificiale si sta diffondendo nel mondo del lavoro. Una nuova ricerca, condotta dall’organizzazione no profit Center for AI Safety (CAIS), ha messo in evidenza come questa ipotesi rimanga ancora remota e velleitaria.

L’indagine ha testato in modo sistematico la capacità di alcuni noti chatbot di AI, come GPT‑5 e ChatGPT Agent (OpenAI), Claude Sonnet 4.5 (Anthropic), Gemini 2.5 Pro (Google), Manus, Grok 4, di svolgere una gamma di lavori che tipicamente vengono assegnati a lavoratori su piattaforme remote, con lo scopo di misurare la capacità dell’AI di sostituirsi ad essi. Per analizzare il comportamento dei chatbot, i ricercatori hanno creato un benchmark chiamato “Remote Labor Index” che ha raccolto vari compiti freelance per poi assegnarli ai vari modelli di AI.

La ricerca non è entrata nel dettaglio di ogni singola tipologia di compito, ma ha fornito dei risultati generali sulle capacità dei modelli di replicare il lavoro umano in questo ambito. Ciò che è emerso è che i principali chatbot di AI hanno una scarsissima capacità di svolgere questi compiti. Nessun modello si è dimostrato in grado di sostituire in maniera affidabile un freelance e meno del 3% dei compiti assegnati sono stati completati in modo accurato e completo.

Il migliore chatbot è stato Manus della startup cinese con sede a Singapore Butterfly Effect (2,5% di compiti svolti correttamente). Al secondo posto si sono classificati Grok 4 di xAI e Claude Sonnet 4.5 di Anthropic (2,1%). Al terzo e quarto posto si sono posizionati i prodotti di OpenAI ChatGPT-5 (1,7%) e ChatGPT Agent (1,3%). Il peggior risultato è stato ottenuto da Gemini 2.5 Pro di Google (0,8%).


Ultime news


Cos’è la Pax Silica dell’AI voluta dall’amministrazione statunitense

Il progetto lanciato nel dicembre del 2025 dagli Stati Uniti…

Cos’è la Pax Silica dell’AI voluta dall’amministrazione statunitense
Il nuovo imperialismo del tech che prende forma (e altre notizie generative)

Weekly AI è la newsletter settimanale di AI news sulle…

Il nuovo imperialismo del tech che prende forma (e altre notizie generative)
Anthropic farà ricorso contro la designazione di “rischio” imposta dal Pentagono

Nelle ore precedenti il CEO Dario Amodei si era sfogato…

Anthropic farà ricorso contro la designazione di “rischio” imposta dal Pentagono
Oracle taglierà un quinto della sua forza lavoro per sostenere i costi dei data center

Il colosso statunitense ha una pressione sui conti aziendali non…

Oracle taglierà un quinto della sua forza lavoro per sostenere i costi dei data center
Google collabora con l’azienda statunitense CVS Health per innovare l’assistenza sanitaria

La collaborazione permetterà il lancio di Health100, una piattaforma di…

Google collabora con l’azienda statunitense CVS Health per innovare l’assistenza sanitaria

In Evidenza


AI, bolla o non bolla? Il parere degli esperti non è unanime

Ne abbiamo intervistati cinque per unire i puntini

AI, bolla o non bolla? Il parere degli esperti non è unanime
Luciano Floridi: “L’intelligenza artificiale non è intelligente”, la nostra intervista | AI Talks #20

"Se potessi tornare indietro, eliminerei l'espressione 'intelligenza artificiale', la chiamerei…

Luciano Floridi: “L’intelligenza artificiale non è intelligente”, la nostra intervista | AI Talks #20
Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

Privacy policy| Cookie policy| Cookie setting| © 2026