TinyZero, il clone californiano di DeepSeek costa meno di 30 dollari

TinyZero, il clone californiano di DeepSeek costa meno di 30 dollari

Sviluppato come esperimento da un gruppo di dottorandi dell’Università della California a Berkeley, TinyZero è di fatto un ‘clone’ di DeepSeek R1, perché ne riprende il nucleo funzionale e metodologico, ma con una marcia in più in termini di economicità.

I temi trattati all’interno dell’articolo

Il funzionamento di TinyZero

A presentare l’esperimento è stato il dottorando Jiayi Pan, il quale ha descritto su X come ha riprodotto DeepSeek R1-Zero applicandolo al gioco CountDown, dimostrando che, grazie al reinforcement learning, un modello linguistico di base da 3 miliardi di parametri (in questo caso Qwen 2.5) può sviluppare capacità autonome.

Pur precisando che questo approccio è stato validato solo nel contesto specifico del gioco e non su compiti di ragionamento generale, Pan ha presentato anche TinyZero, un modello open-source che si addestra con costi contenuti (meno di 30 dollari), disponibile gratuitamente su GitHub. Ciò apre nuove prospettive per applicazioni di intelligenza artificiale sempre più efficienti.

Cos’è il reinforcement learning?

Il reinforcement learning, in italiano “apprendimento per rinforzo”, è una tecnica del machine learning grazie alla quale un agente impara a prendere decisioni migliori interagendo con l’ambiente.

In questo contesto, l’agente osserva lo stato corrente dell’ambiente, esegue un’azione e riceve in cambio una ricompensa o una penalità. Questo meccanismo di feedback consente all’agente di valutare l’efficacia delle proprie azioni in relazione a un obiettivo specifico.

Il processo si basa su un approccio di prova ed errore: attraverso iterazioni successive, l’agente affina la propria politica decisionale, ossia la strategia che guida la scelta delle azioni, cercando di massimizzare la ricompensa totale nel tempo. La caratteristica fondamentale del reinforcement learning è proprio questa capacità di apprendere dai risultati delle proprie azioni senza l’ausilio di dati etichettati, come avviene invece nell’apprendimento supervisionato.


Ultime news


OpenAI cancella il lancio di o3 e indica una nuova rotta verso GPT-5

Sam Altman ha illustrato i prossimi passi di OpenAI, annunciando…

OpenAI cancella il lancio di o3 e indica una nuova rotta verso GPT-5
Alibaba collabora con Apple per funzionalità AI sugli iPhone: colosso cinese al +9% in borsa

Apple necessitava di un partner locale e l'ha trovato in…

Alibaba collabora con Apple per funzionalità AI sugli iPhone: colosso cinese al +9% in borsa
L’AI Act nelle imprese, la nostra intervista a Licia Garotti | AI Talks #16

Il 2 febbraio è entrato in vigore l’AI Act e…

L’AI Act nelle imprese, la nostra intervista a Licia Garotti | AI Talks #16
Elon Musk ritirerà la sua proposta d’acquisto se OpenAI resta (in parte) non-profit

La condizione per il ritiro dell'offerta di Elon Musk è…

Elon Musk ritirerà la sua proposta d’acquisto se OpenAI resta (in parte) non-profit
DeepSeek sta spingendo il mercato cinese dei chip

Il successo di DeepSeek favorirà i produttori cinesi di chip…

DeepSeek sta spingendo il mercato cinese dei chip

In Evidenza


Microsoft presenta l’AI L.A.B. 2025 a Milano

Ieri, Microsoft Italia ha presentato il programma AI L.A.B. 2025.…

Microsoft presenta l’AI L.A.B. 2025 a Milano
I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13
OpenAI: anche Mira Murati lascia

L'abbandono di Murati si aggiunge a quelli di Ilya Sutskever,…

OpenAI: anche Mira Murati lascia
L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi
Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà

Il video di Faraday è stato visto oltre 2,6 milioni…

Bambina di 8 anni crea chatbot da sola: la nostra intervista esclusiva al papà

Privacy policy| Cookie policy| Cookie setting| © 2025