Editoria & Media
Etica
Finanza
Governance
Istruzione
Legal
Difesa
Sanità
Altri temi

La Cina accelera: Alibaba sfida Deepseek con il modello QwQ-32B

Alibaba sfida DeepSeek lanciando un modello che, con molti meno parametri, sarebbe più efficiente dal punto di vista economico ed energetico.

Mercato Paolo Marinoni 7 mar 2025

2 min.

Mercato

Paolo Marinoni 7 mar 2025

Seguici su Google News

2 minuti

Alibaba ha registrato un’impennata del 7% nelle sue azioni a Hong Kong dopo aver reso pubblico il suo modello di intelligenza artificiale QwQ-32B (da 32 miliardi di parametri). La mossa, annunciata ieri, sottolinea l’intensificarsi della competizione nel settore AI cinese, in cui il nuovo modello sfida direttamente DeepSeek R1, offrendosi come alternativa più efficiente dal punto di vista economico ed energetico.

QwQ-32B, in particolare, è caratterizzato da una complessità ridotta – contando solo una frazione dei parametri vantati dal rivale creato da DeepSeek – e, nonostante ciò, ha raggiunto risultati interessanti nella comparazione con altri modelli di punta (nell’immagine) in benchmark relativi al ragionamento matematico, alla codifica e alle capacità di problem-solving.

I benchmark condivisi da Alibaba

La Cina accelera Alibaba sfida Deepseek con il modello QwQ-32B — I benchmark condivisi da Alibaba

Il commento del team di sviluppo

“La nostra ricerca esplora la scalabilità del reinforcement learning (RL) e il suo impatto sul miglioramento dell’intelligenza dei grandi modelli linguistici – ha commentato il team di sviluppo del modello – Siamo entusiasti di presentare QwQ-32B, un modello con 32 miliardi di parametri che raggiunge prestazioni paragonabili a DeepSeek-R1, che vanta 671 miliardi di parametri (con 37 miliardi attivati). Questo risultato straordinario sottolinea l’efficacia del reinforcement learning quando applicato a foundation models robusti preaddestrati su una vasta conoscenza del mondo.

Inoltre, abbiamo integrato capacità agentiche nel modello di ragionamento, consentendogli di pensare in modo critico mentre utilizza strumenti e adatta il suo ragionamento in base al feedback ambientale. Questi progressi non solo dimostrano il potenziale trasformativo del RL, ma aprono anche la strada a ulteriori innovazioni nella ricerca dell’intelligenza artificiale generale”.

Large language model

Articoli simili

Meta si affida alle infrastrutture di Arm per le raccomandazioni AI sulle sue piattaforme

L'intesa prevede un ampio utilizzo delle architetture di Arm all'interno dei data center di Meta

continua...

Intel annuncia il lancio di un nuovo chip AI per il 2026

Il nuovo prodotto con cui Intel cerca di rilanciarsi nel mercato dei chip è progettato per l'inferenza AI

continua...

OpenAI ha scelto: il suo chip personalizzato sarà prodotto con Broadcom

Si mira a una produzione di una potenza energetica tale da poter soddisfare il fabbisogno di 25 milioni di abitazioni contemporaneamente

continua...

Meta ha assunto il co-fondatore di Thinking Machines Labs Andrew Tulloch

Tulloch in passato ha ricoperto un ruolo in Meta per un periodo di undici anni

continua...

Sora vola nei download e supera ChatGPT ad una settimana dal lancio sul mercato

A differenza di ChatGPT Sora è disponibile anche in Canada, ma l'accesso è possibile solo su invito

continua...

Ultime news

Google ha lanciato un aggiornamento del suo strumento di generazione video AI Veo

L'aggiornamento apporta miglioramenti su realismo, controllo e continuità nelle scene…

Il paradosso di OpenAI: è sempre più centrale ma perde miliardi di dollari

I costi sono ancora fuori controllo, ma secondo Altman è…

Meta si affida alle infrastrutture di Arm per le raccomandazioni AI sulle sue piattaforme

L'intesa prevede un ampio utilizzo delle architetture di Arm all'interno…

Anthropic ha lanciato una nuova versione del modello Haiku

Secondo l'azienda Haiku 4.5 offre prestazioni simili a Sonnet 4…

Lo Zugzwang di Google

Integrando l'AI nella ricerca, Google mette in crisi gli editori,…

In Evidenza

Arriva l’Italian Prompt Battle: il primo torneo italiano di prompting si terrà a Milano

Gli ideatori, Lucia Cenetiempo e Massimiliano Di Blasi, ci raccontano…

Federico Faggin: “L’intelligenza artificiale non potrà mai essere cosciente”. La nostra intervista al padre del microchip | AI Talks #18

Faggin: "L'essere umano e la macchina sono due cose diverse.…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

Computer vision

Face recognition

Foundation model

Privacy policy| Cookie policy| Cookie setting| © 2025

Exit mobile version