Deepseek R1

Sviluppatore DeepSeek AI
Data di Rilascio 20 gennaio 2025
Panoramica DeepSeek R1 è un modello linguistico di grandi dimensioni (LLM) sviluppato dalla startup cinese DeepSeek AI. Rilasciato il 20 gennaio 2025, R1 è progettato per eccellere in compiti di ragionamento complesso, matematica e programmazione. Utilizza un’architettura Mixture of Experts (MoE) con 671 miliardi di parametri totali, attivandone dinamicamente 37 miliardi per token, il che consente un’allocazione efficiente delle risorse computazionali. R1 supporta una finestra di contesto estesa fino a 128.000 token, permettendo l’elaborazione di sequenze di input molto lunghe. Il modello è open-source, promuovendo la trasparenza e l’innovazione nella comunità AI.
Open Source
Offerta del Modello DeepSeek R1 (671B), DeepSeek R1-Lite-Preview
Interazioni Input e output testuali; supporto multimodale in sviluppo.
Fine-tuning
Licenza Open-source
Prezzo Gratuito
Link Vai al sito

Ultime news


Bolla AI: il fondo speculativo di Peter Thiel ha venduto tutta la sua partecipazione in Nvidia

Prima del fondo Macro LLC la società giapponese SoftBank ha…

Bolla AI: il fondo speculativo di Peter Thiel ha venduto tutta la sua partecipazione in Nvidia
Google pianifica investimenti per 40 miliardi di dollari in data center in Texas

Negli Stati Uniti tutte le principali aziende di AI stanno…

Google pianifica investimenti per 40 miliardi di dollari in data center in Texas
Jeff Bezos sfida le aziende AI: ecco la nuova startup Project Prometheus

Il fondatore di Amazon diventerà co-CEO di una realtà che…

Jeff Bezos sfida le aziende AI: ecco la nuova startup Project Prometheus

Privacy policy| Cookie policy| Cookie setting| © 2025