Sviluppatore | DeepSeek AI | |
---|---|---|
Data di Rilascio | Dicembre 2024 | |
Panoramica | DeepSeek V3 è un modello linguistico di grandi dimensioni (LLM) sviluppato dalla startup cinese DeepSeek AI. Con 671 miliardi di parametri totali, di cui 37 miliardi attivati per token, utilizza un’architettura Mixture-of-Experts (MoE) avanzata. Addestrato su 14,8 trilioni di token multilingue, principalmente in inglese e cinese, il modello eccelle in compiti di ragionamento, matematica e programmazione. Supporta una finestra di contesto estesa fino a 128.000 token, consentendo l’elaborazione di sequenze di input molto lunghe. DeepSeek V3 è open-source, promuovendo la trasparenza e l’innovazione nella comunità AI. | |
Open Source | Sì | |
Offerta del Modello | DeepSeek-V3-Base, DeepSeek-V3 (Chat) | |
Interazioni | Input e output testuali; supporto multimodale in sviluppo. | |
Fine-tuning | Sì | |
Licenza | Open-source | |
Prezzo | Gratuito | |
Link | Vai al sito |
Ultime news
Ad annunciarlo ieri con un un post su Threads è…
Il CEO di NVIDIA: "Con GR00T N1, gli sviluppatori di…
Anthropic sarebbe in trattativa con ElevenLabs e Amazon per aggiungere…
Dal 28 marzo, non sarà più possibile scegliere l’elaborazione locale…
L’acquisizione di Hotshot da parte di xAI indica una strategia…
In Evidenza
Nel nuovo appuntamento di AI Talks, abbiamo avuto il piacere…
La nostra intervista a Luciano Floridi, già professore di filosofia…
Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…
Il video di Faraday è stato visto oltre 2,6 milioni…
Da un partner virtuale a una conversazione con una persona…
Privacy policy| Cookie policy| Cookie setting| © 2025