Deepseek v3

Sviluppatore DeepSeek AI
Data di Rilascio Dicembre 2024
Panoramica DeepSeek V3 è un modello linguistico di grandi dimensioni (LLM) sviluppato dalla startup cinese DeepSeek AI. Con 671 miliardi di parametri totali, di cui 37 miliardi attivati per token, utilizza un’architettura Mixture-of-Experts (MoE) avanzata. Addestrato su 14,8 trilioni di token multilingue, principalmente in inglese e cinese, il modello eccelle in compiti di ragionamento, matematica e programmazione. Supporta una finestra di contesto estesa fino a 128.000 token, consentendo l’elaborazione di sequenze di input molto lunghe. DeepSeek V3 è open-source, promuovendo la trasparenza e l’innovazione nella comunità AI.
Open Source
Offerta del Modello DeepSeek-V3-Base, DeepSeek-V3 (Chat)
Interazioni Input e output testuali; supporto multimodale in sviluppo.
Fine-tuning
Licenza Open-source
Prezzo Gratuito
Link Vai al sito

Ultime news


Anthropic sta facendo esperimenti per testare il livello di introspezione dei suoi modelli AI

I risultati hanno dimostrato che i modelli AI della società…

La Cina che “ha già vinto” la corsa all’AI (e altre notizie generative) | Weekly AI

Weekly AI è la newsletter settimanale di AI news sulle…

All’assemblea annuale di Tesla Elon Musk ha ballato insieme al robot dell’azienda

Gli azionisti avevano appena approvato il suo pacchetto di compensi…

La domanda di AI fa volare l’export di Taiwan: record degli ultimi sedici anni

Nonostante l'imposizione dei dazi statunitensi, le esportazioni tecnologiche di Taiwan…

Privacy policy| Cookie policy| Cookie setting| © 2025

Exit mobile version