Attraverso una nota pubblicata su WeChat la startup di intelligenza artificiale cinese DeepSeek ha comunicato il rilascio di DeepSeek-V3.1, un modello di AI disponibile su Hugging Face.
Le caratteristiche principali del nuovo aggiornamento sono diverse. In primo luogo DeepSeek-V3.1 si basa su una struttura di inferenza ibrida (“thinking” e “non-thinking”), ovvero possiede un’architettura che combina più moduli sviluppata su due diverse modalità di chat a seconda del template di prompt impostato. Possiede inoltre una capacità di pensiero più veloce, potenzialità agentiche maggiori e un’elevata capacità di contesto (fino a 128.000 token di testo).
Tramite una valutazione attraverso benchmark pubblici interni e su repository open-source, DeepSeek-V3.1 presenta un miglioramento significativo nell’interazione con strumenti esterni, compiti agentici e anche in capacità di elaborazione complessa e raggiunge una risposta rapida e di elevata qualità, comparabile o superiore a versioni precedenti o modelli concorrenti.
L’azienda ha annunciato inoltre l’intenzione di adeguare i costi per l’utilizzo dell’API del modello a partire dal 6 settembre attraverso una piattaforma che consente agli sviluppatori di altre app e prodotti web di integrare i suoi modelli.
DeepSeek insidia OpenAI e rilascia il modello AI R1 aggiornato
R1-0528 è un aggiornamento di R1 rilasciato ad inizio 2025.…