L’ondata DeepSeek non sembra frenare. Dopo il lancio del suo modello R1, che ha generato un terremoto finanziario che ha travolto soprattutto (ma non solo) il colosso dei chip NVIDIA, la startup cinese ha compiuto un ulteriore passo significativo con il lancio del suo modello multimodale Janus Pro-7B.
I temi trattati all’interno dell’articolo
Innovazioni tecniche
Architettura e dataset:
- Versioni da 1 e 7 miliardi di parametri
- Architettura transformer unificata
- Addestrato su 90 milioni di campioni, inclusi 72 milioni di dati sintetici
Caratteristiche chiave:
- Risoluzione immagini: 768 x 768 pixel
- Approccio open-source
- Disponibile su GitHub e Hugging Face
Prestazioni competitive
Il modello Janus Pro-7B ha mostrato capacità interessanti, superando DALL-E 3 di OpenAI nei benchmark GenEval e DPG-Bench con risultati superiori al concorrente. Il modello offre output visivi stabili e ben definiti, dimostrando prestazioni in linea e in alcuni casi migliori rispetto a Stable Diffusion di Stability AI.