OpenAI ha lanciato due modelli open-weight, gpt-oss-120b e gpt-oss-20b. A differenza dei modelli chiusi, nei modelli “open-weight“, i parametri appresi durante l’addestramento vengono resi pubblici e scaricabili da chiunque attraverso una licenza (Apache 2.0 in questo caso).
La particolarità dei modelli open-weight si manifesta sotto diversi aspetti. In primo luogo, una volta scaricato, un modello aperto può essere eseguito localmente senza dipendere dall’azienda produttrice. L’utente può inoltre effettuare esperimenti sull’architettura e sui pesi del modello, andando a inserire ottimizzazioni o applicazioni personalizzate. Questo permette quindi di adattare il modello a contesti specifici, anche di tipo aziendale.
I temi trattati all’interno dell’articolo
Prestazioni e sicurezza
Dal punto di vista delle prestazioni, gpt-oss-120B eguaglia il modello di ragionamento di OpenAI o4-mini nei benchmark principali, mentre gpt-oss-20B offre un ragionamento potente su un dispositivo edge da 16 GB.
Al fine di moderare i rischi applicativi, OpenAI pubblicherà un protocollo relativo alla sicurezza che simula potenziali utilizzi dannosi nel settore biologico e informatico. L’azienda sta anche rilasciando il codice di valutazione, i prompt e le griglie di valutazione per alzare il livello di sicurezza open-weight in tutto l’ecosistema.
Il cambio di strategia di OpenAI
Si tratta di fatto per OpenAI di un importante cambio di approccio e di strategia rispetto alla linea dei modelli chiusi e a pagamento perseguita fino ad ora, che continueranno comunque a essere prodotti parallelamente (presto potrebbe essere annunciato GPT-5).
Alcuni osservatori legano questo sostanziale cambio di passo ad una risposta alla crescente pressione globale, proveniente soprattutto dalla Cina, relativa alla competizione dei modelli AI aperti come ad esempio DeepSeek.
Baidu ha reso il suo modello Ernie X1 open-source: un altro "momento DeepSeek"?
La decisione di Baidu potrebbe avere delle implicazioni sul mercato…