Trends

News - Trend trimestrale

Volume trimestrale

... ..%

Volume semestrale

... ..%

Code Llama: il modello AI open source di Meta per il coding

4 minuti

Paolo Marinoni 28 Agosto 2023
4 minuti

Meta ha presentato Code Llama, un modello di linguaggio di grandi dimensioni (large language model) all’avanguardia in grado di generare codice e linguaggio naturale a partire da prompt di testo.

Si tratta di una svolta rilevante nel campo dell’intelligenza artificiale applicata allo sviluppo di software, perché Code Llama rappresenta il primo modello linguistico open source (basato su Llama 2) specializzato nella generazione di codice ad aver raggiunto prestazioni pari a quelle offerte da altri servizi avanzati a pagamento.

Il modello specializzato di Meta è in grado di scrivere codice in diversi linguaggi di programmazione partendo da semplici descrizioni in linguaggio naturale. Può anche completare codice esistente, debuggarlo e documentarlo. Queste capacità hanno il potenziale di rivoluzionare i flussi di lavoro degli sviluppatori software, rendendoli più efficienti e abbattendo le barriere per chi si avvicina alla programmazione.

Disponibile gratuitamente per ricercatori e sviluppatori

Ciò che rende Code Llama particolarmente interessante è che Meta ha deciso di rilasciarlo con una licenza open source, rendendolo gratuitamente disponibile per qualsiasi scopo di ricerca o commerciale. Si tratta di una mossa insolita nel campo degli LLM, dove i modelli migliori sono di solito proprietari e ad accesso limitato.

L’approccio aperto di Meta mira – come dichiarato dalla stessa società – a promuovere innovazione e sicurezza, consentendo alla comunità di ricercatori e sviluppatori di valutare appieno le capacità di Code Llama, identificarne problematiche e contribuire a migliorarlo.

Tre versioni del modello per diversi casi d’uso

Sono disponibili tre diverse versioni di Code Llama, ognuno adatto a diversi casi d’uso.

  • Code Llama: il modello base per la generazione di codice, addestrato su 500 miliardi di token di dati relativi alla programmazione, è disponibile in tre dimensioni: 7, 13 e 34 miliardi di parametri.
  • Code Llama – Python: una versione specializzata per il linguaggio Python, ulteriormente ottimizzata attraverso il fine-tuning su 100 miliardi di token di codice Python.
  • Code Llama – Instruct: una versione ottimizzata per comprendere le istruzioni in linguaggio naturale; un elemento che rende questa versione più adatta alla generazione di codice a partire prompt inseriti in modo più discorsivo.

Prestazioni superiori rispetto ad altri modelli open source

Nelle valutazioni condotte internamente, Code Llama ha superato altri modelli di linguaggio open source specializzati nella programmazione in benchmark relativi alla generazione di codice, ottenendo i punteggi più alti tra le soluzioni open source disponibili.

In particolare, nel benchmark HumanEval, la versione 34B ha ottenuto un punteggio del 53,7%, mentre nel benchmark MBPP un punteggio del 56,2%, superando altri modelli all’avanguardia e risultando alla pari con ChatGPT.

Sviluppato con un approccio responsabile

Meta afferma di aver seguito un approccio responsabile durante lo sviluppo di Code Llama, conducendo test di sicurezza e valutazioni di potenziali rischi. L’obiettivo della società nel corso del training del suo modello di linguaggio è stato quello di minimizzare i potenziali utilizzi dannosi, pur promuovendo gli usi positivi di questa tecnologia emergente.


Altre risorse


In Evidenza


Quando le relazioni sono artificiali

Da un partner virtuale a una conversazione con una persona…

Chi fermerà l’AI? Riflessione sull’appello di Musk

Elon Musk e altri mille esperti chiedono una pausa di…

Elon Musk e altri mille esperti: “Allarme intelligenza artificiale”

Elon Musk e altri mille esperti hanno chiesto di sospendere…

Microsoft 365 Copilot, un’AI generativa per la produttività

Microsoft ha lanciato 365 Copilot, un servizio di intelligenza artificiale…

OpenAI rilascia GPT-4, più potente e multimodale

GPT-4 è arrivato. Un modello multimodale e con 100 trilioni…