Code Llama, un LLM all’avanguardia di Meta

Code Llama è un modello linguistico (LLM) che utilizza prompt testuali per generare codice.

In linea con l’approccio aperto allo sviluppo dell’intelligenza artificiale di Meta, Code Llama è disponibile con la stessa licenza comunitaria di Llama 2.

Code Llama è una variante di Llama 2 incentrata sul codice, perfezionata riqualificando Llama 2 con l’utilizzo di set di dati specializzati nel codice e aumentando l’estrazione di dati più estesi dallo stesso set d’informazioni. Sono state ulteriormente perfezionate due varianti di Code Llama: Code Llama – Python e Code Llama – Instruct.

Code Llama – Python è una versione incentrata sul linguaggio e messa a punto su 100B token di codice Python. Dato l’ampio utilizzo di Python e la sua importanza nella comunità dell’intelligenza artificiale, abbiamo ritenuto essenziale creare un modello specializzato che si occupasse specificamente della generazione di codice Python, migliorandone così l’utilità.

Code Llama – Instruct è una variante appositamente addestrata con un processo di ottimizzazione delle istruzioni. Il modello riceve istruzioni in linguaggio naturale in ingresso, insieme all’output previsto. Questa messa a punto gli consente di comprendere meglio il risultato desiderato dalle istruzioni umane. Code Llama è specializzato in compiti specifici del codice e non è adatto come modello di base per altri scopi.

I risultati dei benchmark dimostrano che Code Llama supera gli LLM open-source specifici per il codice e addirittura Llama 2. Ad esempio, Code Llama 34B ha ottenuto un punteggio del 53,7% su HumanEval e del 56,2% su MBPP, il più alto tra le soluzioni aperte di ultima generazione e alla pari con ChatGPT.

Recentemente, i generatori di codice hanno contribuito notevolmente ad assistere gli sviluppatori nel loro lavoro. Un passo significativo in questo campo è stato il lancio di Copilot da parte di GitHub a marzo, potenziato dal modello GPT-4 di OpenAI. Anche Amazon AWS ha uno strumento simile chiamato CodeWhisperer, che contribuisce in modo analogo alla generazione, validazione e aggiornamento del codice. Infine Google sta lavorando a uno strumento di scrittura del codice chiamato AlphaCode ma attualmente è ancora in fase di sviluppo e non è stato per ora rilasciato al pubblico.

Tuttavia, di recente, la situazione legale riguardante questi strumenti generativi di codice è diventata problematica. Sono state sollevate accuse secondo le quali Copilot potrebbe violare le leggi sul copyright riproducendo codice con licenza. Questa causa legale sottolinea le sfide e le complessità che sorgono quando tecnologie innovative di intelligenza artificiale si intersecano con i diritti di proprietà intellettuale. L’esito di questa battaglia legale potrebbe avere implicazioni significative per il futuro degli strumenti di generazione del codice e il loro rapporto con il codice soggetto a copyright.

https://github.com/facebookresearch/codellama

Condividi questo post su