Code Llama, un LLM all’avanguardia di Meta

Code Llama è un modello linguistico (LLM) che utilizza prompt testuali per generare codice.

In linea con l’approccio aperto allo sviluppo dell’intelligenza artificiale di Meta, Code Llama è disponibile con la stessa licenza comunitaria di Llama 2.

Code Llama è una variante di Llama 2 incentrata sul codice, perfezionata riqualificando Llama 2 con l’utilizzo di set di dati specializzati nel codice e aumentando l’estrazione di dati più estesi dallo stesso set d’informazioni. Sono state ulteriormente perfezionate due varianti di Code Llama: Code Llama – Python e Code Llama – Instruct.

Code Llama – Python è una versione incentrata sul linguaggio e messa a punto su 100B token di codice Python. Dato l’ampio utilizzo di Python e la sua importanza nella comunità dell’intelligenza artificiale, abbiamo ritenuto essenziale creare un modello specializzato che si occupasse specificamente della generazione di codice Python, migliorandone così l’utilità.

Code Llama – Instruct è una variante appositamente addestrata con un processo di ottimizzazione delle istruzioni. Il modello riceve istruzioni in linguaggio naturale in ingresso, insieme all’output previsto. Questa messa a punto gli consente di comprendere meglio il risultato desiderato dalle istruzioni umane. Code Llama è specializzato in compiti specifici del codice e non è adatto come modello di base per altri scopi.

I risultati dei benchmark dimostrano che Code Llama supera gli LLM open-source specifici per il codice e addirittura Llama 2. Ad esempio, Code Llama 34B ha ottenuto un punteggio del 53,7% su HumanEval e del 56,2% su MBPP, il più alto tra le soluzioni aperte di ultima generazione e alla pari con ChatGPT.

Recentemente, i generatori di codice hanno contribuito notevolmente ad assistere gli sviluppatori nel loro lavoro. Un passo significativo in questo campo è stato il lancio di Copilot da parte di GitHub a marzo, potenziato dal modello GPT-4 di OpenAI. Anche Amazon AWS ha uno strumento simile chiamato CodeWhisperer, che contribuisce in modo analogo alla generazione, validazione e aggiornamento del codice. Infine Google sta lavorando a uno strumento di scrittura del codice chiamato AlphaCode ma attualmente è ancora in fase di sviluppo e non è stato per ora rilasciato al pubblico.

Tuttavia, di recente, la situazione legale riguardante questi strumenti generativi di codice è diventata problematica. Sono state sollevate accuse secondo le quali Copilot potrebbe violare le leggi sul copyright riproducendo codice con licenza. Questa causa legale sottolinea le sfide e le complessità che sorgono quando tecnologie innovative di intelligenza artificiale si intersecano con i diritti di proprietà intellettuale. L’esito di questa battaglia legale potrebbe avere implicazioni significative per il futuro degli strumenti di generazione del codice e il loro rapporto con il codice soggetto a copyright.

https://github.com/facebookresearch/codellama

In Ex Machina siamo sempre alla ricerca di nuove soluzioni da poter utilizzare nei nostri progetti per realizzare soluzioni personalizzare per aziende ed enti pubblici. Se vuoi scoprire di più sulle nostre soluzioni AI esplora il nostro sito > https://exmachina.ch