Meta och Microsoft släpper Llama 2, en AI-språkmodell för kommersiellt bruk
Meta och Microsoft har gått samman för att introducera Llama 2, en ny generation storskalig språkmodell utformad för både kommersiella och forskningsändamål.
Vad vi vet
Llama 2 distribueras kostnadsfritt. Enligt Meta har modellen tränats med 40 % mer data än Llama 1. Den kontextuella längden har fördubblats.
I utgåvan ingår modellvikter och källkod, och antalet parametrar varierar från 7 miljarder till 70 miljarder. Meta sa att Llama 2 överträffar andra språkmodeller med öppen källkod på många externa mätvärden, inklusive resonemang, kodning, skicklighet och kunskapstester.
Under utvecklingen av Llama 2 ägnades mer uppmärksamhet åt ansvar. Utvecklarna har testat modellerna på nytt och skapat ett transparensschema som beskriver eventuella problem.
Dessutom inkluderar de en guide till ansvarsfull användning samt en policy för acceptabel användning för att förhindra missbruk som kriminell verksamhet, vilseledande framställningar och skräppost.
Microsoft tillhandahåller modellen via Azure AI-katalogen för användning i molnbaserade verktyg som innehållsfiltrering. Verktyget kan också köras direkt på Windows-datorer och kommer att finnas tillgängligt via externa leverantörer som Amazon Web Services och Hugging Face.
Den första versionen av modellen hade öppen källkod, men var endast avsedd för akademiker och forskare. Llama 2 gör det möjligt för företag att anpassa tekniken för sina egna ändamål, till exempel för att skapa chatbots eller bildgeneratorer. Detta gör det möjligt för företag att dra nytta av modellen och för tredjepartsutvecklare att testa den för partiskhet, felaktigheter och andra brister.