DeepSeek lanserar en förbättrad version av V3 AI tre månader efter den första releasen

Kinas DeepSeek har släppt en uppdaterad version av sin storskaliga artificiella intelligens för språk, DeepSeek-V3-0324, bara tre månader efter lanseringen av den första V3-versionen i december 2024.
Här är vad vi vet
Den nya modellen har förbättrad prestanda och kapacitet, inklusive skapandet av estetiskt tilltalande webbsidor och högkvalitativa rapporter på kinesiska.
DeepSeek-V3-0324 har uppmärksammats för sina minskade hårdvarukrav för träning, snabbare träningstid och lägre API-kostnader med hög prestanda jämfört med konkurrenter som OpenAI:s GPT.

DeepSeeks prestanda. Illustration: DeepSeek
Den uppdaterade modellen involverar inte tänkande, vilket gör att den kan ge svar snabbt utan att dröja sig kvar vid komplexa uppgifter, till skillnad från DeepSeek R1-modellen. Den nya versionen har en parameterstorlek på 685 miljarder, vilket gör den till en av de största offentligt tillgängliga språkmodellerna.
DeepSeek-V3-0324 fick från 5,3% till 19,8% högre poäng på AI-tester jämfört med den tidigare versionen. När det gäller prestanda ligger den nära sådana ledare som GPT-4.5 och Claude Sonnet 3.7.
Dessutom har den uppdaterade versionen visat förbättringar i skapandet av webbsidor samt i sökning, skrivning och översättning av texter på kinesiska.
För att testa den fullständiga versionen av modellen behöver användarna minst 700 GB ledigt diskutrymme och flera Nvidia A100/H100 GPU:er. Det finns dock även förenklade versioner av modellen som kan köras på en enda GPU, till exempel Nvidia 3090.
Källa: DeepSeek