DeepSeek lanserar en förbättrad version av V3 AI tre månader efter den första releasen

Av: Nastya Bobkova | 29.03.2025, 07:28
DeepSeek-V3-0324 förbättrar designen av webbsidor: nya funktioner! DeepSeek-V3-0324 förbättrar skapandet av webbsidor och kinesisk översättning. Källa: Euronews

Kinas DeepSeek har släppt en uppdaterad version av sin storskaliga artificiella intelligens för språk, DeepSeek-V3-0324, bara tre månader efter lanseringen av den första V3-versionen i december 2024.

Här är vad vi vet

Den nya modellen har förbättrad prestanda och kapacitet, inklusive skapandet av estetiskt tilltalande webbsidor och högkvalitativa rapporter på kinesiska.

DeepSeek-V3-0324 har uppmärksammats för sina minskade hårdvarukrav för träning, snabbare träningstid och lägre API-kostnader med hög prestanda jämfört med konkurrenter som OpenAI:s GPT.

Prestanda för DeepSeek. Illustration.
DeepSeeks prestanda. Illustration: DeepSeek

Den uppdaterade modellen involverar inte tänkande, vilket gör att den kan ge svar snabbt utan att dröja sig kvar vid komplexa uppgifter, till skillnad från DeepSeek R1-modellen. Den nya versionen har en parameterstorlek på 685 miljarder, vilket gör den till en av de största offentligt tillgängliga språkmodellerna.

DeepSeek-V3-0324 fick från 5,3% till 19,8% högre poäng på AI-tester jämfört med den tidigare versionen. När det gäller prestanda ligger den nära sådana ledare som GPT-4.5 och Claude Sonnet 3.7.

Dessutom har den uppdaterade versionen visat förbättringar i skapandet av webbsidor samt i sökning, skrivning och översättning av texter på kinesiska.

För att testa den fullständiga versionen av modellen behöver användarna minst 700 GB ledigt diskutrymme och flera Nvidia A100/H100 GPU:er. Det finns dock även förenklade versioner av modellen som kan köras på en enda GPU, till exempel Nvidia 3090.

Källa: DeepSeek