Alibaba presenterar Qwen3-Coder med stöd för AI-agenter som kan fatta självständiga beslut

Av: Anry Sergeev | 23.07.2025, 13:31

Qwen-teamet har officiellt presenterat Qwen3-Coder, sin mest kraftfulla kodgenerator hittills, som stöder "agent"-ansatsen. Den största stjärnan i linjen är Qwen3-Coder-480B-A35B-Instruct. Detta är en hybrid Mixture-of-Experts-modell med 480 miljarder parametrar (35 miljarder aktiva samtidigt) som kan arbeta med en kontext på upp till 256 000 tokens nativt och upp till 1 miljon tokens med extrapolering. I tester visar den rekordresultat bland öppen källkod-modeller inom Agentic Coding, Agentic Browser-Use och Agentic Tool-Use - på Claude Sonnet 4-nivå.

Vad är agentisk kodning?

Qwen3-Coder skapades inte bara för att generera kod, utan också för att fungera som en "agent" som kan planera, använda verktyg, ta emot feedback och fatta beslut. I verkliga uppgifter (t.ex. SWE-Bench) interagerar den med miljön i flera steg, vilket kräver komplex inlärning av Long-Horizon RL. För detta ändamål har Qwen-teamet skapat ett skalbart system med 20 000 parallella miljöer baserat på Alibaba Cloud.

Qwen3-Coder funktioner

Tränad på 7,5 biljoner tokens, varav 70 % är kod
Stödjer enorm kontext på upp till 1 miljon tokens (med YaRN)
Använder förstärkningsinlärning (Code RL) på verkliga uppgifter för att förbättra kodens utförande
Integration med utvecklarverktyg som Qwen Code (CLI), Claude Code och till och med OpenAI SDK
Förmåga att arbeta både genom API och i den lokala miljön

Verktyg och API:er

Qwen Code CLI-verktyget baserat på Gemini Code är tillgängligt med modellen. Det gör att du enkelt kan använda Qwen3-Coder i dina egna projekt, med stöd för anpassade kommandon och funktioner. Det möjliggör också arbete genom Claude Code och direkt API-åtkomst via Alibaba Cloud Model Studio.

Vad är det bra för?

Qwen3-Coder positioneras som en universell kodningsagent - från webbplatsgenerering till komplexa fler-stegs utvecklingsuppgifter. Qwen-teamet planerar att släppa fler modellstorlekar för att minska kostnaderna för distribution och utforskar möjligheter för agentens självförbättring.

Om Qwen

Qwen är en serie stor skala språk modeller och agentlösningar från Alibabas Qwen-team, avsedda att generera text, kod, dataanalys och fler-stegs scenarier med verktyg. Den senaste versionen, Qwen3-Coder, är byggd på en Mixture-of-Experts-arkitektur med 480 miljarder parametrar (35 miljarder aktiva), stöder upp till 256 000 kontexttokens nativt och upp till 1 miljon med extrapolering, och demonstrerar resultat på stängd modellnivå som Claude Sonnet 4 i SWE-Bench, Agentic Coding, Browser-Use och Tool-Use uppgifter. Modellen integreras med OpenAI SDK, CLI-verktyg (Qwen Code, Claude Code), Alibaba Cloud API och stöder GitHub och Hugging Face-ekosystemen, med användning av förstärkningsinlärning på verkliga kodningsuppgifter för att förbättra noggrannhet och effektivitet.

Källa: qwenlm.github.io/blog/qwen3-coder/