NVIDIA har skapat en "schweizisk kniv för ljud": en ny AI-modell kan skapa och redigera ljud baserat på textuella ledtrådar

Av: Vlad Cherevko | 26.11.2024, 11:41

Nvidia tillkännagav Fugatto, en innovativ ljudgenerator med artificiell intelligens som kan skapa och redigera musik, tal och ljud baserat på textuella ledtrådar.

Här är vad vi vet

Fugatto eller Foundational Generative Audio Transformer Opus AI-modellen, som beskrivs som en "schweizisk kniv för ljud", kan skapa ljud och modifiera befintliga musik-, röst- och ljudfiler baserat på textkommandon. Fugatto har utvecklats av ett internationellt forskarteam, vilket har förbättrat dess flerspråkiga och multiaccentuella kapacitet.

Verktyget kan modifiera rösten genom att lägga till accenter eller ändra ton, redigera musik genom att isolera sång, lägga till instrument eller ersätta melodier. Nvidia hävdar att Fugatto är tränad på miljontals ljudprover och kan utföra ett brett spektrum av uppgifter utan behov av ytterligare data.

Bolaget anger dock inte när eller om verktyget kommer att vara tillgängligt för allmänheten. Fugatto sticker ut bland andra AI-verktyg som Stability AI och OpenAI genom sin förmåga att skapa helt nya ljud.

Källa: NVIDIA