Meta introducerade Audiobox - AI för röstgenerering och ljudeffekter
Meta
Meta har tillkännagett en ny AI-plattform som heter Audiobox, som gör att du kan skapa personliga röster och ljudeffekter med röstkommandon.
Här är vad vi vet
Audiobox är baserad på Metas tidigare utveckling, Voicebox. Men enligt utvecklarna överträffar nyheten sin föregångare när det gäller ljudkvalitet och funktionalitet.
Från och med idag kan du prova vår nya grundforskningsmodell för ljudgenerering. Demon inkluderar Zero shot TTS, Text till ljudeffekter, Infilling och mer!
- AI at Meta (@AIatMeta) 11 december 2023
Prova Audiobox ➡️ https://t.co/8OPcJYy8a9 pic.twitter.com/lo9rCOZMAh
Audiobox främsta skillnad är förmågan att inte bara generera utan även redigera ljud. Plattformen kan skapa tal på olika språk, ljudeffekter (bilhorn, hundskall, åskknallar) och hela ljudlandskap.
Meta har i Audiobox byggt in kontroll över genereringsprocessen, så att det önskade resultatet kan justeras så exakt som möjligt.
För att förhindra missbruk har utvecklarna integrerat ett digitalt vattenmärkningssystem i Audiobox. Allt ljud som genereras med hjälp av plattformen märks automatiskt så att dess ursprung kan spåras.
Enligt Audiobox-utvecklarna är ljudgenereringen 25 gånger snabbare än tidigare Meta AI-modeller. Detta möjliggörs genom att använda personliga algoritmer för databehandling för varje specifik uppgift.
En begränsning med tekniken hittills är bristen på kvalitetsmärkta data för att träna AI-modellen. Om Audiobox till exempel ska kunna härma olika hundraser eller människors accenter på ett korrekt sätt behöver den en lämplig uppsättning exempel. I takt med att databasen utökas kommer plattformens kapacitet bara att växa.
Källa: Meta: Meta