OpenAI har presenterat ett verktyg för röstkloning

Av: Bohdan Kaminskyi | Uppdaterad 01.04.2024, 16:33

Mariia Shalabaieva/Unsplash

OpenAI har presenterat Voice Engine, ett röstkloningsverktyg som i princip kan duplicera någons tal baserat på ett 15-sekunders ljudprov.

Här är vad vi vet

Voice Engine är baserat på ett befintligt API för text-till-tal och har varit under utveckling sedan 2022. OpenAI använder redan en version av den här verktygslådan för att arbeta med förinställda röster.

Tekniken kan komma att användas inom områden som högläsning, språköversättning och för att hjälpa personer med nedsatt talförmåga. Som ett exempel beskrev OpenAI ett pilotprojekt vid Brown University där en klon av en röstmotor skapades för en patient med en talstörning baserat på tidigare inspelat ljud.

Trots de potentiella fördelarna finns det farhågor om att tekniken kan missbrukas för att skapa falskt ljudinnehåll. OpenAI är därför ännu inte redo för en fullständig offentlig lansering av Voice Engine och fokuserar på att hantera integritets- och säkerhetsproblem.

Företaget säger att man tar hänsyn till feedback från partners inom olika branscher, inklusive myndigheter, media och civilsamhället, för att säkerställa en säker lansering av produkten. Alla deltagare i förtestet måste följa en användningspolicy som förbjuder imitation av en annan person utan samtycke.

OpenAI implementerar också säkerhetsåtgärder som vattenmärkning för att spåra ljudets ursprung, proaktiv övervakning av systemanvändning och skapande av en "lista över förbjudna röster" för att förhindra kloning av kända personligheter.

Pris och när vi kan förvänta oss det

Exakta officiella lanseringsdatum och slutgiltig prissättning har ännu inte meddelats. Enligt TechCrunch kan Voice Engine kosta 15 USD per miljon karaktärer, vilket gör det till ett mer budgetvänligt alternativ jämfört med konkurrenterna. En "HD"-version med en högre prislapp nämns också.

Källa: Engadget

Artificiell intelligens