Microsoft avtäckte verktyg för dipfake och röstkloning

Av: Bohdan Kaminskyi | 16.11.2023, 16:35

Microsoft

Vid Ignite-konferensen presenterade Microsoft en tjänst för att skapa fotorealistiska avatarer av människor med läppanimering enligt en given text. Man visade också upp ett verktyg för röstkloning med hjälp av ljudprov.

Det här är vad vi vet

Med den nya avatartjänsten Azure AI Speech text till tal kan du ladda upp ett foto av en person och komponera ett manus. En video av en talande avatar genereras sedan baserat på detta.

De digitala dubbelgångarna kan tala flera språk. I skript kan de använda modeller för artificiell intelligens som OpenAI:s GPT-3.5 för att svara på kundfrågor utanför skripten.

En annan personlig röstfunktion kan återskapa en användares röst på några sekunder. Det kräver en ljudinspelning på en minut.

Företaget föreslår att Personal voice används för att skapa personliga röstassistenter, dubblera innehåll till olika språk och skapa anpassade berättelser för berättelser, ljudböcker och podcasts.

Enligt Microsoft kommer båda verktygen att vara tillgängliga för ett begränsat antal användare och endast för vissa scenarier. Dessutom måste kunderna ge sitt uttryckliga samtycke till att deras röst och bild används.

Detta är avsett att begränsa det potentiella missbruket av teknik för att skapa dipfakes utan människors vetskap. Microsoft säger sig ha ett ansvarsfullt förhållningssätt till AI-etik.

Källa: Microsoft, Microsoft