OpenAI presenterade Sora, en AI-modell för konvertering av text till video

Av: Bohdan Kaminskyi | 15.02.2024, 20:59

OpenAI

OpenAI har tillkännagivit en ny videogenereringsmodell kallad Sora, som kan skapa realistiska och fantasifulla videor som är upp till en minut långa utifrån en textbeskrivning.

Det här är vad vi vet

Enligt OpenAI skapar Sora komplexa scener med flera figurer genom att exakt placera objekt och karaktärer i bild. Modellen kan också generera olika typer av rörelser.

Utvecklarna noterade AI:ns förmåga att beskriva bakgrunder, enskilda objekt och karaktärer i detalj. Dessutom kan den generera karaktärsansikten med färgstarka och varierande känslor.

OpenAI hävdar att deras modell har en viss "förståelse" för de fysiska lagarna i den verkliga världen. Ibland finns det dock svårigheter med att skapa komplexa scener och orsak-verkan-relationer.

Förutom att syntetisera videor från grunden kan Sora förfina och utöka befintliga videor. Den kan fylla i bildrutor som saknas i en bildsekvens.

Sora är för närvarande endast tillgänglig för "red teamers" som utvärderar modellen för potentiella skador och risker. OpenAI har också öppnat upp för vissa bildkonstnärer, designers och filmskapare för att få feedback.

Källa: OpenAI: OpenAI