Google uppdaterar sina AI-modeller Veo och Imagen för mer korrekt innehåll

Av: Vlad Cherevko | 16.12.2024, 20:14

Google har presenterat en ny version av sin generativa AI-modell för video, Veo 2, som enligt företaget nu bättre förstår fysik i verkligheten och mänskliga rörelser.

Här är vad vi vet

Veo 2 gör det möjligt för användare att referera till specifika filmgenrer, filmiska effekter och linser när de skapar videor. Modellen minskar också artefakter som extra fingrar och förbättrar bildkvaliteten. Nedan visas en video som helt och hållet skapats med Veo 2-modellen.

Google har också förbättrat sin text-till-bild-modell, Imagen 3, som nu genererar ljusare och bättre sammansatta bilder och följer ledtrådar mer exakt.

En bild genererad av Imagen 3-modellen. Illustration: Google

Google har också lagt till ett nytt verktyg som heter Whisk, som kombinerar funktionerna i Imagen 3 och den visuella förståelsemodellen Gemini för att skapa unika bilder genom att kombinera flera idéer eller objekt i en enda illustration.

Modellerna innehåller en osynlig SynthID-vattenstämpel för att minska sannolikheten för felaktig information. Veo 2 kommer gradvis att bli tillgänglig för Google Labs-användare i USA och är nu begränsad för testare för att skapa videor på upp till åtta sekunder i 720p. Förbättringar för Imagen 3 är redan tillgängliga för Google Labs-användare i mer än 100 länder genom ImageFX.

Källa: Google