Apple presenterade en AI-modell för redigering av bilder baserat på textkommandon

Av: Bohdan Kaminskyi | Uppdaterad 08.02.2024, 14:33

Laurenz Heymann/Unsplash.

Apple har tillsammans med forskare vid University of California utvecklat och publicerat en modell för artificiell intelligens som kallas MLLM-Guided Image Editing (MGIE). Den gör det möjligt att göra ändringar i bilder baserat på textinstruktioner i naturligt språk.

Det här är vad vi vet

MGIE använder tekniken för multimodala modeller av stora språk. Detta gör det möjligt att tolka korta och tvetydiga användarkommandon för att ytterligare redigera foton. Till exempel kan en AI tolka en uppmaning om att göra en pizzabild "hälsosammare" som ett behov av att tillsätta vegetabiliska ingredienser.

Apple presenterade en AI-modell för redigering av bilder baserat på textkommandon-2

Förutom att göra större ändringar i innehållet kan modellen utföra grundläggande åtgärder som att beskära, rotera, ändra storlek och färgkorrigera bilder. AI kan också bearbeta enskilda regioner för att omvandla vissa objekt.

MGIE finns tillgänglig på GitHub. Apple har dessutom lagt upp en demoversion av tjänsten på Hugging Face-resursen.

Det är ännu inte känt om företaget planerar att integrera tekniken i sina egna produkter.

Källa: Engadget

Artificiell intelligens