DeepMind har presenterat en AI-agent som kan utföra uppgifter i okända 3D-spel

Av: Bohdan Kaminskyi | 14.03.2024, 17:01

Google DeepMind

Google DeepMind har demonstrerat en ny artificiell intelligens kallad SIMA (Scalable Instructable Multiworld Agent) som kan förstå och utföra uppgifter i 3D-spel baserat på instruktioner i naturligt språk.

Det här är vad vi vet

DeepMinds nya utveckling är den första som visar AI:ns förmåga att följa kommandon i ett brett spektrum av spelvärldar och miljöer som den inte tidigare har stött på. Nio kommersiella spel användes för att träna SIMA, inklusive No Man's Sky, Teardown, Valheim och Goat Simulator 3.

Forskarna registrerade spelarnas tangentbords- och musrörelser för att träna SIMA att uppfatta instruktioner på naturligt språk och styra spelkaraktären därefter. Agenten kan utföra uppgifter av varierande komplexitetsgrad, från navigering till interaktion med objekt och användargränssnittet.

SIMA:s träningsprocess för AI-modellen

I tester visade SIMA sin förmåga att effektivt generalisera sina erfarenheter från vissa spel till andra okända miljöer. Dess prestanda i okända spel var nästan densamma som en agent som tränats specifikt på dessa spel.

Testresultat för SIMA:s AI-modell

Språkinstruktioner från användaren är dock nödvändiga för att SIMA ska kunna prestera optimalt. Utan dem agerade agenten osammanhängande och kaotiskt.

DeepMind ser en stor potential i att skapa universella språkdrivna AI-agenter baserade på SIMA. I framtiden räknar företaget med att utveckla system som på ett säkert sätt kan utföra ett brett spektrum av uppgifter baserat på mänskliga instruktioner i virtuella och verkliga miljöer.

Källa: Engadget