"Paradigmskifte" inom robotteknik: Alter3-robot kombinerad med GPT-4: nu kan den ta selfies och spela på en låtsasgitarr och programmeras med röst istället för komplexa kommandon

Av: Anry Sergeev | 19.12.2023, 19:58

Ett forskarlag från University of Tokyo lyckades bygga en länk mellan den stora språkmodellen GPT-4 och Alter3-roboten, vilket gjorde det möjligt för dem att utföra mer människoliknande gester och programmera roboten på naturligt språk, och därmed överge traditionella hårdvaruberoende styrsystem. Projektförfattarna kallade detta framsteg för ett "paradigmskifte" inom robotteknik.

Alter3 är den senaste versionen av den humanoida roboten, som först togs i drift 2016. Den kan utföra komplexa överkroppsrörelser, inklusive detaljerade ansiktsuttryck, och har 43 axlar som efterliknar rörelserna i det mänskliga muskuloskeletala systemet. Den vilar på en bas men kan inte gå (även om den kan simulera gång). Med hjälp av GPT-4 lärde forskarna roboten att utföra olika simuleringar, som att ta en selfie, kasta en boll, äta popcorn och spela på en låtsasgitarr. Tidigare krävde dessa aktiviteter att specifika instruktioner kodades för varje handling, men med GPT-4 kan robotar lära sig vanliga talinstruktioner.


-Spela "Smoke on the Water" för oss

Forskarna konstaterar att "direkt kontroll nu är möjlig genom att överföra de språkliga uttrycken för mänskliga handlingar till robotkroppen genom programvarukod. Detta ger större möjligheter till samarbete mellan människa och robot. Med detta genombrott inom robottekniken kan vi förvänta oss mer intelligenta, anpassningsbara och personliga robotenheter. Alter3-roboten har en inbyggd kamera som gör att den kan "se" människor och förbättra sitt beteende genom att observera deras reaktioner.

Genom att använda språkmodeller inom robotforskningen kan forskarna förenkla processen med att koordinera robotens många leder genom att ge verbala instruktioner, beskriva rörelsemöjligheter och ta fram den programkod som startar robotens motor. Detta eliminerar den vardagliga uppgiften att programmera varje enskild rörelse för 43 axlar och gör det möjligt för forskare att omkonfigurera och förfina robotens rörelser snabbare, smidigare och mer exakt över tiden.


Alter3 visar upp zombies

Forskarna har också lagt till lite humor i Alter3:s aktiviteter. I ett scenario visar roboten att den äter en påse popcorn, men sedan visar det sig att popcornen tillhör en person som sitter bredvid den. Robotens ansiktsuttryck och handrörelser förmedlar förvåning och skam.

Källa: techxplore.com