Stora språkmodeller lär husdjursrobotar att rätta till misstag på egen hand

Av: Bohdan Kaminskyi | 26.03.2024, 19:56
Stora språkmodeller lär husdjursrobotar att rätta till misstag på egen hand
MIT

Forskare vid Massachusetts Institute of Technology (MIT) har utvecklat en ny metod som gör det möjligt för hemrobotar att använda stora språkmodeller (LLM) för att själv korrigera fel under uppgifter utan att kräva mänsklig inblandning.

Det här är vad vi vet

Traditionellt sett överskrider robotar sin programmerade kapacitet när de ställs inför problem, varefter de behöver hjälp av operatören. I hemmet kan dock varje förändring i miljön störa robotens prestanda och tvinga den att starta om uppgiften från början.

Den nya tekniken, som kommer att presenteras vid International Conference on Learning Representations (ICLR) i maj, använder LLM för att dela upp demonstrationsuppgifter i mindre deluppgifter. På så sätt kan roboten automatiskt känna igen var den står och självständigt planera vidare åtgärder i händelse av misslyckanden.

-"LLM har ett sätt att berätta för dig hur du ska göra varje steg i en uppgift, på naturligt språk. En människas kontinuerliga demonstration är förkroppsligandet av dessa steg, i det fysiska rummet. Och vi ville koppla ihop de två, så att en robot automatiskt skulle veta i vilket skede den befinner sig i en uppgift och kunna planera om och återhämta sig på egen hand", säger doktoranden Tsun-Hsuan Wang.

I experimenten visades roboten utföra uppgiften att flytta bollar från en behållare till en annan. Forskarna introducerade små störningar, som att kasta roboten ur kurs eller slå ut bollar ur dess sked. Tack vare LLM kunde roboten korrigera sina handlingar och återuppta sitt arbete utan att börja om från början.

-"Med vår metod behöver vi inte be människor att programmera eller ge extra demonstrationer av hur man återhämtar sig från misslyckanden när roboten gör misstag", konstaterar Wang.

Forskarna förväntar sig att tillämpningen av LLM i hemrobotik kommer att övervinna ett av de viktigaste hindren för massanvändning av sådana enheter.

Källa: TechCrunch