Ny AI-agent från OpenAI kommer att kunna boka biljetter, beställa mat och utföra andra uppgifter på webbplatser istället för användare
OpenAI presenterade en ny AI-agent Operator som kan utföra uppgifter på Internet åt användare.
Här är vad vi vet
Agenten använder sin egen webbläsare för att surfa på webben, klicka på knappar, skriva in text och bläddra igenom innehåll. Detta gör att den kan utföra uppgifter på Internet som en person som klickar på knappar, bläddrar igenom sidor och skriver in text på webbplatser. Inledningsvis kommer den nya produkten endast att vara tillgänglig för ChatGPT Pro-abonnenter i USA.
Operatören körs med en speciell
Operatören körs på en speciell modell som kombinerar funktionerna i GPT-4o med djupgående utbildning. Detta gör att den inte bara kan "se" sidor genom skärmdumpar utan också interagera med gränssnitt som vi är vana vid att göra med mus och tangentbord.
Det mest intressanta är att agenten inte bara utför uppgifter utan också kan korrigera sig själv. Om något går fel kommer det att ge dig kontroll över processen. Den kommer också att be om tillstånd om webbplatsen kräver känslig information (t.ex. lösenord) eller be om ditt samtycke innan du skickar ett e-postmeddelande.
OpenAI
OpenAI har samarbetat med populära företag som Uber, DoorDash, Instacart och andra för att säkerställa att agenten utför verkliga uppgifter samtidigt som den följer säkerhets- och etiska standarder. Allt fungerar dock inte perfekt - komplexa gränssnitt som att skapa ett bildspel är fortfarande svårt för Operator.
Inom en snar framtid kommer Operator att vara tillgänglig för användare av Plus-, Team- och Enterprise-planer, och OpenAI planerar att integrera denna teknik direkt i ChatGPT.
Källa: OpenAI