OpenAI har lagt till taligenkänning, bildigenkänning och textröster till ChatGPT

Av: Bohdan Kaminskyi | 25.09.2023, 17:29

OpenAI

OpenAI har tillkännagivit en större uppdatering av ChatGPT-chattboten, som söker genom bilder, taligenkänning och textdubbning.

Här är vad vi vet

Med taligenkänning kan du ställa en fråga till en chatbot med hjälp av din röst. För detta ändamål använder ChatGPT Whisper, en öppen källkodsmodell som OpenAI har utvecklat.

Text-till-tal-konverteringen är ansvaret för den nya modellen, som företaget säger kan generera en "människoliknande röst" från bara några sekunder av talprover. Det finns för närvarande fem röstvarianter att välja mellan.

Med bildsökning kan du ta en bild av ett föremål av intresse och skicka den till ChatGPT. Chatboten kommer att försöka förstå förfrågan och svara därefter.

Du kan också använda ett ritverktyg i appen för att peka på en specifik del av en bild.

OpenAI är medvetet om de potentiella riskerna med de nya funktionerna. Företaget tillåter inte ChatGPT att bearbeta människors foton eller svara på frågor om dem.

De nya funktionerna kommer att vara tillgängliga för ChatGPT Plus Enterprise-prenumeranter inom två veckor. Senare kommer företaget att öppna upp tillgången till dem för alla som vill använda dem.

Källa: OpenAI: OpenAI