AI-programvara diskriminerar personer som inte har engelska som modersmål - studie

Av: Bohdan Kaminskyi | 10.07.2023, 20:24
AI-programvara diskriminerar personer som inte har engelska som modersmål - studie

Datorprogram som identifierar texter som genererats av artificiell intelligens kan diskriminera personer som inte har engelska som modersmål.

Vad vi vet.

Forskare körde 91 engelska texter skrivna av personer som inte har engelska som modersmål genom sju populära GPT-detektorer för att fastställa deras noggrannhet. Resultaten visade att sådana artiklar ofta felaktigt märktes som genererade av artificiell intelligens.

Mer än hälften av de uppsatser som skrevs för det allmänt erkända TOEFL-provet i engelska bedömdes vara skrivna av artificiell intelligens. Ett av programmen rapporterade dessutom att 98% av texterna var genererade av AI.

När dessa program kontrollerade texter skrivna av personer med engelska som modersmål klassificerade de dem som skrivna av människor i mer än 90% av fallen.

Forskarna förklarar diskrimineringen med det sätt på vilket detektorerna skiljer AI från människor. Programmen analyseras med avseende på så kallad "text surprise " - ett mått på modellens " förvåning" eller "förvirring " när den försöker förutsäga nästa ord i en mening.

Om algoritmen lätt klarar av uppgiften bedöms textöverraskningen som låg. Om nästa ord däremot är svårt att förutsäga får texten ett högt överraskningsvärde.

Med andra ord, om en person använder enkla ord och fraser är det mer sannolikt att programmet accepterar dem som AI. I regel använder icke-modersmålstalare ofta vanliga ord och uttryck, vilket leder till diskriminering.

Efter att ha upptäckt den inbyggda partiskheten i AI-igenkänningsprogram bad forskarna ChatGPT att skriva om TOEFL-uppsatser med mer komplexa formuleringar. När de redigerade texterna kördes genom detektorerna igen markerades de alla som mänskliga.

Enligt forskarna har många lärare i och med ChatGPT börjat se AI-detektering som "en avgörande motåtgärd för att förhindra en ny form av fusk på 2000-talet". De varnar dock för att den noggrannhet på 99 % som vissa detektorer hävdar är "i bästa fall vilseledande".

Källa: The Guardian.