NVIDIA stäms för upphovsrättsintrång inom AI-utbildning
NVIDIA
NVIDIA står inför en ny grupptalan om upphovsrätt på grund av användning av böcker utan tillstånd för att träna AI-språkmodellen NeMo.
Det här är vad vi vet
Författarna Abdi Nazemian, Brian Keene och Stewart O'Nan anklagar NVIDIA för att olagligt ha använt Books3-datasetet som innehåller deras böcker för att träna NeMo Megatron AI-system. De hävdar att datasetet innehåller ett piratkopierat Bibliotek-bibliotek med 196 640 böcker.
De klagande vill ha en juryrättegång, skadestånd från NVIDIA och att alla kopior av Books3 som använts för att skapa NeMos stora språkmodeller förstörs.
"NVIDIA har medgett att de tränat sina NeMo Megatron-modeller på en kopia av The Pile-datasetet. [...] Books3 är en del av The Pile. [...] NVIDIA har med nödvändighet tränat sina NeMo Megatron-modeller på en eller flera kopior av de intrångsgörande verken, och därigenom gjort direkt intrång i kärandenas upphovsrätt", står det i stämningsansökan.
NVIDIA hävdar dock att NeMo skapades i strikt överensstämmelse med upphovsrättslagen och att företaget respekterar alla innehållsskapares rättigheter.
Detta är inte den första stämningen mot teknikjätten för att ha använt upphovsrättsskyddade verk för att träna AI-system. Tidigare har liknande anklagelser riktats mot OpenAI, Microsoft och andra företag.
Källa: Engadget