Auteurs klagen Nvidia aan voor misbruik werk in training NeMo

Nvidia heeft een rechtszaak aan z’n been gerelateerd aan auteursrecht. Het bedrijf zou beschermd werk gebruikt hebben om LLM’s voor het NeMo-platform te trainen.

Drie auteurs spannen een rechtszaak aan tegen Nvidia. Dat weet Reuters. Ze stellen dat hun werken deel uitmaakten van een dataset van 196.640 boeken die Nvidia heeft gebruikt om een LLM in z’n NeMo-framework geschreven taal te leren. Nvidia haalde het LLM offline en de auteurs claimen dat het bedrijf zo toegaf dat er fouten waren gebeurd. Ze willen nu een zogenaamde class action-rechtszaak starten in de VS, waar eenieder die auteursrechtelijk beschermd werk misbruikt zag voor Nvidia zich bij kan aansluiten. Welk bedrag de klagers precies eisen, is niet duidelijk.

Deze rechtszaak is niet de eerste tegen bedrijven achter LLM’s. De meest opvallende zaak is vermoedelijk die van de New York Times tegen OpenAI. De grote Amerikaanse krant stelde terecht vast dat ChatGPT getraind is op data van de NYT, zonder dat het daar ooit toestemming voor heeft gegeven.

Uitdaging voor Gen AI

Bescherming van auteursrecht is een heikel punt voor generatieve AI. In feite zijn zowat alle grote modellen vandaag getraind op gestolen data. Journalisten, auteurs, grafische designers en kunstenaars zien hoe geavanceerde LLM’s hun werk kunnen nabootsen dankzij training op hun teksten en beelden, zonder dat ze ooit toestemming konden geven (of intrekken).

Er komt stilaan verandering in de manier waarop training van toekomstige LLM’s in z’n werk gaat. Redit en Stack Overflow bouwden al een API voor hun gegevens die ze tegen betaling openstellen voor organisaties die modellen willen trainen. Zo kan de training van AI-modellen verder gaan, maar krijgen eigenaars van data wel een vergoeding. Helaas is er al heel wat kwaad geschied. De drie auteurs willen dat die schade nu wordt rechtgezet.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.