Auteursrechtelijk materiaal van mensen is een cruciaal onderdeel voor het trainen van toonaangevende AI-modellen volgens OpenAI. De legaliteit -en verantwoordelijkheidsvraagstukken loeren om de hoek.
OpenAI zegt dat het onmogelijk zou zijn om toonaangevende AI-modellen te trainen, zonder gebruik te maken van auteursrechtelijk beschermd werk van mensen. Uit een recent IEEE-rapport blijkt uit diverse voorbeelden plagiaat naar boven te komen, al wordt hierbij de vraag gesteld wie er verantwoordelijk voor is, de gebruiker of het model zelf. OpenAI houdt voet bij stuk en zegt dat het gebruik van auteursrechtelijk materiaal legaal is.
Auteursrechten als obstakel
Hoewel AI-modellen zich in volle expansie verder evolueren, botsen ontwikkelaars telkens op het probleem van auteursrechten. Hoe meer data een model kan verwerken, hoe waardevoller de output. Alleen mag er niet zomaar gebruik gemaakt worden van auteursrechtelijk beschermd werk van mensen. Volgens het door Microsoft gesteunde laboratorium, zou het materiaal uit louter het publieke domein echter resulteren in ondermaatse AI-software.
Uit een recent IEEE-onderzoek, mede geschreven door AI-expert en criticus Gary Marcus, en Reid Southen, digital illustrator, bleek dat Midjourney en OpenAI’s DALL-E 3 auteursrechtelijk beschermde scènes uit films of games kunnen recreëren op basis van trainingsgegevens. Volgens Marcus en Southen is het vrijwel duidelijk dat de modellen van Midjourney en OpenAI getraind zijn op basis van auteursrechtelijk beschermd materiaal. De bedrijven zelf hebben hun trainingsgegevens echter niet openbaar gemaakt.
De verantwoordelijke van het plagiaat
De vraag is natuurlijk of het gebruik van auteursrechtelijk materiaal legaal is en of AI-klanten risico lopen om aansprakelijk gesteld te worden. Het IEEE-rapport kan alvast dienen als extra ondersteuning in dit debat, al heeft Tyler Ochoa, professor op de juridische afdeling van de Santa Clara Universiteit in Californië, zijn analyse op het rapport klaar.
Ochoa schakelt de auteursrechtwetgeving in om het IEEE-rapport onder de loep te nemen. Hij stelt echter de aanwijzingen van de auteurs in vraag, aangezien het hier voorbeelden betreft van gebruikers die rechtstreeks om plagiaat vragen. Zo bevat elke prompt bijvoorbeeld de titel van een specifieke film of de woorden ‘film’ en ‘screenshot’, wat erop wijst dat de gebruiker, eerder dan het model zelf, letterlijk vraagt naar plagiaat. De vraag is dus wie verantwoordelijk is voor deze plagiaatuitingen, de makers van het AI-model of de mensen die het AI-model vragen om populaire scènes te reproduceren.
OpenAI houdt voet bij stuk
OpenAI blijft zich vasthouden aan het feit dat vandaag de dag bijna elke vorm van menselijke expressie, al gaat het om een blogpost, foto’s of stukjes softwarecode, het auteursrecht bevat. Hierdoor zou het volgens OpenAI onmogelijk zijn om toonaangevende AI-modellen te trainen zonder het beschermde materiaal te gebruiken. Al kan je ook stellen dat wanneer je als bedrijf iets (zoals een AI-model) maakt met behulp van auteursrechtelijk beschermd materiaal, dat je daar vooraf toestemming voor moet vragen. Het is een strijd tussen menselijk arbeid en machines die nog lang niet afgerond lijkt te zijn.