De New York Times heeft een officiële klacht ingediend tegen OpenAI en Microsoft, het bedrijf achter ChatGPT. Het dagblad overweegt die stap om zijn auteursrecht te verdedigen.
New York Times was al langere tijd aan het overwegen om gerechtelijke stappen te nemen tegen OpenAI. Twee bronnen spraken hier in augustus over met het onafhankelijke radiostation NRP. Vandaag heeft de krant ook een officiële aanklacht ingediend, schrijft Wall Street Journal. Niet alleen tegen OpenAI, maar ook tegen Microsoft.
Conversatie voorbij
Net zoals heel wat online materiaal, zijn ook de artikels van de NYT geschikt om large language models te trainen. De krant is al een tijd in gesprekken met OpenAI verwikkeld, om met die tweede een prijs af te spreken voor het gebruik van zijn teksten. Dat overleg draaide op niets uit, waardoor de Times overgaat op legale stappen om een in hun ogen eerlijke vergoeding af te dwingen.
Intussen heeft de krant zijn gebruiksvoorwaarden aangepast. Daarin staat nu te lezen dat al zijn materiaal beschermd is door auteursrecht en dat het niet mag worden gebruikt in enige ontwikkeling van software. Dat zou dus ook de training van AI inhouden.
lees ook
ChatGPT krijgt op maat gemaakte instructies
In a New York lawsuit
De krant gaat breed in zijn bedenkingen, ze ziet ChatGPT zelfs als een mogelijke concurrent in de nabije toekomst. Vooral omdat de chatbot inhoud van artikels en interviews van de NYT in zijn antwoorden gebruikt, zaken die door mensen van de krant worden geschreven. De vrees is bijvoorbeeld dat gegenereerde antwoorden van AI hoger dan het origineel gaan scoren in zoekmachines, die ook steeds intensiever door AI worden gestuurd. Gebruikers zouden dan veel minder naar het origineel gaan kijken.
Modellen als ChatGPT schrapen het internet als training, voor welke informatie ze ook maar kunnen vinden. Het is op die data dat zulke chatbots hun antwoorden en voorstellen baseren. Als de Times hiermee doorzet en wint, dan zou dat een enorme klap zijn voor large language models als die van OpenAI. Het zou niet minder betekenen dan hun datasets compleet te veranderen, door alleen nog materiaal te gebruiken waarvoor toestemming is verleend.
De federale boetes in zulke zaken zijn niet min in de VS en kunnen oplopen tot 150.000 dollar per inbreuk. Het is duidelijk dat dat voor AI-bedrijven niet minder dan een catastrofe zou betekenen, aangezien het bij hen over miljoenen artikels gaat die worden verwerkt. Als de NYT doorzet en wint, kan dat bovendien een sneeuwbaleffect van ongeziene proporties aan het rollen brengen, wanneer anderen ongetwijfeld het voorbeeld van de krant gaan volgen.
Niet de enigen
Er zijn al organisaties en personen die verwikkeld zijn in een legaal steekspel met AI-bedrijven. Zo stapte comédienne Sarah Silverman mee in een groepsvordering tegen OpenAI. Zij beweert het bedrijf nooit toestemming te hebben gegeven voor gebruik van haar biografie, wat wel is gebeurd. Ook fictie en non-fictie schrijvers pikken het niet langer dat hun werk zomaar van het web wordt geplukt om modellen te trainen.
Het gaat ook niet alleen over LLM’s en teksten. Getty Images sleepte intussen Stability AI, het bedrijf achter Stable Diffusion, voor de rechter. De aanbieder van visueel materiaal gaf nooit zijn toestemming om zijn bibliotheek te laten gebruiken voor AI-training. De foto’s van Getty zijn herkenbaar door het half doorschijnende kadertje in zijn foto’s als er niet voor is betaald, dat kadertje dook intussen effectief al op bij AI-beeldgeneratoren die ermee trainden en het label gewoon mee overnamen.
Dit artikel verscheen origineel op 18 augustus. De tekst kreeg een update met de recentste informatie.