Reddit geeft zijn content niet zomaar meer prijs aan zoekmachines. Google is de enige die nog recente posts kan weergeven, omdat het daar fors voor betaald heeft.
Zoekmachines zoals Bing, DuckDuckGo en andere alternatieven tonen geen recente posts meer van Reddit, merkt 404Media op. Wil je weten wat ze over een bepaald onderwerp op Reddit zeggen, kan je door site:reddit.com toe te voegen aan de zoekopdracht de resultaten filteren. Maar je zal dan geen recente bijdragen van gebruikers meer te zien krijgen als je niet Google gebruikt.
Dat is geen toeval. Reddit sloot in februari een deal van zestig miljoen dollar per jaar met Google. De deal geeft Google toegang tot de content op Reddit voor het trainen van zijn Gemini-modellen, maar dus ook om recente posts te kunnen indexeren in de zoekmachine. Reddit is het zat dat zoekmachines zijn content opslorpen zonder daar een eerlijke prijs voor te betalen.
Betalen of buiten
Zoekmachines maken gebruik van ‘webcrawlers’ om webcontent te verzamelen en te indexeren. Reddit kondigde aan dat het maatregelen zou nemen en voegt daad bij het woord. Het voerde aanpassingen aan de robot.txt-file om webcrawlers van niet-betalende partijen de toegang te ontzeggen. “Het is een signaal aan degenen die geen overeenkomst met ons hebben dat ze geen toegang moeten krijgen tot Reddit-gegevens”, maakt het bedrijf duidelijk aan The Verge.
Steve Huffman gaat nog een stap verder en noemt enkele bedrijven bij naam. Microsoft, Anthropic en Perplexity zouden volgens de CEO voortdurend proberen om de content op het platform zonder overeenkomst te bemachtigen. “Deze bedrijven denken dat alles op het internet gratis is voor hen om te gebruiken. Zonder overeenkomst hebben wij niets te zeggen over hoe onze gegevens gebruikt worden.” Ook andere bedrijven hebben geklaagd over de ‘agressieve’ tactieken‘ die Anthropic hanteert om data te bekomen.
lees ook
Microsofts AI-baas ontkent bestaan auteursrechten op het internet
Microsoft ziet dit anders en vindt dat Reddit ‘andere zoekmachines’ oneerlijke voordelen geeft door hun webcrawlers niet toe te laten. Reddit antwoordt daarop dat Google geen exclusiviteit krijgt. Het staat open voor onderhandelingen met alle eigenaars van zoekmachines, maar voorlopig is er geen ander akkoord bereikt, ‘omdat sommigen geen afdwingbare beloften kunnen of willen doen over hun gebruik van Reddit-inhoud, inclusief het gebruik ervan voor AI’, dixit een woordvoerder aan The Verge. De deuren blijven dus gesloten totdat er een zak geld op tafel wordt gelegd.
Voorpagina van het internet
Reddit is één van de grootse online discussiefora. De site wordt opgedeeld in duizenden subreddits rond een bepaald thema, en wordt daardoor wel eens ‘de voorpagina van het internet’ genoemd. Met 57 miljoen dagelijkse en 512 miljoen maandelijkse actieve gebruikers heeft het een stuk minder gebruikers dan bijvoorbeeld Facebook, maar de kwaliteit van de discussies is doorgaans wel een pak hoogstaander.
In tijden waar AI-gegeneerde content zijn weg begint te vinden naar de topresultaten van zoekmachines, wordt het des te belangrijker de oorsprong te verifiëren. Reddit groeit zo uit tot een bron van informatie, omdat de content nog voor en door mensen is gemaakt. Het bedrijf beseft zelf de waarde van zijn datasets en geeft die niet meer voor niets weg.
Dit artikel verscheen origineel op 25 juli. De tekst kreeg een update met de recentste informatie.