Is een tekst geschreven door een mens of AI? Dit algoritme zegt het met (bijna) honderd procent zekerheid

.data
08.06.'23 13:00
3 min
Jens Jonkers

Beeld gemaakt met ShutterStock

Wetenschappers die tijd willen uitsparen en hun artikels door AI laten schrijven, lopen binnenkort meer kans om tegen de lamp te lopen. Amerikaanse onderzoekers bouwden een algoritme dat met meer dan 99 procent zekerheid een menselijke pen van AI kan onderscheiden.

Hoe herken je of een tekst wel degelijk door een mens geschreven is? Het is een vraag die sinds de lancering van ChatGPT in november 2022 niet alleen scholen, maar ook de academische wereld bezig houdt. Met ChatGPT kan je geen tijd een tekst schrijven zonder kritische blik niet van menselijk auteurswerk te onderscheiden is. Maar omdat het GPT-model getraind is op bestaande teksten, verhoogt dit het risico op plagiaat en auteursrechtschendingen.

ChatGPT haalt onderscheiding aan Amerikaanse universiteit: is dat problematisch?

Er bestaan tools die kunnen detecteren of een tekst geschreven is door AI, maar deze tonen zich niet altijd even betrouwbaar. Deze zoeken vooral naar emotieve indicatoren om het onderscheid te maken. Dit brengt problemen met zich mee in een academische context, waar papers in een formele en drogere schrijfstijl worden geschreven, die dus ook eenvoudiger na te bootsen is met AI. Onderzoekers van de Amerikaanse universiteit van Kansas claimen een belangrijke doorbraak te hebben gerealiseerd.

Mens vs AI

De wetenschappers bouwden een algoritme dat werd gevoed met meer dan 90 papers geschreven door menselijke wetenschappers, en nog eens 188 papers die ze door ChatGPT lieten schrijven. De papers gingen over diverse wetenschappelijke domeinen om te vermijden dat de kennis van ChatGPT over een specifiek de resultaten zo min mogelijk zou beïnvloeden.

Op basis van de volledige tekst wist het algoritme met honderd procent accuraatheid de teksten geschreven door ChatGPT eruit te halen. De onderzoekers lieten het algoritme ook naar losse paragrafen kijken. Hier maakte het algoritme al eens een fout, maar 92 procent is ook nog een meer dan degelijk resultaat. Dit zijn enkele indicatoren die kunnen weggeven wie of wat de auteur van een tekst is:

Mensen schrijven over het algemeen langere zinnen en paragrafen.
Mensen variëren meer in woordenschat en zinslengte.
Mensen gebruiken meer punctuatie en verschillende leestekens, met uitzondering van citaties.
Mensen zijn preciezer in het refereren naar figuren of het werk van andere wetenschappers.
AI maakt zelden tot nooit gebruik van dubbelzinnige taal.

Korreltje zout

Bij dergelijke onderzoeken neem je best toch altijd het zoutvat bij de hand. De onderzoekers geven zelf aan dat hun tool slechts op een beperkte dataset getraind is. Zo houdt het onderzoek nog geen rekening met teksten waar AI aan begonnen is, maar nadien door mensen zijn aangepast.

Daarnaast zullen AI-modellen alleen maar beter worden in het schrijven van ‘menselijke’ teksten. Er zal in andere woorden nog een lang leerproces aan de pas komen vooraleer de tool door universiteiten en academische tijdschriften kan ingezet worden om sjoemelaars erbij te lappen.

terug naar home

featured

Zijn kmo’s klaar voor de AI Act?

.business
11.04.'24
10 min

recent in data

SAS wil toegangsdrempel AI verlagen met ‘voorverpakte’ modellen

.data
18.04.'24
3 min

SAS drukt vol de AI-knop in tijdens Innovate: Viya Copilot, Data Maker en ‘voedingslabels’

.data
17.04.'24
4 min

MLCommons publiceert benchmarks om AI-veiligheid te meten

.data
17.04.'24
3 min

meer data

poll

"*" indicates required fields

ronde tafel

Artificiële intelligentie

.data
03.04.'24
5 min

Datacenter en infrastructuur

.infrastructuur
12.03.'24
5 min

meer ronde tafels

events

Hannover Messe 2024

22 - 26/04/2024
Hannover, Duitsland

Sophos Cybersecurity on Tour – Belgium

14/05/2024
Kattebroek, Brussel

Nutanix .NEXT

21 - 23/05/2024
Barcelona, Spanje

meer events

vacatures

meer vacatures

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Is een tekst geschreven door een mens of AI? Dit algoritme zegt het met (bijna) honderd procent zekerheid

ChatGPT haalt onderscheiding aan Amerikaanse universiteit: is dat problematisch?

Mens vs AI

Korreltje zout

gerelateerd nieuws

nieuwsbrief