FYI.

This story is over 5 years old.

Tech

Prima idee: Het internet fact-checken met een algoritme

Onderzoekers hebben een methode ontwikkeld om automatisch bullshit te scheiden van echte informatie.

​ Ongeacht wat de 'oude garde' van de gedrukte journalistiek misschien graag klagend uitbrengt, is het fact checken niet volledig verloren gegaan in het stampende tempo van de internetjournalistiek. Sterker nog, de onthutsende overdaad aan bullshit op het internet heeft redacteurs en schrijvers misschien wel gedwongen nog nauwkeuriger te zijn.

Dus ja, er is natuurlijk een hele hoop onzin, maar om te klagen over het gebrek aan factchecking gaat een beetje voorbij aan het feit dat de verkopers van lulkoek op het internet vaak prima op de hoogte zijn van het feit dat wat ze schrijven bullshit is. En ze weten ook dat hun publiek, zich vastgrijpt aan de bullshit omdat het 't soort bullshit is dat past bij hun wereldbeeld.

Advertentie

Snopes doet godzijdank nuttig werk door lulverhalen onderuit te halen, maar dat is maar een enkele kleine lichtbron in een diepe, duistere zee van dampende schijtverhalen. Hoe mooi zou het zijn als het internet zichzelf zou kunnen bullshit-checken? Misschien met een klein schijt-icoontje in een hoekje van Chrome waar je op kan klikken om een verhaal als bullshit aan te merken. Het zou kunnen, volgens een recente publicatie van een team van computerwetenschappers van Indiana University in de VS en het Instituto Gulbenkian de Ciencia in Portugal.

Het paper hanteert een techniek uit de netwerktheorie als automatische bullshitdetector. Als eerst wordt een dubieuze uitspraak opgebroken in drie delen: een onderwerp, een gezegde, en een lijdend voorwerp, aldus: 1. "Socrates," 2. "is een" 3. "persoon."

Daarna worden het onderwerp en lijdend voorwerp van die uitspraak ("Socrates," "persoon") als punten (nodes) in een netwerk gezet. Nodes in een netwerk zijn onderling verbonden door, in dit geval, de gezegden van de opgenomen uitspraken ("is een"). Zo kan je een grafiek van kennis maken, een verzameling van dingen (onderwerpen en lijdend voorwerpen) die verbonden zijn door verschillende soorten verhoudingen tot elkaar (de gezegden; dat wat het lijdend voorwerp zegt over het onderwerp).

Een dergelijke grafiek zou er zo uit kunnen zien:

De dingen en hoe zij zich tot elkaar verhouden. Als je een dergelijk netwerk zou uittekenen van bijvoorbeeld Wikipedia-pagina's, zou je een werkelijk gigantische grafiek krijgen. En dat is precies wat de onderzoekers hebben gedaan: een gigantische kennisgrafiek van Wikipedia uitwerken die als naslagwerk gebruikt kan worden voor hun fact-check systeem.

Advertentie

Het idee is om een te checken statement te ontleden, het onderwerp en lijdend voorwerp eruit te halen en het vervolgens te lokaliseren in de Wiki-kennisgrafiek. Als ze door één enkele lijn verbonden worden, dan is 't prima. Stickertje erop, niks meer aan doen. In andere gevallen wordt de nauwkeurigheid van het statement bepaald aan de hand van de afstand tussen de twee nodes in de grafiek. "We verwachten dat een statement waar is als het bestaat als een directe link of als er een korte route van onderwerp naar lijdend voorwerp leidt," legt het paper uit. "Als de statement daarentegen onwaar is, zie je waarschijnlijk geen korte verbinding tussen de delen."

En het werkt. Soms, althans. Je kan hieronder de resultaten grafisch weergegeven zien, waarbij de diagonaallijn een kloppende statement vertegenwoordigt en de afwijkingen experimentele resultaten zijn - oftewel hoe dicht het systeem bij een correcte automatische voorspelling van een kloppende statement komt.

Wie weet brengt dit onderzoek ons een klein stapje dichter bij een internet met een fractie minder bullshit - en misschien zelfs een Chrome-extensie die het automatisch voor ons filtert. Een mens kan dromen.