FYI.

This story is over 5 years old.

Tech

Volgens computers volgt elk boek één van de zes mogelijke plotlijnen

Een Engels professor doorzocht 50.000 boeken en distilleerde hier 6 (en soms 7) verschillende plots uit.

Fictie kent een beperkt aantal plots, we wisten tot voor kort alleen niet precies hoeveel. Carlos Gozzi, een 18e eeuwse Italiaanse toneelschrijver dacht dat er 36 dramatische situaties waren, maar sindsdien is het aantal alleen maar omlaag gegaan. In 2004 stond het aantal, afgaande op het boek The Seven Basic Plot Structures nog op zeven. Met hulp van geavanceerde wiskunde en computers hebben onderzoekers bewijs gevonden dat de schrijver van het bovenstaande boek er waarschijnlijk één plot naast zat.

Advertentie

"Ik deed een paar metingen en cluster analyses om te zien of ik archetypische plotstructuren kon herkennen," vertelde Matthew Jockers me over de telefoon. "Samengevat: ik heb ze inderdaad gevonden, en het zijn er zes of soms zeven."

Jockers legde me uit dat de bevindingen een beetje ambigu zijn. De data-collectie vereiste een sorteertechniek die "een willekeurig boek kiest uit een collectie van 50.000 boeken doorzocht."

"90 procent van de tijd koos de computer voor zes plotvormen, en tien procent van de tijd was er sprake van een zevende."

Matthew Jockers is hoogleraar Engels aan de University of Nebraska, waar hij werkt in het veld van de digitale geesteswetenschappen. Hier worden databases en softwaretools gebruikt om meer boeken te analyseren dan een persoon ooit in zijn leven kan lezen.

Er zijn twee manieren om te bekijken wat een "plot" is. Volgens de Russische structuralist Vladamir Propp is een plot de manier waarop (en de volgorde waarin) gebeurtenissen zich ontvouwen in een verhaalwereld. Daarnaast heb je de manier waarop (en volgorde waarin) een auteur de gebeurtenissen onthult aan de lezer.

Jockers focust zich hoofdzakelijk op de laatste definitie. Hij maakte een model dat op een algoritmische manier analyseert hoe het sentiment verandert in de loop van een verhaal, wat resulteert in een soort plot-grafiek. Hij onthulde nog niet wat deze plots precies inhouden (man versus dataset misschien?). Hij onthulde wel de middelen om zelf met het model aan de slag te gaan. Deze week kwamen de tools van Jocker online op GitHub, waarmee je nu zelf plots in kaart kan gaan brengen.

Advertentie

Toen Jockers me vertelde over het project waarin de vormen van verschillende plots in kaart gebracht werden, deed het me denken aan een video van Kurt Vonnegut, waarin de auteur het plot van verschillende verhalen in een grafiek tekent. Jockers vertelde dat dit filmpje voor hem niet alleen een geweldige illustratie is van het project, maar ook een sterke inspiratie is geweest om het überhaupt op te pakken.

Voordat hij op het krijtbord begint te schrijven merkt hij op dat er "geen reden is waarom simpele verhaallijnen niet door computers geanalyseerd kunnen worden." Jockers nam deze observatie als aanleiding voor zijn onderzoek.

Met hulp van natuurkundigen kwam Jockers erachter hoe je de emotionele teneur in een boek analyseert. Jockers zegt in zijn blog dat hij dit deed door een "positief en negatief vocabulairesysteem" te gebruiken dat ontwikkeld werd door Bing Liu van de University of Illinois in Chicago. Daarnaast gebruikte Jockers een machine die passages in een boek als negatief of positief kon interpreteren.

Als dit je interesse echt heeft opgewekt kan je het proces van Jockers stap-voor-stap volgen op z'n blog. In zijn boek Macroanalysis, kijkt Jockers naar Ierse literatuur ook neemt hij voorbeelden die bestaan uit populaire Engelse titels als Oscar Wilde: Picture of Dorian Gray, of James Joyces: Portrait of the Artist as a Young Man.

De meeste boeken die het aantal verschillende plots meten lijken gericht op schrijvers, of mensen met aspiraties om schrijver te worden. Het werk van Jockers heeft echter vooral implicaties voor lezers, bibliothekarissen, literatuur snobs en voor iedereen die deze snobs op hun plek wilt zetten.

Gedurende het onderzoek merkte Jockers op dat sommige plots, die volgens de formules onder het thema romantiek vallen, niet simpelweg onder het 'jongen-ontmoet-meisje-scenario' geschaard kunnen worden.

"Romantiek heeft de neiging om veelal in twee van de zes plot-vormen te kunnen worden ingedeeld. Het bleek dat niet alle romantische verhalen in één categorie vielen. Het was veel eerlijker verdeeld over de zes vormen."

Denk daar maar eens over na, romantiek-sceptici! Ook voor degene die ontkent dat computers het leven niet gemakkelijker kunnen maken is dit een doorbraak. Dankzij computers zijn we nu nog dichter bij de kern gekomen van wat een plot daadwerkelijk inhoudt.