Hits beginnen voorspelbaar te worden. Hipsters beweren het al tijden, maar nu is het bewezen. De formule die een pop of dance nummer een hit maakt is zo voorspelbaar geworden, dat zelfs een computeralgoritme bijna precies kan voorspellen welke nummers zullen pieken in de hitlijsten.
De wetenschap die hitjes kan voorspellen staat nog in haar kinderschoenen en tot nu toe klopten de voorspellingen niet altijd. Ik sprak met een team datawetenschappers aan de universiteit van Antwerpen en zij hebben een van de beste voorspellingstools ontworpen die ik heb gezien. In hun onderzoek focusten zij zich op dance genre (omdat nummers vaak de meeste gelijkenissen hebben) en lukte het hen te voorspellen of een nummers een hit zou worden in de top 10.
Videos by VICE
Hun onderzoek richtte zich in eerste instantie op dance hits van 1985 tot 2014, maar ik vroeg een van de onderzoeksauteurs, Dorien Herremans, de dance hitlijst van dit jaar door de voorspellingstool te halen. Het algoritme voorspelde dat de nummers in de top 10 van dit jaar een kans van 65% of hoger had om een hit te worden. Zes van de tien hits had zelfs een kans hoger dan 70%. Niet gek.
Hitlijst 2015 Dance/electro
- “Lean On” by Major Lazer & DJ Snake Featuring M0 — 82%
- “Where Are U Now” by Skrillex & Diplo With Justin Bieber — 72%
- “Hey Mama” by David Guetta Featuring Nicki Minaj, Bebe Rexha & Afrojack —72%
- “You Know You Like It” by DJ Snake & AlunaGeorge — 63%
- “Waves” by Mr. Probz — 68%
- “Outside” by Calvin Harris Featuring Ellie Goulding — 82%
- “Prayer In C” by Lillywood & Robin Schulz — 65%
- “Blame” by Calvin Harris Featuring John Newman — 88%
- “How Deep Is Your Love” by Calvin Harris & Disciples — 62%
- “I Want You To Know” by Zedd Featuring Selena Gomez — 89%
We testen ook het hitpotentieel van de dance en eletropopnummers van de top 10 singles van dit jaar in de UK Official Charts, en kregen dezelfde resultaten. Ze hadden allemaal tussen de 68 en 90% kans om een hit te worden volgens de tool.
Hitlijst van de “Official Charts Company 2015”
- “Happy” by Pharrell Williams — 83%
- “Rather Be” by Clean Bandit — 74%
- “All Of Me” by John Legend (geen dance-nummer)
- “Waves” by Mr Probz — 68%
- “Thinking Out Loud” by Ed Sheeran (geen dance-nummer)
- “Ghost” by Ella Henderson — 79%
- “Timber” by Pitbull ft. Kesha — 90%
- “Stay With Me” by Sam Smith (geen dance-nummer)
- “Let It Go” by Idina Menzel (geen dance-nummer)
- “All About That Bass” – Meghan Trainor — 87%
“De hitvoorspellingen zien er heel goed uit! Zelfs nog beter dan de die in ons eigen paper hadden gedaan,” zei Herremans, die nu werkt voor het Centrum voor Digitale Muziek aan de Queen Mary Universiteit in Londen.
Het team publiceerde vorig jaar een paper waarin ze uitleggen hoe het model werkt. Om de bouwstenen van een hit te kunnen meten, moet je eerst een nummer in verschillende audiodelen opbreken. Deze data hebben zij gehaald uit The Echo Nest, een software die audiodata analyseert en categoriseert om zoekfuncties op bijvoorbeeld Spotify te ondersteunen.
Zij keken naar in totaal 139 verschillende muziekaspecten om de nummers te analyseren. Dit waren bijvoorbeeld basiseigenschappen zoals lengte, tempo (gemeten in beats per minute of bpm), time signature, toonhoogte en geluidssterkte. Ook werden vage eigenschappen zoals beat, energie en dansbaarheid gemeten. Ze onderzochten zelfs de klankkleur en het algehele gevoel van een nummer.
De klankkleur wordt gemeten aan de hand van 13 verschillende eigenschappen van de basiscomponenten van het audiospectrum, en hoe deze veranderen gedurende het nummer. Zo wordt bijvoorbeeld de “helderheid” bepaalt aan de hand van het aantal hoge en lage frequenties in geluid. “Het lijkt erop dat helderheid een grote invloed heeft op hoe de tijd tussen beats verloopt in een nummer,” zegt Herremans.
De theorie is natuurlijk dat populaire nummers een aantal eigenschappen gemeen hebben wat hen aantrekkelijk maakt voor het grote publiek, en dat je nieuwe nummers op basis daarvan kan testen om het commerciële potentieel te voorspellen. (Het is wel belangrijk op te merken dat deze voorspellingsalgoritmes vaak belangrijke factoren buiten beschouwing laten, zoals het marketing budget, het gevoel van de consument, de clip of de naamsbekendheid van de artiest.)
Het team testte 3.500 nummers die voorkwamen in de top 10 tussen 1985 en 2014, en toen zij de formule van deze hits een beetje aanpasten bleek dat zij ook de hitkans meer recentere nummers konden voorspellen.
Het onderzoek gaf ook een aantal interessante historische inzichten. Dance hits zijn luider geworden sinds vroeger, maar de dansbaarheid (een beschermde formule van The Echo Nest) is juist afgenomen. Kennelijk is het tegenwoordig minder belangrijk om goed te kunnend dansen op een nummer.
Er is natuurlijk erg veel interesse in dit gebied van muziekwetenschap. Een handjevol geweldige hits zorgt meestal nog steeds voor het grootste gedeelte van de winst bij plantenmaatschappijen. Labels geven dan ook miljarden uit in de hoop nieuwe talenten te vinden. Als je een wetenschappelijke maatstaf kan geven om aan te tonen of een nummer een succes wordt, hoe niet-romantisch dat ook is, dan kun je daar de rest van je leven lang op teren.
Het idee dat een succesvol nummer herleid kan worden naar een kleine wiskundige vergelijking heeft ook flink wat tegengeluiden gekregen, en terecht. Er schuilen veel wiskundige formules achter het maken van muziek, maar uiteindelijk is zelfs popmuziek een kunstvorm. En een aantal pogingen om gedigitaliseerde hitberekeningen te maken zijn gefaald. Een ondernemer die voor het eerst met de term “Hit Song Science” kwam, Mike McCready, kreeg weerstand van onderzoekers die claimden dat er gewoon niet genoeg wetenschap achter zijn ‘wetenschap’ zat.
Het bedrijf uPlaya probeerde deze Hit Song Science te commercialiseren en is hierin geflopt. “Een ander onderzoek probeerde popmuziekmodellen te bouwen, zonder resultaat,” zei Herremans. “Dance hitlijsten bevatten meestal nummers die veel op elkaar lijken, maar pop hitlijsten kunnen zowel rock als dance nummers bevatten. Door voor een specifieke stijl te kiezen, kunnen we de eigenschappen beter onderscheiden en zo een betere voorspelling krijgen.”
De Hit Potential Equation, een aantal jaren geleden ontwikkeld door onderzoekers aan de universiteit van Bristol, maakten ook gebruik van de wetenschap van The Echo Nest om hits te analyseren. De formule maakte gebruik van 23 audio-eigenschappen om hits van alle genres van de afgelopen 50 jaar te analyseren. Er bleken hits mee voorspeld te kunnen worden met nauwkeurigheid 60% – het is beter dan een muntje opgooien, maar het scheelt niet veel.
Als je zelf wil spelen met de voorspellingen, kun je hier mp3-bestanden uploaden in de voorspellingstool voor dancehits. Het team werkt nu nog aan een follow-up onderzoek dat ook naar gedrag op social media kijkt van invloedrijke mensen die naar hits luisteren nog voordat ze in de hitlijsten staan. “De eerste test kijken uit te wijzen dat dit de voorspellingen zelfs nog preciezer kan maken,” zegt Herremans.
Het team kijkt ook naar mogelijkheden om de tool uit te breiden, zodat je deze kan gebruiken terwijl je een nummer componeert, om zo nog meer hits te maken.
Het is duidelijk dat dit onderzoeksveld niet snel zal verdwijnen, zeker nu de kunstmatige intelligentie op het gebied van muziek verbetert. Het is ook geen geheim dat steeds meer hits van tegenwoordig worden geschreven, getest en herschreven aan de hand van deze formules, zodat het publiek precies krijgt wat het wilt volgens de data. Het zal binnenkort dan ook aan de orde van de dag zijn dat nummers als op de lopende band in een fabriek eerst langs algoritmes en moeilijke berekeningen moeten gaan voordat zij bij de consument uitkomen.