Se un cantante o gruppo hanno fama di essere ripetitivi, in genere, è perché scrivono canzoni che si somigliano tra loro: gli stessi quattro accordi, gli stessi quattro concetti, le stesse tre parole, sole cuore amore. Questa ripetitività, la immaginiamo figlia di un’immaginazione povera o delle pressioni dei discografici. Ma esiste anche una forma di ripetitività più ossessiva, quindi più interessante, ed è quella interna al singolo testo. Pensate a English Summer Rain dei Placebo. Ecco: Colin Morris, data journalist di The Pudding, ha portato l’ossessività — e la scienza, certo — un passo avanti, decidendo di misurare e comparare la ripetitività dei testi nelle canzoni pop, in un arco di sessant’anni.

La misura più intuitiva della ripetitività sarebbe probabilmente il rapporto tra l’ampiezza del vocabolario e la lunghezza del testo; per capirci, numero di parole diverse utilizzate / totale delle parole utilizzate. Ma questo non è un metro affidabile: con venti parole è possibile scrivere un testo meno ripetitivo che con quaranta, perché la percezione umana della ripetitività dipende dalla sintassi, oltre che dal lessico. Morris ha trovato un metodo più efficace, cioè un metodo che produce risultati più vicini a quella che sentiamo come ripetitività, facendo processare i testi a un algoritmo di compressione.

Videos by VICE

L’algoritmo Lempel-Ziv è lo stesso che riduce le dimensioni dei file gif, png, e degli archivi zip o rar: lo fa riconoscendo le sequenze che si ripetono, appunto, e sostituendole con dei segnaposto più leggeri che dicono solo “il pezzo x si ripete in questo punto”. Come scrivere (x3) in fondo a un verso, o “rit.” al posto del ritornello. Nei testi delle canzoni, l’algoritmo usato da Morris considera solo sequenze “significative”, tralasciando parole di piccole dimensioni come pronomi o preposizioni, che (soprattutto in inglese) possono comparire molto spesso senza essere veri indici di ripetitività.

Decisa l’equivalenza ripetitività = comprimibilità, Morris ha messo insieme un dataset di quindicimila canzoni, entrate nella Top 100 di Billboard tra il 1958 e il 2017. Ha compresso i testi, ha analizzato i risultati in prospettiva diacronica e sincronica. Innanzitutto, ha individuato le canzoni più ripetitive di ciascun decennio, e le più ripetitive dell’intero periodo considerato: tra queste ultime, senza troppa sorpresa, troviamo Around The World dei Daft Punk (comprimibile al 98%), The Rockafeller Skank di Fatboy Slim (95%), Barbra Streisand di Duck Sauce (89%), Funkytown dei Lipps, Inc. (85%), That’s The Way (I like it) di KC & The Sunshine Band (82%), e ben due versioni della Macarena (82%).

Immagine: screenshot dell’autore

Ma la cosa davvero interessante è il trend: i testi delle canzoni pop stanno diventando, in media, sempre più ripetitivi, ed è già una notizia. L’anno con le canzoni più ripetitive, finora, è stato il 2014: un testo medio di quell’anno, compresso, risulta il 22% più corto di un testo medio compresso del 1960. E c’è di meglio: le canzoni di maggior successo, cioè quelle in Top 10, sono ogni anno più ripetitive della media.

Le correlazioni spurie sono sempre dietro l’angolo, ma se siete autori di testi pop e volete fare il botto, chissà, forse vale la pena di abbandonare ogni altro criterio — il sentimento, la ricercatezza, la comunicatività — e concentrarvi sullo scrivere testi che si comprimano nel modo più efficiente possibile. Se invece siete in grado di usare l’algoritmo Lempel-Ziv come ha fatto Morris, o magari di svilupparne uno vostro, potreste fare consulenza alle etichette discografiche, e valutare le canzoni che vogliono produrre senza sapere nulla di musica — o meglio, senza neppure ascoltarle.

Immagine: screenshot dell’autore

Per i più curiosi, c’è anche un grafico di come si posizionano i singoli pezzi di ciascun artista, in termini di comprimibilità, rispetto alla distribuzione dell’intero dataset. Nel pezzo di The Pudding c’è infatti uno sguardo piuttosto accurato sugli artisti/gruppi principali (quelli che hanno almeno 15 canzoni nella Top 100). Scopriamo che Rihanna è una specie di regina della ripetitività, con visibile distacco dagli altri, mentre a fondo classifica, diciamo così, ci sono Elvis Presley e Frank Sinatra.