FYI.

This story is over 5 years old.

Il Manifesto per una Musica Algoritmica Espressiva

Un nuovo progetto di ricerca quinquennale vuole capire come gli esseri umani percepiscono la musica.
Immagine: Goombung/Shutterstock

Gerhard Widmer si occupa di un ambito peculiarissimo della ricerca informatica. Il suo oggetto di studio è la computational perception, un campo relativamente sconosciuto che interseca psicologia, neuroscienze e machine learning. In generale, questa disciplina mette in dubbio le possibilità di avanzamento del computing in assenza di una conoscenza approfondita di come il cervello umano percepisce il mondo. Insomma, è inutile pretendere che i computer siano in grado di percepire, quando sappiamo ancora così poco sul nostro modo di percepire.

Pubblicità

Nell'ultimo ACM Transactions on Intelligent Systems and Technology, Widmer ha pubblicato un manifesto rivolto alla Music Information Research (MIR), un'area di ricerca che comprende di tutto, dai sistemi che suggeriscono nuova musica in base alle passate preferenze, al riconoscimento musicale automatico, dai sistemi di trascrizione anch'essi automatizzati fino alla musica originale generata attraverso algoritmi.

Widmer trova che la MIR abbia delle lacune fondamentali e che quindi debba ridefinire gli scopi della sua ricerca, sostenendo che il suo manifesto offre una via per tentare un "salto di qualità nei sistemi musicali intelligenti." Niente male.

Il manifesto inizia con un elenco di problemi—roba che i computer non riescono a fare o non riescono a fare abbastanza bene:

(1) Distinguere tra canzoni che potrei trovare noiose o interessanti.

(2) Proporre (tra gli altri brani) la Sonata per pianoforte op.81a (Les Adieux) di Beethoven quando si richiede un brano di musica classica che contenga una sorpresa iniziale.

(3) Classificare le versioni di "Garota de Ipanema" registrate da Tom Jobim o Joao Gilberto come più rilassate e "scorrevoli" rispetto a quella interpretata da Frank Sinatra.

(4) Suonare insieme a musicisti umani (per esempio, accompagnare un solista in un concerto per pianoforte) in modo musicalmente coerente, riconoscendo quanto viene eseguito, anticipando e adeguandosi alla modalità espressiva dei musicisti (drammatica, lirica, sobria, ecc.).

Pubblicità

Ma come possiamo ottenere di fatto queste capacità? Un punto chiave—tra gli altri contenuti nel manifesto—è che abbiamo bisogno di computer in grado di fare molto di più rispetto a elaborare semplicemente la musica sottoforma di dati e modelli. Una cosa è analizzare la struttura di un brano musicale, un'altra è analizzare un brano in termini di come la musica viene percepita dagli esseri umani. La musica è un processo di percezione. "Dobbiamo ricordarci sempre che l'ultimo posto in cui viene elaborata la musica è la mente umana," scrive Widmer.

Il problema nel comprendere la percezione musicale umana dal punto di vista informatico è che semplicemente i modelli per descrivere la percezione di cui disponiamo al momento non sono sono sufficientemente "informatici." Sono imprecisi, ambigui e spesso pieni di contraddizioni, sottolinea Widmer, forse esagerando un po'.

Il manifesto mette in chiaro anche come la percezione musicale e la facoltà di apprezzare la musica siano entrambe capacità apprese. Non siamo nati con queste capacità. Quindi, in virtù di questa loro natura, possono essere affrontate benissimo dall'apprendimento automatizzato. "È giunto il momento che la comunità della MIR si imbarchi in uno sforzo massiccio nel tentativo di apprendere le funzioni/rappresentazioni di apprendimento—in maniera molto simile a quanto sta avvenendo attualmente nell'analisi delle immagini, uno sforzo che inizia a produrre dei risultati spettacolari," scrive Widmer. "Date le esigenze di calcolo e di raccolta dei dati relativi, la comunità della MIR deve unire le proprie forze e mettere in comune le proprie risorse e modelli già acquisiti (nel caso in cui i dati non possano essere condivisi)—anzi, ha già iniziato a farlo."

Il che ci conduce al punto principale di Widmer: una nuova ricerca quinquennale finanziata dall'UE denominata "Con Espressione." Il suo obiettivo è la caratterizzazione e il riconoscimento degli aspetti espressivi della musica, in particolare quelli riguardanti le performance musicali. Dall'estrarre dati attraverso algoritmi partendo da registrazioni audio o da performance live, fino allo sviluppo di nuovi modelli per descrivere la percezione musicale e alla generazione di musica con una sua espressività.

Una parte fondamentale del progetto è un "gioco" online in cui gli utenti sono invitati ad ascoltare degli estratti di cinque sonate di Mozart interpretate da diversi pianisti per fornire come output degli aggettivi che descrivano al meglio il "carattere" delle performance. Da qualche parte bisognerà pure iniziare.