De oefening in vernedering die mensen karaoke noemen, zou met de ontwikkeling van een karaoke-producerende AI een rare toekomst kunnen krijgen.

Onderzoekers van de Universiteit van Toronto hebben onlangs een AI getraind die niet alleen muziek kan voortbrengen, maar ook teksten en zelfs dansjes.

In hun paper “Song from Pi: A Musically Plausible Network for Pop Music Generation” beschrijven Hang Chu, Raquel Urtasun en Sanja Fidler hoe ze een neuraal netwerk hebben getraind om muziek te produceren, “waarbij de melodie, maar ook de akkoorden en andere instrumenten samen iets vormen wat meestal een lied wordt genoemd.”

Het is niet de eerste keer dat een neuraal netwerk getraind wordt om dit te doen, maar volgens de onderzoekers wel de eerste keer dat zowel de melodie als de akkoorden en drums gecomponeerd worden door een AI. Ze trainden hiervoor de AI met pakweg 100 uur aan midimuziek en het resultaat klinkt ongeveer zo:

Meh. Maar daar hielden deze onstuimige onderzoekers niet op. In het paper beschrijven ze nog twee nieuwe toepassingen van hun model: “neuraal dansen en karaoke naast het neuraal zingen van muziek.” En dit is waar het echt vreemd wordt.

De onderzoekers postten op de site van de Universiteit twee voorbeelden met video van beide nieuwe toepassingen. De eerste is dus een nummer dat gegenereerd werd door het neurale netwerk, gecombineerd met een songtekst die ook gegeneerd werd, en ook nog eens de bijbehorende danspasjes. Dames en heren, aanschouw de toekomst van AI-gegenereerde karaoke:

Het is alsof je een buitenaards wezen grofweg hebt verteld wat karaoke is en ‘m vervolgens de volledige vrijheid hebt gegeven om te doen wat ‘ie wil. Ik heb de vrijheid genomen om de songtekst te transcriberen, die is namelijk fantastisch:

“I’m half of you

I’m ready to see.

< unk >< unk > to get myself.

It’s too late to live back.

I’m going to lose.

I’m nog giving up.

I’m gone.

I’m not afraid.

I’m going on.

And I’m not on your < unk >.

You can see you to see.

You can’t see it right.

You fall up with you.

Let you know that you’re right.

You ain’t no but you’ll make you change.

Don’t be a shy boy.

And you’re not the same.

Oh if you’re up.

You’re on and you’re hot.

You’re hot then you’re cold.

You’re yes then you’re no.

You’re yes then you’re no.

You’re yes then you’re no.

You’re in then you’re out.

You’re down then you’re down.

You’re all then.

In your < unk > you.

Got me hear the number.

Do you want it.

Let me get the evening.”

Als dit geen robotliefde is dan weet ik het ook niet meer. De AI is duidelijk onzeker over de wederzijdigheid van zijn liefde voor het subject. Zijn (of haar, of whatever) liefdesdoelwit is duidelijk all over the place; heet en koud, ja en nee, down en down en vooral niet (of wel?) < unk >. Wat is de < unk >?! Is dit een soort next-level robotemotie die wij nooit zullen kennen? Ingebouwde censuur voor een robotobsceniteit? Wie weet.

Naast deze mogelijke vooruitblik naar popmuziek en karaoke in 2045 hebben de onderzoekers dus nog een toepassing van hun neurale netwerk gepresenteerd: het componeren van een liedje bij een tekst (die weer gegenereerd is door een ander neuraal netwerk). Zie hier het resultaat:

Zo raar en prachtig!

In de toekomst willen de onderzoekers zich meer gaan verdiepen in muziektheorie om hun modellen te verbeteren, “aangezien we in dit paper nog maar aan het topje van ijsberg zitten.”