Las máquinas también escuchan música y así es como la perciben

Estamos cerca de averiguarlo.

10.5.17

Este artículo fue publicado originalmente en Motherboard , nuestra plataforma dedicada al mundo de la tecnología. La nueva tendencia en los algoritmos de autoaprendizaje -una tecnología que está incrustada en nuestros teléfonos, en nuestras redes sociales y más- está tratando de averiguar cómo funciona la inteligencia artificial.

El asunto es que los algoritmos conocidos como redes neuronales son esencialmente cajas negras. Hemos desarrollado los conceptos de alto nivel que los rige, pero conocer las decisiones que toman por su cuenta es muy difícil de saber debido a su complejidad interna. Estos sistemas son impresionantes, sin embargo, no son perfectos, y para hacer que funcionen mejor necesitamos entender cómo se rigen.

El último intento de entender a una caja negra computacional fue publicado esta semana en la página de ArXiv por investigadores de la Universidad Queen Mary de Londres en el Reino Unido. Echaron un vistazo en la red neuronal que reconocen los géneros musicales. Los resultados fueron muy interesantes (un poco inconclusos). Ahora sabemos que las máquinas prestan atención a las percusiones antes de escuchar pianos y voces.

"Siempre es bueno saber qué está pasando ahí, para saber si es útil ahora o en el futuro"

Este proceso ayuda a los investigadores a entender "cómo debemos diseñar el sistema para una determinada tarea", el investigador principal y estudiante de doctorado Keunwoo Choi me escribió en un correo electrónico: "Y por supuesto, siempre es bueno saber lo que está pasando ahí, para saber si es útil ahora o en el futuro", añadió.

Investigar cómo funciona el autoaprendizaje ha sido una tendencia desde al menos el 2009, cuando un equipo de investigadores propuso un método para generar imágenes diseñadas específicamente para activar las "neuronas" individuales. La idea es trabajar al revés con imágenes que las redes encuentran atractivas. En 2014, los investigadores diseñaron una manera de visualizar realmente las capas de la red, para averiguar qué las activa.

Hasta la fecha, los intentos más exitosos han involucrado el desgarramiento de las redes neuronales, capa por capa de "neuronas" digitales, para averiguar cómo usan su corriente de información para su propio autoaprendizaje. Para las redes neuronales que procesan imágenes, la idea ha sido alimentar nuevas imágenes dentro de AI, para después visualizar lo que cada capa detecta en la imagen, desde contornos vagos en la capa más baja hasta las imágenes totalmente formadas en la capa superior.

Respecto a la música:

Acerca de la capa inferior, los autores escriben que la red parece extraer el elemento más extremo de la música: la percusión. La segunda capa prestó atención a los componentes armónicos básicos de la música, particularmente las notas de bajo. La tercera capa hizo distinciones entre diferentes instrumentos, y fue altamente activado por voz y piano, pero no por los hi-hats, por ejemplo.

Piénsalo. Eso es muy bonito. Ahora sabemos que cuando las máquinas están escuchando música, lo primero que "escuchan" son las percusiones, luego algunas armonías, y después prestan atención a los instrumentos que están siendo utilizados.
Pero todavía hay un largo camino por recorrer en este sentido.

"A medida de que las capas eran más profundas, era más difícil para mí entender", me escribió Choi. "Es como… es relativamente fácil analizar lo que está pasando en nuestros tímpanos y canales auditivos en comparación con el análisis de la cóclea, que es más difícil de analizar que el cerebro".

El trabajo de Choi y sus colegas no serán publicados en ninguna revista: falló el proceso de revisión por pares en la conferencia Machine Learning for Signal Processing de 2016 porque los analistas consideraron que no era un gran descubrimiento como para ser publicado. Las nota del científico, que Choi publicó on-line, señalan que "esto haría un blog fantástico, pero no veo la novedad, el análisis o las conclusiones que justifiquen una publicación científica".

..Y aquí está el final del post de este blog.

Tagged:Músicaalgoritmosautoaprendizajeredes neuranoalesArXivFeaturesThump

FYI.

This story is over 5 years old.

Las máquinas también escuchan música y así es como la perciben

"Siempre es bueno saber qué está pasando ahí, para saber si es útil ahora o en el futuro"

Newsletter de VICE en español