Por qué las redes neuronales de Google se ven como si estuvieras en ácido
Image: Google

FYI.

This story is over 5 years old.

Por qué las redes neuronales de Google se ven como si estuvieras en ácido

De viaje con una red neuronal
24.7.15

Hace poco apareció una misteriosa foto en Reddit donde se veía a un mutante monstruoso: una iridiscente criatura de muchas cabezas cubierta de animales derritiendose. Los verdaderos origines de la imagen aparecieron a través de un post hecho por el equipo de investigación de Google. Resultó que esta imagen de otro mundo era, de hecho, inhumana. Era producto de una red neuronal artificial (un cerebro computacional) creado para reconocer imágenes. Y parece que este cerebro estuviera bajo la influencia de las drogas.

Publicidad

Muchos comentaristas en Reddit y Hacker News se dieron cuenta inmediatamente que las imágenes producidas por la red neuronal eran sorprendentemente similares a las que uno ve mientras está bajo el efecto de substancias psicodélicas como los hongos alucinógenos y el LSD. "El nivel de semejanza a un viaje en psicotrópicos es simplemente fascinante" escribió el comentarista joeyspn en Hacker News. El usuario henryl estuvo de acuerdo: "Seré el primero en decir esto… se ve como un viaje en ácido u hongos".

Los medios de comunicación escribieron sobre lo mismo. Tech Times tituló: "Google lleva las redes neuronales artificiales a un impresionante viaje en ácido". Tech Gen Mag escribió: "El nuevo software de Google sueña con arte psicodélico". PBS dijo: "A la izquierda de sus propios dispositivos, los computadores crean arte surrealista".

¿Estas imágenes psicodélicas son coincidencia o hay un paralelo fundamental entre cómo la red neuronal de Google creó estas imágenes y lo que hacen nuestros cerebros cuando están bajo el efecto de los psicodélicos?

Las redes neuronales artificiales (ANN por sus siglas en inglés) son computadores diseñados para simular el cerebro humano. Han existido desde la década del 50, pero durante los últimos años han hecho grandes avances en el reconocimiento de imágenes. Estas redes están basadas en "neuronas" creadas por software, las que se comunican y alteran la fuerza de estas conexiones para así reflejar el resultado de sus cálculos, al igual que las neuronas verdaderas. Esta adaptabilidad es lo que hace que las ANN sean especiales, les da la habilidad de aprender.

Al extraer estas imágenes desde los niveles altos, el sistema reconocerá imágenes completas. Los perros se transformarán en perros mutantes voladores y las sierras en pagodas.

Al igual que los niños, las redes neuronales aprenden al recibir información del mundo que los rodea. Los datos son agregados directamente al sistema por las personas. Si una red neuronal diseñada para identificar imágenes ve 100 fotos de perros, por si misma comenzará a reconocer un perro. A la mayor cantidad de fotos de perros que ve, mejor las procesa. Si la red neuronal ve una foto de algo con forma de perro, una neurona especifica en la capa superior de la red se activará y la red dará un resultado: perro. Con estas herramientas, las ANNs se han tornado ideales para reconocer características y caras dentro de las imágenes, el tipo de tecnología de la que toma ventaja el nuevo servicio de fotografías de Google al crear automáticamente álbumes de fotos y películas.

Una red neurona convolucional, como la que Google utiliza para crear estas extrañas imágenes, consiste en capas de neuronas que envían mensajes por la cadena de comando, interpretando información con más abstracción a medida que se mueve hacia arriba, por lo que cada capa sólo se enfoca en una pequeña tarea. Ya que la red se enseña a si misma, lo que sucede en cada una de estas capas es un misterio. Google no sabe exactamente qué vías de información está tomando o incluso cómo la "división de trabajo" funciona en las distintas capas.

Publicidad

El experimento de Google estaba destinado a entender estas capas y ver qué es lo que pasa dentro. Los investigadores declinaron hablar con nosotros para este artículo, pero esto es lo que creemos que hace basado en antiguos experimentos similares: en vez de preguntarle a la red si debe identificar imágenes, las "dan vuelta" utilizando un algoritmo que comienza con ruido aleatorio y va aumentando los cambios en la imagen hasta encontrar una forma especial que cause que las neuronas se activen, esta forma puede ser una banana, una taza de medir o una pesa.

Al examinar estos resultados, los investigadores pueden saber cuán exacto es el conocimiento de la maquina. No siempre son exactos, por ejemplo en cada imagen que se produjo una "pesa" no sólo aparecía el metal, también el brazo musculoso que va unido a ella. Esto demostró ser información valiosa: el computador probablemente nunca ha visto una pesa sin que esté unida a un brazo.

Las imágenes más interesantes fueron producidas cuando los investigadores dejaron que la maquina interpretara paisajes, como un campo con un sólo árbol en primer plano; o el ruido visual de una borrosa pantalla de televisión. Los investigadores miraron qué neuronas eran activadas por el paisaje o el ruido y luego ponían la imagen resultante de vuelta en la red, repitiendo esto y ajustando la imagen hasta que la foto se transformara en una mejorada y magnificada representación de lo que el computador "ve". El árbol del paisaje se transforma en una jauría de perros flotantes, rodeada de torres y extrañas figuras con forma de rueda.

Publicidad

Al extraer las imágenes desde las capas bajas de la red, las que detectan cosas como lineas y color, la imagen resultante parece como si hubiese sido pintada con trazos curvos y gruesos, en el estilo de Van Gogh. Al extraer estas imágenes desde los niveles altos, el sistema reconocerá imágenes completas, como perros, una y otra vez. Los perros se transformarán en perros mutantes voladores y las sierras en pagodas.

Estas imágenes por supuesto eran raras, pero ¿Por qué se veían como si estuviéramos mirando bajo el efecto de las drogas psicodélicas? Para responder esto primero es necesario ver cómo es que tu cerebro reconoce las imágenes. Este proceso es muy similar a cómo una ANN reconoce imágenes. En los humanos la información visual viene desde el ojo y baja hasta el nervio óptico, en la base de la corteza visual. Ahí es cuando nuestro cerebro lleva a cabo unas tareas básicas: buscar bordes, determinar si las lineas son verticales u horizontales, buscar colores y tonos. Una vez que ha sido procesado, estos datos suben a unidades de procesamiento más y más sofisticadas, donde nuestro cerebro determina si lo que estamos viendo es una manzana o un automóvil.

La gran diferencia entre nuestra proceso visual y el de nuestras redes neuronales es la cantidad de retroalimentación que llega desde distintas áreas del cerebro, me dijo Melanie Mitchell, una profesora de ciencia computacional en la universidad estatal de Portland, quien ha escrito libros sobre redes neuronales.

Publicidad

La red neuronal de Google se "alimenta hacia adelante", posee sólo un sentido en el que viajan los datos: hacia arriba y a través de las capas. En contraste, nuestros cerebros siempre están comunicándose y en millones de direcciones al mismo tiempo. Incluso cuando estamos viendo bordes y lineas, nuestro cerebro superior nos dirá "eso puede que sea un quitasol", basado en nuestro conocimiento que los quitasoles por lo general están cerca de la playa y las olas. La información final que pasa a nuestra conciencia (lo que vemos) está compuesta de datos visuales y la interpretación que la parte superior de nuestro cerebro hace de esos datos. Esto funciona perfecto hasta que encontramos algo que engaña a nuestros cerebro, como una ilusión óptica.

Tomar drogas alucinógenas altera dramáticamente este fino proceso. "La forma normal en que las áreas del cerebro se conectan y comunican, se quiebra" dice Frederick Barret, un neurocientífico cognitivo que estudia los psicodélicos en el departamento de comportamiento farmacológico de John Hopkins. A medida que el cerebro intenta distintas conexiones, la corteza frontal y otras áreas de control del cerebro, las que regularmente trabajan con la información que viene desde el exterior, se hacen más débiles, dejando que otras partes del cerebro interpreten la información que recibimos a través de nuestros ojos. Abrumado con información, las capas más avanzadas del cerebro están obligadas a lograr que nuestro cerebro intente adivinar qué es la imagen.

Publicidad

Cualquiera que haya tenido un viaje sabe que hay cierto prototipo de visuales psicodélicas que son comunes en la mayoría de las experiencias, piensa en el trabajo de Alex Grey, o el popular diseño paisley de los años 70. Barrett dice que hay un explicación decente para esto: gira en torno a los receptores de serotonina 2A los que se piensa que son uno de los primeros receptores en los que hacen efecto las drogas alucinógenas. Tenemos un gran número de receptores de 2A en la corteza visual y ya que los receptores están en un lugar bajo dentro de la cadena de procesamientos, la información que nos entregan son más que nada lineas, formas y colores. Es tarea del resto del cerebro el interpretar esta información, pero cuando estamos en drogas nuestras áreas altas de funcionamiento no están al tope de su capacidad. Por lo tanto terminamos viendo imágenes caleidoscópicas y fractales sobre las superficies. Estas visiones vienen directamente desde la base del cerebro. De alguna forma es como mirar en la caja negra de nuestro cerebro y ver las piezas de puzzle que hacen que nuestra percepción funcione.

"Las imágenes de Google son algo que imaginas que verías con psicodélicos o durante las alucinaciones" dice Karl Friston, un profesor de neurociencia en el University College London, quien ayudó a inventar un importante protocolo de imaginación cerebral, "y eso es perfectamente sensato. Durante una experiencia psicodélica eres libre de explorar todo tipo de hipótesis internas de alto nivel y otras predicciones sobre qué causa esta información sensorial" agregó. "Este paralelo existe porque los objetivos del cerebro y los objetivos de los investigadores de Google son básicamente los mismos: reconocer cosas y después actuar de la forma más efectiva".

"Lo que Google está pensando que pasará con las redes neuronales se aproxima bastante a lo que sucede en el cerebro y lo que sabemos sobre el sistema visual" dice Barett, pero él cree que estamos muy lejos de crear una red neurona que modele exactamente al cerebro. "La complejidad del cerebro es tanta que no estoy seguro si se puede modelar con redes neuronales artificiales. Todavía no se si hemos llegado ahí o algún lugar cercano" dice.

"Usenlas con cuidado y úsenlas con respecto porque pueden lograr una transformación y tendrás una extraordinaria herramienta de investigación" escribió Alexander Shulgin, el "padrino del éxtasis", en su libro Pihkal. Él estaba hablando de drogas y la mente humana, posiblemente la más compleja y peligrosa herramienta que haya existido. Las personas, durante miles de años han dado vuelta sus cabezas con estas substancias, intentando tener una mejor mirada de lo que hemos aprendido y de lo que aun estamos aprendiendo. El cerebro artificial de Google nos recuerda que aun hay mucha investigación por hacer.