Game of Thrones

Una red neuronal escribió el siguiente libro de 'Game of Thrones'

Por fin tenemos 'Winds of Winter'... más o menos.

por Staff de VICE; traducido por Álvaro García
30 Agosto 2017, 4:04pm

Imagen: HBO/Shutterstock. Composición: Jason Koebler

Este texto se publicó originalmente en Motherboard, nuestra plataforma dedicada al mundo de la ciencia y la tecnología.

Minutos después del épico final de la séptima temporada de Game of Thrones, los fans de la serie ya estaban consternados al escuchar que la temporada final —de seis episodios— no se transmitirá sino hasta la primavera de 2019.

Para los lectores de la saga de novelas A Song of Ice and Fire —en la que se basa el programa de televisión—, la decepción por el tiempo estimado de espera es ridícula. El quinto libro de la saga conformada por siete novelas, A Dance with Dragons, fue publicado en 2011 y su autor, George R. R. Martin, ha estado trabajando en Winds of Winter desde entonces, sin fecha de lanzamiento a la vista. Sin nuevo material original, los productores de la serie se han visto obligados a seguir adelante con la historia desde la temporada 6.

Cansado de la espera y armado con tecnología que va más allá de los grandes maestros de Oldtown, el ingeniero de software Zack Thoutt está entrenando a una red neuronal recurrente (RNN, por sus siglas en inglés) para predecir los eventos de la inconclusa sexta novela. Lee el primer capítulo del libro aquí.

"Soy un gran fan de Game of Thrones; de los libros y la serie", dijo Thoutt, quien acababa de completar un curso de Udacity sobre inteligencia artificial y aprendizaje profundo, el cual utilizó para hacer el proyecto. "Había trabajado un poco con una RNN en esa clase y pensé en aplicarla a los libros".

Las redes neuronales son una clase de algoritmos de aprendizaje de máquinas que son modelados a partir del cerebro humano, y las redes neuronales recurrentes son una subclase que funciona bien con secuencias de datos, como un texto.


Relacionados: Los aciertos y desatinos del final de la séptima temporada de 'Game of Thrones'


"En una red neuronal normal tomas un conjunto de datos de entrada, los pasas a través de la red y obtienes un conjunto de datos de salida", dijo Thoutt. "Con el fin de entrenar a estos modelos necesitas saber qué datos de salida generará el modelo idealmente, también llamados etiquetas o variables de destino. La red neuronal compara sus datos de salida con los objetivos y las actualizaciones que la red aprende para imitar mejor los objetivos".

Thoutt está trabajando con una RNN de "larga memoria a corto plazo" que tiene mejor memoria, la clave para hacer que una red recuerde puntos de la trama que sucedieron miles de palabras atrás. En teoría, este tipo de memoria debe evitar que la red repita eventos que ya han ocurrido, lo que permite que el libro generado sea una continuación de la trama en lugar de una versión alternativa de una obra ya publicada.

En este sentido, la red está tratando de escribir secuelas verdaderas, aunque obviamente tropieza de vez en cuando. Por ejemplo, en algunos casos ha escrito sobre personajes que ya han muerto.

"Está tratando de escribir un nuevo libro. Un modelo perfecto tomaría en cuenta todo lo que ha ocurrido en los libros y no escribiría sobre personajes que están vivos cuando murieron hace dos libros", dijo Thoutt. "La realidad, sin embargo, es que el modelo no es lo suficientemente bueno para hacer eso". Si el modelo fuera perfecto, los autores podrían estar en problemas. El modelo se está esforzando en generar un nuevo libro y en tomar todos los acontecimientos en cuenta, pero comete errores porque aún no existe la tecnología para entrenar a un generador de texto perfecto que pueda recordar tramas complejas a lo largo de millones de palabras".

Después de agregar las 5,376 páginas de los primeros cinco libros de A Song of Ice and Fire a la red, Thoutt ha producido cinco capítulos y los ha publicado en la página de GitHub del proyecto.

"Empiezo cada capítulo poniendo una palabra principal en la red, como el nombre de un personaje, e indico cuántas palabras debe generar a partir de eso", dijo Thoutt. "Quería hacer capítulos sobre personajes específicos como en los libros, así que siempre he usado los nombres de los personajes como palabra principal... además de suministrar a la red aquella palabra, no existe otro proceso de edición".


Relacionados: Las escenas de sexo lésbico de 'Game of Thrones' que no llegaron a la pantalla


Si bien no es probable que George R.R. Martin le pida consejos de escritura a esta red neuronal en ningún momento próximo, la red de Thoutt es capaz de escribir frases en su mayoría legibles y está llena de giros narrativos.

Por ejemplo (Las teorías de los fans y los spoilers de la saga producida mediante la inteligencia artificial comienzan aquí) la red predice que Sansa Stark en realidad pertenece a la Casa Baratheon y es parte de una fuerza completamente nueva:

"Tenía miedo de Sansa, Ser", le recordó Ser Jaime. "Ella Baratheon es una de los cruces, los segundos hijos de tu concubina de cebolla".

"Esa fue la primera oración que creó, pensé que era muy divertida", dijo Thoutt. En los libros, los Segundos Hijos (Second Sons) son una compañía de mercenarios que juraron lealtad a Daenerys Targaryen. En cuanto a la "concubina de cebolla", tendremos que esperar más capítulos para saber más.

La red también creó un nuevo personaje llamado Barbaverde (Greenbeard):

"Sí, Pate". El hombre alto levantó una espada y le hizo señas para que retrocediera y empujó el gran trono de acero hacia donde la muchacha avanzaba. Barbaverde estaba esperando en las puertas, gran espinilla barbada y ciega, con su cuerpo caído sacó su dedo de un anillo de manzana blanca. Estaba medio enterrado, loco por la miel de un cerebro seco, de dos exploradores, un pesado capellán.

"Obviamente no es perfecta, no está construyendo una historia a largo plazo y la gramática no es perfecta, pero la red es capaz de aprender los conceptos básicos del idioma inglés y la estructura del estilo de George RR Martin por sí sola", dijo Thoutt.

No todas las predicciones son completamente erróneas. La red predijo que Jaime Lannister acabaría matando a su hermana Cersei, que Jon Snow montaría un dragón, y que el consejero Varys envenenaría a Daenerys: teorías creadas por los fans de la serie.

Jaime mató a Cersei y estaba frío y lleno de palabras, y Jon pensó que ahora era el lobo, y el puerto blanco...

"Supongo que eso valida que cualquier cosa puede suceder en Game of Thrones", dijo Thoutt. "No incluimos las teorías de los fans en la red, sólo los libros".

Thoutt dijo que las novelas tienen unas 32,000 palabras únicas, lo que ha hecho más difícil entrenar a la red.

"Obviamente, Martin es muy descriptivo en su escritura, así que los adjetivos adicionales, y los lugares y títulos ficticios sólo complican más las cosas para la red", dijo Thoutt.


Relacionados: Las 14 escenas que hicieron de 'Game of Thrones' un éxito rotundo


El texto de las cinco novelas es en realidad un conjunto de datos relativamente pequeño para entrenar a una RNN. Una fuente mejor sería un libro 100 veces el tamaño de la saga, pero con un nivel de vocabulario para niños, dijo Thoutt.

Thoutt ha considerado agregar textos adicionales al conjunto de datos, como los guiones de la serie de TV, pero no quiere comprometer el material de origen que proviene directamente de las novelas, o complicar la red, al incluir un estilo de escritura diferente.

Hasta 2019, las historias generadas por computadora de Westeros podrían ser el único nuevo material de Game of Thrones disponible. Y quién sabe, tal vez Barbaverde aparezca y tome el Trono de Hierro a la fuerza al inicio de la octava temporada.