ΔΙΑΦΗΜΙΣΗ
Motherboard

Η Τεχνολογία «Γράφει» το Επόμενο Βιβλίο του Game of Thrones Αφού ο George R.R. Martin Δεν το Έχει Κάνει

Το «The Winds of Winter» είναι κιόλας εδώ - περίπου.

Κείμενο Motherboard Staff
01 Σεπτέμβριος 2017, 5:00am

Εικόνες: HBO/Shutterstock. Κολάζ: Jason Koebler

To άρθρο δημοσιεύθηκε αρχικά στο Motherboard - Kείμενο: Sam Hill

Λίγα λεπτά μετά το επικό φινάλε της έβδομης σεζόν του Game of Thrones, κάποιοι fans της σειράς ήδη απογοητεύτηκαν που έμαθαν ότι τα έξι επεισόδια της τελευταίας σεζόν της σειράς θα προβληθούν την άνοιξη του 2019.

Για τους αναγνώστες της σειράς μυθιστορημάτων A Song of Ice and Fire ( Το Τραγούδι της Φωτιάς και του Πάγου) στην οποία είναι βασισμένη η σειρά, η απογοήτευση που προκύπτει από τον εκτιμώμενο χρόνο αναμονής είναι για γέλια. Το πέμπτο μυθιστόρημα της επτάτομης σειράς, A Dance with Dragons (Ο Χορός των Δράκων, εκδ. Anubis), κυκλοφόρησε το 2011 και ο συγγραφέας George R. R. Martin δουλεύει έκτοτε το The Winds of Winter, χωρίς να διακρίνεται κάπου στο βάθος ημερομηνία κυκλοφορίας. Μην έχοντας νέο υλικό, οι παραγωγοί της σειράς αναγκάστηκαν να προχωρήσουν την ιστορία μόνοι τους από το τέλος της έκτης σεζόν.

Έχοντας βαρεθεί την αναμονή και οπλισμένος με τεχνολογία πολύ πιο προηγμένη από τους μεγάλους maesters της σειράς, ο μηχανικός λογισμικού Zack Thoutt εκπαιδεύει ένα επαναλαμβανόμενο νευρωνικό δίκτυο (RNN) να προβλέπει τα γεγονότα του έκτου μυθιστορήματος που δεν έχει τελειώσει. Διαβάστε το πρώτο κεφάλαιο του βιβλίου εδώ.

«Είμαι τεράστιος fan του Game of Thrones, τόσο του βιβλίου όσο και της σειράς», είπε ο Thoutt, που μόλις ολοκλήρωσε ένα πρόγραμμα της Udacity για την τεχνητή νοημοσύνη και τη βαθιά μάθηση και χρησιμοποίησε ό,τι έμαθε για το project. «Είχα δουλέψει λίγο με RNN στα μαθήματα και σκέφτηκα να δοκιμάσω να δουλέψω τα βιβλία».

Δεν είναι όλες οι προβλέψεις άκυρες

Τα νευρωνικά δίκτυα είναι μια κατηγορία αλγόριθμων εκμάθησης μηχανών με πρότυπο τον ανθρώπινο εγκέφαλο και τα RNN είναι ένα παρακλάδι του μαθήματος με καλά αποτελέσματα στα συνεχή δεδομένα, όπως τα κείμενα.

«Σε ένα απλό νευρωνικό δίκτυο παίρνεις μερικά δεδομένα, τα περνάς στο δίκτυο και έχεις αποτελέσματα», είπε ο Thoutt. «Για να εκπαιδευτούν αυτά τα μοντέλα, πρέπει να ξέρεις ποιο θα πρέπει να είναι ιδανικό το αποτέλεσμα, κάτι που συχνά αποκαλούμε ετικέτες ή μεταβλητές στόχου. Το NN συγκρίνει τα δεδομένα που βγάζει με τους στόχους και μαθαίνει να μιμείται καλύτερα τους στόχους».

Ο Thoutt δουλεύει με ένα RNN μακράς βραχυπρόθεσμης μνήμης που έχει καλύτερη μνήμη, το σημαντικό για την εκπαίδευση ενός δικτύου, ώστε να θυμάται προηγούμενα σημεία της πλοκής. Θεωρητικά, αυτού του είδους η μνήμη θα έπρεπε να εμποδίζει το δίκτυο να επαναλαμβάνει γεγονότα που έχουν ήδη συμβεί, επιτρέποντας στο παραγόμενο βιβλίο να είναι μια συνέχιση της πλοκής και όχι μια εναλλακτική εκδοχή ενός έργου που έχει ήδη εκδοθεί.

Μ' αυτή την έννοια, το δίκτυο αποπειράται να γράψει πραγματικά sequel, αν και προφανώς σκοντάφτει πού και πού. Για παράδειγμα, σε μερικές περιπτώσεις έχει γράψει για χαρακτήρες που έχουν ήδη πεθάνει.

«Προσπαθείς να γράψεις ένα καινούριο βιβλίο. Ένα τέλειο μοντέλο θα έπαιρνε υπόψη ό,τι έχει συμβεί στα βιβλία και δεν θα έγραφε για χαρακτήρες που πέθαναν δυο βιβλία νωρίτερα», είπε ο Thoutt. «Στην πραγματικότητα, όμως, το μοντέλο δεν μπορεί να το κάνει αυτό. Αν ήταν τόσο καλό, οι συγγραφείς μπορεί να είχαν πρόβλημα. Το μοντέλο προσπαθεί να φτιάξει ένα καινούριο βιβλίο και να λάβει υπόψη τα πάντα, αλλά κάνει πολλά λάθη, επειδή η τεχνολογία εκπαίδευσης του τέλειου text generator που θυμάται περίπλοκες υποθέσεις εκατομμυρίων λέξεων δεν υπάρχει ακόμη».

Αφού πρόσθεσε τις 5.376 σελίδες των πρώτων πέντε βιβλίων στο δίκτυο, ο Thoutt έχει φτιάξει πέντε κεφάλαια και τα έχει δημοσιεύσει στην GitHub σελίδα του project.

«Ξεκινάω κάθε κεφάλαιο δίνοντας μια βασική λέξη, που πάντα χρησιμοποιούσα ως όνομα χαρακτήρα και του λέω πόσες λέξεις να παράγει», είπε ο Thoutt. «Ήθελα να κάνω κεφάλαια για συγκεκριμένους χαρακτήρες, όπως στα βιβλία, έτσι πάντα χρησιμοποιούσα το όνομα ενός χαρακτήρα. Δεν υπάρχει άλλη επιμέλεια στο κείμενο, εκτός από το να παρέχεις στο δίκτυο την πρώτη βασική λέξη».

Ο George R.R. Martin δεν πρόκειται να ζητήσει συμβουλές για γράψιμο, αλλά το δίκτυο του Thoutt μπορει να γράψει κατά βάση προτάσεις που διαβάζονται και έχει ένα σωρό ανατροπές.



Για παράδειγμα (εδώ ξεκινούν οι θεωρίες των fan και τα spoiler για τη σειρά που δημιουργεί η τεχνητή νοημοσύνη) το δίκτυο προβλέπει ότι η Sansa Stark ανήκει στην πραγματικότητα στον Οίκο Baratheon και είναι μέρος μια τελείως καινούριας δύναμης:

«"Φοβήθηκα τη Sansa", της υπενθύμισε ο Ser Jaime. «Είναι Baratheon από τη διασταύρωση. Οι δεύτεροι γιοι της κρεμμυδοπαλλακίδας σου».

«Αυτή ήταν η πρώτη πρόταση που δημιούργησε. Τη βρήκα πολύ αστεία», είπε ο Thoutt. Στη σειρά, οι Second Sons (Δεύτεροι Γιοι) είναι μισθοφόροι ταγμένοι στη Μητέρα των Δράκων Daenerys Targaryen. Όσο για την κρεμμυδοπαλλακίδα; Θα πρέπει να περιμένουμε κι άλλα κεφάλαια για να δούμε.

Επίσης, το δίκτυο έχει δημιουργήσει έναν καινούριο χαρακτήρα που λέγεται Greenbeard:

«Ναι, Pate», ο ψηλός άνδρας σήκωσε ένα σπαθί και του έκανε νόημα και έσπρωξε τον μεγάλο ατσάλινο θρόνο εκεί όπου ήρθε το κορίτσι. Ο Greenbeard περίμενε κοντά στις πύλες, μεγάλο τυφλό γενειοφόρο μπιμπίκι με το πεσμένο του σώμα έγδαρε το δάχτυλό του από ένα δαχτυλίδι λευκού μήλου: Ήταν μισοθαμμένο τρελαμένο με το μέλι ενός άνυδρου μυαλού, δύο φύλακες κι ένας βαρύς Frey.

«Προφανώς δεν είναι τέλειο. Δεν φτιάχνει μια μακροπρόθεσμη ιστορία και η γραμματική δεν είναι τέλεια. Αλλά το δίκτυο μπορεί να μάθει τα βασικά της αγγλικής γλώσσας και τη δομή του στιλ του George R. R. Martin μόνο του», είπε ο Thoutt.

Δεν είναι όλες οι προβλέψεις άκυρες. Το δίκτυο προέβλεψε ότι ο Jaime Lannister σκοτώνει την αδελφή/ερωμένη του Cersei, ο Jon Snow καβαλάει έναν δράκο και ο Varys δηλητηριάζει τη Daenerys – θεωρίες που συζητούν οι fan της σειράς.

Ο Jaime σκότωσε τη Cersei και ήταν κρύο και γεμάτο λέξεις και ο Jon νόμιζε ότι ήταν ο λύκος τώρα και άσπρο λιμάνι.

«Υποθέτω ότι αυτό επιβεβαιώνει ότι τα πάντα μπορούν να συμβούν στο Game of Thrones», είπε ο Thoutt. «Δεν έδωσα τίποτα στο δίκτυο από τις θεωρίες των fan στο Ίντερνετ, μόνο τα βιβλία».


Παρακολουθήστε όλα τα βίντεo του VICE, μέσω της νέας σελίδας VICE Video Greece στο Facebook.


Ο Thoutt είπε ότι τα βιβλία έχουν περίπου 32.000 μοναδικές λέξεις, κάτι που έκανε πιο δύσκολη την εκπαίδευση του δικτύου.

«Ο Martin είναι προφανώς πολύ περιγραφικός, έτσι τα επιπλέον αυτά επίθετα και οι φανταστικές τοποθεσίες και οι τίτλοι περιπλέκουν τα πράγματα για το δίκτυο», είπε ο THoutt.

Το κείμενο των πέντε μυθιστορημάτων είναι σχετικά μικρό σύνολο δεδομένων για την εκπαίδευση ενός RNN. Μια πιο ιδανική πηγή θα ήταν ένα βιβλίο 100 φορές το μέγεθος της σειράς, αλλά με λεξιλογικό επίπεδο παιδικού βιβλίου, είπε ο Thoutt.

Ο Thoutt έχει σκεφτεί να προσθέσει συμπληρωματικά κείμενα στα δεδομένα, όπως τα σενάρια από τη σειρά, αλλά δεν θέλει να πειράξει το βασικό υλικό των μυθιστορημάτων ή να μπερδέψει το δίκτυο, βάζοντας μέσα σεναριακό στιλ.

Μέχρι το 2019, οι βγαλμένες από υπολογιστή ιστορίες του Westeros μπορεί να είναι το καινούριο υλικό του Game of Thrones. Και ποιος ξέρει, ίσως ο Greenbeard να εμφανιστεί και να κατακτήσει τον Σιδερένιο Θρόνο στην αρχή της όγδοης σεζόν.

Περισσότερα από το VICE

Ο Χειμώνας Έρχεται, αν και Κομματάκι Καθυστερημένος

Όλοι Γελούσαν Όταν τους Έλεγα ότι Θέλω να Γίνω Μοντέλο

Kλάψτε Ελεύθερα με Αυτές τις #BarbecuePorn Φωτογραφίες από Όλο τον Κόσμο

Ακολουθήστε το VICE στο Twitter, Facebook και Instagram.

Tagged:
Game of Thrones
westeros
George RR Martin
Jon Snow
Winds of Winter
A Song of Ice and Fire—The Winds of Winter
Jaime Lannister
Τεχνολογία
Σειρές
Τηλεόραση
προβλέψεις
νευρωνικό δίκτυο
δράκος
RNN
Zack Thoutt