Το άρθρο δημοσιεύθηκε αρχικά στο Motherboard.Πριν από λίγους μήνες, κάναμε το ίδιο πράγμα με γάτες. Ζωγραφίσαμε κάτι σε ένα μικρό κουτί και ένας αλγόριθμος προσπάθησε να το ερμηνεύσει ως γάτα, για να το γεμίσει τελικά με χρώματα και αποχρώσεις, σύμφωνα με ένα ένα μοντέλο μηχανικής μάθησης που έχει εξασκηθεί στην αναγνώριση της εικόνας της γάτας, βλέποντας απλώς χιλιάδες εικόνες με γάτες. Αυτό ήταν το πρώτο πείραμα του πρότζεκτ pix2pix. Τώρα, μπορούμε να ζωγραφίσουμε ανθρώπινα πρόσωπα. Το πράγμα έχει ξεφύγει τελείως.Το πρότζεκτ pix2pix μάς λέει κάτι πολύ σημαντικό σχετικά με το πώς μαθαίνουν και αναλύουν δεδομένα οι μηχανές στην εποχή μας: είναι εντελώς άσχετες στο να φτιάχνουν νέες εικόνες ή τουλάχιστον νέες εικόνες που να έχουν νόημα. Η διαδικασία μηχανικής μάθησης είναι πολύ καλύτερη στο να ταξινομεί και να κατηγοριοποιεί υπάρχουσες εικόνες. Για να φτιάξουμε ένα πραγματικά αξιόπιστο μοντέλο αναγνώρισης αντικειμένων, χρειαζόμαστε εκατομμύρια εικόνες που θα λειτουργήσουν ως δεδομένα εξάσκησης του μοντέλου στο αντικείμενο που πρέπει να μάθει να αναγνωρίζει.Το Pix2pix βασίζεται σε μία πολλά υποσχόμενη τεχνική που ονομάζεται «παραγωγικά ανταγωνιστικά δίκτυα» (πιο δόκιμος παραμένει ο αγγλικός όρος: generative adversarial networks/GANs). Τα GANs εκπαιδεύουν μοντέλα παραγωγής εικόνας που προσπαθούν να περιορίσουν την «απώλεια» στην κατανόηση και αποτύπωση μίας εικόνας από το μοντέλο. Αυτό γίνεται με τη βοήθεια μίας πρόβλεψης που λέει αν η εικόνα που δημιουργείται, είναι ψεύτικη ή αληθινή. Βασικά, τα GANs μαθαίνουν πώς να ζωγραφίζουν σχεδιάζοντας επαναλαμβανόμενα μία σειρά από όλο και λιγότερο τυχαία σχήματα, την ώρα που ένα δεύτερο μέρος του αλγόριθμου καθοδηγεί το πρώτο βλέποντας τις εικόνες και λέγοντας αν είναι αληθινές ή ψεύτικες.Με ένα μεγάλο αριθμό δεδομένων, τα GANs μπορούν να ζωγραφίσουν μια εικόνα με βάση ένα σχέδιο που τους έχει δοθεί. Με ένα μικρότερο αριθμό δεδομένων, μπορούν να μεταφράσουν μία εικόνα. Πρακτικά, αντί να παράξουν την εικόνα, τα τα μοντέλα μαθαίνουν πώς να γεμίζουν ένα σχέδιο με χρώματα, ώστε αυτό να γίνει σε εικόνα. Το αποτελέσματα της προσπάθειας ήταν τα παρακάτω:
ΔΙΑΦΗΜΙΣΗ
ΔΙΑΦΗΜΙΣΗ
Αν και οι τελικές εικόνες απέχουν αρκετά από την τελειότητα και -ας είμαστε ειλικρινείς- είναι λίγο απαίσιες, τα GANs σίγουρα θα παίξουν σημαντικό ρόλο στην μηχανική μάθηση μοντέλων παραγωγής εικόνας. Και καθώς οι μηχανές γίνονται όλο και πιο έξυπνες, οι αλγόριθμοι πιο «ανθρώπινοι», το ερώτημα είναι τι άλλο θα ακολουθήσει.Περισσότερα από το VICEΤι Έκανα τη Βραδιά Πριν Από τις ΠανελλαδικέςΓονείς Εξηγούν πώς να Παραμείνεις Kinky Αφότου Κάνεις ΠαιδιάH Συγκλονιστική Ιστορία του Γκάνγκστερ που Ξόδεψε Πάνω από ένα Εκατομμύριο Ευρώ σε Ναρκωτικά