Tech by VICE

Les machines qui écrivaient des poèmes

Il existe de nombreux logiciels capables de produire un texte poétique. Mais des chercheurs ambitionnent désormais de passer à l’étape supérieure : créer un programme vraiment créatif.

par Elizabeth Preston
17 Décembre 2015, 1:37pm

Image: Andy Li/Flickr

Lorsqu'elle était adolescente dans le Vermont, Sarah Harmon a créé un programme en Java qui écrit de la poésie. Elle l'a baptisé OGDEN. En 2008, elle a soumis l'un des poèmes générés par OGDEN à la revue littéraire de son lycée sous le nom de plume Dan Goshen, un anagramme d'Odgen Nash.

« Ils l'ont accepté ! » raconte Harmon en riant. « Même s'ils ont fait quelques commentaires amusants sur son caractère abstrait. »

ODGEN n'a rien d'extraordinaire, dit-elle. Il exploite des règles grammaticales et syntaxiques de base pour produire quelques bribes de phrases de phrases qui produisent un effet poétique. Par exemple : Il était extrêmement étrange / Son monde était timidement désespéré / Puis il goûta à ses rêves.

Aujourd'hui, Harmon est doctorante en informatique à l'Université de Californie, à Santa Cruz. Elle estime qu'il est très facile d'écrire un programme capable de générer de la poésie publiable. À présent, elle aimerait passer à l'étape supérieure : mettre au point un programme doué de créativité.

Les chercheurs ont bien du mal à s'entendre sur une définition de la créativité. Pourtant, Harmon et quelques autres sont décidés à élaborer un logiciel qui puisse écrire de la poésie de manière plus sophistiquée que tout ce qui a été fait auparavant. Ils rencontreront de nombreux succès et échecs qui les rappelleront, au passage, à leur humaine condition.

---

Image: Shutterstock

---

L'un de leurs premiers ménestrels numériques se nomme Racter. Le programme écrit de la prose de façon aléatoire. L'un de ses outputs les plus miraculeux a été converti en un ouvrage intitulé La barbe du policier n'est à moitié finie ; paru en 1984, il est composé de poésie et de dialogues surréalistes. Hélas, Racter a tout de même besoin qu'un humain sélectionne et arrange les fragments produits afin que la prose soit plaisante à lire. À l'origine, Harmon voulait créer un programme capable d'évaluer ses propres idées et de choisir les meilleures, comme un auteur humain. Mais ça n'est pas encore ça.

Si un poème écrit par OGDEN ou Racter peut être amusant à la première ou à la seconde lecture, on se lasse vite de parcourir les textes produits car ils se ressemblent tous, et, hélas, ne parviennent pas à surprendre le lecteur sur le long terme.

« En tant que créateurs du système, nous aussi nous voulons être surpris » exige Harmon.» « Pour moi, provoquer la surprise est un but essentiel pour un programme de ce type. » Pour sa thèse, elle travaille désormais à relever un nouveau défi dans le champ de la « créativité numérique », comme elle l'appelle. Elle tente d'entrainer un logiciel à convertir un discours narratif dans une langue plus simple, destinée par exemple aux personnes dont les compétences en anglais sont limitées. Le projet de poésie numérique qu'elle mène en parallèle est « juste pour le fun », selon elle.

Son programme le plus récent se nomme FIGURE8. Plutôt que de chercher à composer des poèmes en intégralité, Harmon préfère se concentrer sur un aspect essentiel de la poésie : le langage figuré. Cette fois-ci, le programme génère des comparaisons. « Je voulais obtenir du contenu esthétiquement beau, mais aussi compréhensible, pertinent et surprenant » explique-t-elle.

Pour commencer, Harmon a fouillé la littérature en psychologie et en linguistique pour comprendre les caractéristiques d'une bonne comparaison. Elle a lu qu'il fallait éviter les clichés, évidemment. Une bonne comparaison a quelque chose d'inédit, et elle est limpide. Le lecteur doit voir clairement en quoi telle chose est « comme » telle autre. Enfin, une bonne comparaison est juste, mais inattendue. Harmon a retenu que les comparaisons les plus habiles mettent en relations deux éléments qui partagent des caractéristiques, mais en nombre limité. Ainsi, comparer une fraise à une cerise ne bouleversera personne.

FIGURE8 fonctionne à partir de ce qu'on appelle « le raisonnement à partir de cas » (RàPC). Lorsque Hamon lui demande de décrire un nom en particulier, le programme parcourt sa base de données interne pour trouver des auteurs qui auraient déjà décrit le nom en question. Quels mots ont-ils utilisé pour cela ? Quelles propriétés la chose a-t-elle ? Quelles actions peut-elle réaliser ? Harmon a rempli la bibliothèque de FIGURE8 avec des œuvres du domaine public. Le programme a également accès à Internet.

Contrairement à la plupart des générateurs de poésie, qui se contentent d'utiliser des modèles, FIGURE8 peut apprendre de nouvelles façons de composer une phrase en s'inspirant d'autres auteurs. Il peut également déduire les « règles non écrites » d'une langue, prétend Harmon. Par exemple, il a appris que l'on pouvait utiliser deux ou trois adjectifs à la suite, ou accoler un bout de phrase au début d'une phrase simple. L'une de ses premières constructions syntaxiques fut : Telle une lune pâle, le jardin s'est illuminé en face de lui.

À la façon d'un auteur humain révisant et réévaluant sans cesse son travail, FIGURE8 génère plusieurs comparaisons possibles, puis les analyse plus en détails. Il les classe ensuite selon les critères établis par Harmon : clarté, nouveauté, justesse, et audace. Par exemple, si une recherche sur le web révélait que personne n'avait auparavant comparé telle chose et telle autre, le programme déduit que la comparaison n'est peut-être pas limpide. Si elles font partie d'une même classe sémantique—comme la cerise et la fraise qui sont toutes les deux des fruits—alors la comparaison obtient un score d'audace très bas.

D'autres chercheurs utilisent eux aussi le raisonnement à partir de cas pour produire de la poésie. ASPERA, créé par Pablo Gervás de l'Université Complutense à Madrid, est capable de composer de la poésie en espagnol selon trois formes traditionnelles.

---

Image: Shutterstock

---

Lorsque Harmon a lu les premières créations de FIGURE8, elle s'est dit qu'elle « n'avait aucune idée d'où venaient toutes ces analogies, et ces structures syntaxiques. C'était extrêmement excitant. »

Afin de pouvoir évaluer objectivement la production de son programme, Harmon a recruté des sujets sur Amazon Mechanical Turk à l'occasion d'une étude pilote. On leur a demandé de lire les phrases les plus complexes de FIGURE8 ; cependant, la tâche semblait les ennuyer profondément. « Le test ressemblait plus à un contrôle d'anglais qu'autre chose » explique-t-elle. Aussi, pour l'étude qu'elle a présenté à la Conférence Internationale sur la Créativité Numérique de cette année, Harmon a restreint la production de son programme à des phrases courtes qui respectaient certaines caractéristiques. Ce n'était peut-être pas le texte le plus brillant que FIGURE8 aura pu écrire, mais au moins, les sujets n'avaient aucun mal à lire et à comparer les phrases.

Chaque personne a dû lire cinq phrases écrites par FIGURE8. Les sujets ont ensuite classé les comparaisons de la plus claire à la moins claire et de la plus intéressante à la moins intéressante. Harmon a ensuite comparé les classements aux scores que le programme s'était lui-même attribués. Par bonheur, les évaluations des sujets ressemblaient beaucoup à celles de FIGURE8. Par exemple, machine et humains s'accordent pour dire que la comparaison La reine se tenait droite comme une forteresse est claire, de bonne qualité, mais que C'était sa perle, froissée comme un corps de noyé n'avait pas grand sens.

Harmon adorerait que des écrivains ou des experts en langue anglaise évaluent à leur tour le travail de FIGURE8. Jusque-là, ses sujets avaient tendance à donner une meilleure note aux comparaisons qui tombaient sous le sens. La neige continua à tomber comme une forte averse a été bien évaluée par exemple ; pourtant, elle ne semble pas avoir demandé beaucoup d'efforts à FIGURE8. Harmon a largement préféré La neige tombait comme un chat mort, qui a reçu des notes mitigées de la part des juges humains. « Ils devaient aimer les félins », se dit-elle.

En dépit de quelques écueils, Harmon estime que FIGURE8 « est beaucoup plus doué que ce qui était attendu. »

---

Image: Shutterstock

---

Passons sur la qualité de l'output de FIGURE8 ; s'il y a bien une chose sur laquelle on peut s'accorder, c'est qu'il est difficile d'affirmer que le programme écrit des phrases poétiques intentionnellement. Peut-on parler d'un programme créatif, s'il n'y a pas d'intention de création ? « Nous pouvons inventer une multitude d'interprétations à ces poèmes » affirme Harmon. « Cela ne signifie pas pour autant que le système en lui-même est créatif. » Elle pense qu'un jour peut-être, des ordinateurs écriront des poèmes de leur propre initiative. Mais nous n'en sommes très loin.

Geraint Wiggins, chercheur en informatique à l'Université de Londres, a défini la créativité numérique comme l'étude d'un type de comportement « que nous taxerions de créatif s'il était exhibé par un humain. » Mais peut-on dire qu'un comportement et un output sont une seule et même chose ? Les chercheurs débattent toujours cette question.

Les poètes artificiels n'ont pas besoin de faire preuve de créativité pour satisfaire les humains. Le hasard et la sérendipité y parviennent tout aussi bien. « Certains programmes parviennent à écrire des choses extrêmement surprenantes avec des outils linguistiques extrêmement simples » explique Tony Veale, chercheur en informatique. Il évoque pour l'exemple @Pentametron, un bot Twitter tout à fait charmant créé par l'artiste Ranjit Bhatnagar. Le bot cherche des tweets qui ont la structure d'un pentamètre iambique, puis les retweete en les appariant afin de former des rimes.

Veale dirige un groupe d'informatique créative à l'University College de Dublin ; le bot Twitter @MetaphorMagnet et le générateur de sourire ironique baptisé Sardonicus font partie de leurs réalisations. Le groupe est également l'une des cinq équipes de recherche qui collaborent sur le logiciel What-If Machine (WHIM), un générateur de scénarios de fiction : Un aspirateur apparait dans une arrière-cour, et se transforme soudainement en chat capable de nager. Bien entendu, il doit encore être amélioré.

Le projet WHIM est mené par Simon Colton, qui dirige lui aussi une équipe d'informatique créative à l'Université de Londres. Il est, selon ses propres mots, « à fond » dans la poésie artificielle, et estime que FIGURE8 a franchi un pas important dans la production de poèmes crédibles. Néanmoins, il reste prudent, et met l'accent sur un problème crucial généralement ignoré par les chercheurs : « le sentiment de l'humain. »

« La poésie est une façon de communiquer » précise Colton. Ce que l'on sait de l'auteur du poème participe énormément à notre expérience de lecture. Nous pouvons interpréter un poème de différentes manières en fonction du genre que l'on attribue à l'auteur, par exemple.

« Si la littérature ne nous relie plus les uns aux autres, alors on est en droit de se demander : quel est le but de la poésie générée par ordinateur ? » se demande Colton.

Il estime que la poésie numérique devrait constituer un genre à part entière, bien distinct de la poésie au sens général. Plutôt que d'évaluer une IA poète uniquement à partir de son output, il faut prendre en compte l'ensemble du processus de « création littéraire ». Le programme de Colton, Full-FACE, écrit des poèmes à partir d'articles de journaux. Chaque poème produit est accompagné d'un résumé des opérations effectuées. « J'ai lu un article de la rubrique culturelle du Guardian intitulé 'L'ANC d'Afrique du Sud célèbre le centenaire de sa création sous le soleil » écrit Full-FACE pour expliquer l'origine de son poème. Le programme s'est attardé en particulier sur un homme qui portait une salopette bleue lors de la célébration :

l'attention répétée de certains chants traditionnels africains

une lutte héroïque, comme le tempérament d'un soldat

un moment symbolique insupportable, comme un cri

des salopettes bleues, comme des groseilles

des présidents tout à fait désintéressés

oh ! des présidents si influents

de si grands présidents

des salopettes couleur groseille

des salopettes bleu alouette

une lutte épique.

Stephen McGregor, doctorant en informatique créative à l'Université Queen Mary de Londres, est d'accord avec Colton sur le fait que les tests de Turing orientés poésie sont moins intéressants en soi que l'analyse de toute la procédure créative. Il défend donc une approche « holistique ».

Récemment, lors d'un festival de poésie à Londres, McGregor a montré le générateur de poésie sur lequel il travaillait. Ce dernier utilise un modèle de langage où les mots sont représentés par des points dans un espace à plusieurs dimensions. La façon dont ces points sont reliés dans l'espace reproduit la manière dont ils sont liés dans la langue anglaise, et le programme utilise ces relations pour composer de la poésie.

« L'espace en lui-même correspond à l'endroit où de nouveaux sens émergent » explique McGregor. Cela correspond d'ailleurs à sa définition de la créativité.

---

Image: Shutterstock

---

En attendant que ces programmes connaissent de nouvelles améliorations, apprendre la créativité aux ordinateurs pourrait leur permettre de travailler plus étroitement avec les humains.

C'est le but de Poetry for Robots, un projet lance par Corey Pressman, un partenaire de l'agence numérique Neologic. Sur leur site web, des utilisateurs peuvent écrire et enregistrer des vers de leur cru pour illustrer des photos. Ces vers permettent de constituer une base de données sur les associations que font les humains entre une image et une émotion. Pressman espère que cette base de données pourra, lorsqu'elle sera suffisamment importante, contribuer à améliorer des algorithmes de recherche. Après tout, on étudie ici des associations implicites entre des objets et des événements—cela correspond assez bien à la définition de ce que l'on appelle, en informatique, des métadonnées.

L'expérience a été un succès jusque-là, affirme Pressman. Elle a même suscité l'intérêt de gros moteurs de recherche. Cependant, il estime que si un jour des robots écrivent véritablement de la poésie, elle ne ressemblera à rien de ce que nous connaissons.

« Ils pourraient écrire des poèmes sur leurs algorithmes, sur le fait qu'un matin, ces algorithmes semblent glissants, ou humides. D'autres robots pourraient comprendre à quel sentiment ou sensation cela renvoie, mais pas nous. Ça serait un grand succès » affirme-t-il.

Sarah Harmon veut également aider les ordinateurs et les humains à travailler ensemble. Son principal but n'est pas de créer un programme capable d'écrire de la poésie de grande qualité, mais d'assister les humains dans leur démarche créative. « Lors de nos recherches, nous risquons de découvrir des choses fondamentales sur la façon dont nous créons. Pourquoi ne pas faire en sorte que des ordinateurs nous assistent dans ce processus, afin de nous rendre encore plus talentueux ? » se demande Harmon.

Si des ordinateurs peuvent simuler la façon dont un humain produit des idées, peut-être qu'ils peuvent nous aider à résoudre des problèmes d'ordre créatif, poursuit-elle. Par exemple, composer de la musique, ou trouver de bonnes recettes de cuisine. Cela pourrait également nous aider à inventer de nouvelles techniques architecturales, pour construire des ponts par exemple.

Cependant, même si ce genre de partenariat homme-machine pourrait changer la façon dont nous mettons de nouvelles idées au monde, il est probable qu'aucun ordinateur-poète n'existera jamais.

« Si un ordinateur pouvait, d'une manière ou d'une autre, écrire selon son propre idéal, il écrirait sans doute des poèmes à la première personne » ajoute Stephen McGregor. « Mais je doute que l'on puisse comparer les sentiments d'un ordinateur à quoi que ce soit. »

Tagged:
Tech
Motherboard
machines
poesie
créativité
motherboard show
algorithmes