FYI.

This story is over 5 years old.

Tech

La révolution des robots-journalistes est en marche

Certains articles que vous lirez dans le futur résulteront d'algorithmes mathématiques :-(
7.7.14

BuzzFeed vient tout juste d'automatiser son premier article présenté sous forme de liste, et l'Associated Press, une agence de presse américaine, commence à utiliser des logiciels pour écrire automatiquement certains articles portant sur l'économie. Désormais, les algorithmes et les humains travaillent main dans la main dans les rédactions. C'est également le début de l'utilisation de tout ce qui traîne dans le big data et qui forcera – ou permettra, ça dépend comment vous voyez les choses – le lecteur à chercher l'information par lui-même.

Jusqu’ici, la transition vers l'automatisation s'est faite plutôt naturellement. Les journalistes utilisent depuis longtemps des logiciels qui les aident à écrire leurs articles – mon correcteur orthographique s'est d'ailleurs avéré très utile pour écrire ces lignes. Mais aujourd'hui, des rédactions utilisent des logiciels pour faire des articles à la place des journalistes. Le Los Angeles Times a utilisé un robot, devenu tristement célèbre pour avoir annoncé un tremblement de terre (il a depuis annoncé d'autres catastrophes naturelles et homicides dans la région). Dans le cas de Buzzfeed, les robots sont utilisés pour écrire des listes.

Publicité

C'est un tout nouveau type de journalisme, d'après Jeremy Singer-Vine, qui a d'abord travaillé au sein de l'équipe dédiée aux reportages d'enquête du Wall Street Journal avant de devenir éditeur de données chez BuzzFeed. D'après lui, le but n'est pas de remplacer les humains ou de créer du contenu viral sous forme de listes (ce qui est sûrement la raison pour laquelle l'entreprise s'est associée à Whisper), mais de poster des données en vrac que les lecteurs peuvent consulter, en prenant les informations qui les intéressent. C'est ce qu'il a fait pour sa première expérience, à savoir une liste de 275 blessures subies par des Américains ayant joué avec des feux d'artifices.

Le résultat ne ressemble pas aux listes qu'on peut habituellement croiser sur BuzzFeed : il n'y a aucun sarcasme, presque aucune photo et le texte est à peine mis en page. Et surtout, le nombre 275 est un peu indigeste pour le lecteur, et ça prendrait un temps fou au journaliste de passer au crible le site de l'agence de la CPSC (United States Product Safety Commission) pour y choisir 275 incidents. Mais pour un ordinateur, c'est un jeu d'enfant.

« J'ai voulu écrire un algorithme (le code est disponible ici) pour voir si on pouvait faire un rendu amusant de toutes ces données, m'a expliqué Singer-Vine. Je pense que les gens aiment avoir accès à ce genre de sources primaires et aiment lire ces histoires à l'état brut… Je voulais faire ce premier article en utilisant le moins possible l'intervention humaine ». En bref, il s'agit de simples données en vrac.

Publicité

La différence entre ce qu'a fait Singer-Vine pour son article et le travail qu'il a fourni pour ses innombrables autres articles, c'est justement cet état brut. Le journalisme qui s'aide des données extérieures existe depuis toujours, mais ces données n'étaient avant qu'un point de départ pour les journalistes qui devaient alors utiliser leurs propres mots pour décrire les faits.  Maintenant, au lieu d'avoir un point de vue analytique sur une base de données, on fournit la base de données elle-même.

De la même façon, l'AP (Associated Press) a annoncé que ses robots ne remplaceraient pas ses reporters (pas encore, du moins) mais seraient utilisés pour analyser des tonnes de contenus concernant les rapports d'activité des entreprises. L'AP explique qu'elle pourra multiplier ses articles sur l'économie. Ils passeront de « 300 écrits manuellement » à « près de 4400 écrits automatiquement chaque trimestre, sur le sujet des entreprises américaines ».

Singer-Vine tient un discours similaire à celui de l'AP quand il dit que son équipe pourra se concentrer sur le fait de raconter des histoires au lieu de se concentrer sur des milliers de listes générées par des ordinateurs (même s'il y en aura un peu aussi).

« Je pense qu'il s'agit moins de produire du contenu en quantité que de produire différents types d'articles, confie-t-il. Quand je regarde le feed Twitter, je vois que les gens trouvent des choses que je n'ai pas relevées moi-même. Je suis content qu'on ait tout posté. Si on avait fait du tri, ça n'aurait pas été complètement stupide, mais on dirait que les gens s'en contentent très bien. »

C'est le premier article du genre. Mais est-ce que les lecteurs préfèrent vraiment une grande quantité de contenu plutôt que des informations soigneusement sélectionnées ? Le futur nous le dira. Dans le cas de l'Associated Press, il sera précisé dans tous les articles écrits automatiquement que l'auteur est un robot. Dans le cas de BuzzFeed, il n'est pas indiqué que l'article a été écrit automatiquement. Singer-Vine a mentionné l'algorithme sur Twitter – et c'est comme ça que j'en ai entendu parler.

Je ne sais pas si les robots seront un jour capables d'écrire aussi bien que les humains, mais BuzzFeed et l'Associated Press ont cette même démarche de vouloir poster plus de contenu grâce aux algorithmes, sans pour autant chercher à remplacer les humains. Ce sera désormais aux lecteurs de trouver l'information, enfouie sous une montagne de chiffres.