Les réseaux de neurones qui mettront les designers Ikea sur la paille

FYI.

This story is over 5 years old.

Les réseaux de neurones qui mettront les designers Ikea sur la paille

Les machines sont désormais capables de distinguer un pupitre sur pied d'un bureau Mazarin. Et vous ?
6.1.16

En dépit de la mode des bureaux assis-debout, des campagnes de prévention mangerbouger et de la propagande newyorkaise sur les vertus du repas ambulant, rien ne vaut une bonne vieille chaise lorsque l'on veut reposer sa carcasse du poids de l'existence.

Les rocking chairs lumineux autoportants passent, les meubles à pieds restent.

On croyait jusque là que seuls des designers habiles étaient capables de nous proposer des modèles de chaises confortables, pratiques, qui ne brinquebalent pas. Des chaises sur lesquelles nous pourrions poser sans frémir les parties les plus vulnérables de notre anatomie.

Publicité

C'était sans compter la détermination de chercheurs en intelligence artificielle de l'Université de Fribourg. À l'occasion de la Conférence Internationale sur la vision par ordinateur et la reconnaissance de formes (IEEE International Conference on Computer Vision and Pattern Recognition), ces derniers ont publié un article détaillant leur méthode pour entrainer un réseau de neurones à générer des designs de chaise inédits.

La procédure était la suivante : les chercheurs ont utilisé un réseau de neurones convolutionnels capable de générer des images d'objets en fonction de leur type, de leur orientation et de leur couleur. Ils l'ont entrainé en lui présentant une large base de données de modèles de chaise 3D de formes variées. Ainsi, ce dernier a pu extraire des informations synthétiques sur les caractéristiques essentielles d'une chaise. En d'autres termes, à force de voir des chaises, il a réussi à « comprendre » ce qu'est une chaise, à en avoir une représentation générale ; pour nous, la chaise est un objet qui présente un dossier, quatre pieds, une assise, et existe dans une certaine gamme de dimensions. Pour le réseau de neurones, c'est une classe d'objets qui contient toutes les caractéristiques communes aux représentations 3D que les chercheurs lui ont montrées.

Le programme ne s'est pas contenté d'apprendre des modèles de chaise par cœur et de les recracher ponctuellement pour faire plaisir aux chercheurs. Non, il a ben et bien produit de nouveaux modèles de chaises sous la forme d'images 2D après avoir reçu des indications sur le type d'objet à générer (orientation, classe, couleur, texture, etc). Elles sont tout à fait honnêtes, et on pourrait les exposer dans son salon sans rougir.

Publicité

Les compétences du réseau de neurones en question sont doubles. Il peut effectuer des transferts de connaissances, c'est-à-dire qu'il est capable de déduire l'anatomie complète d'une chaise si on ne lui en montre qu'une partie seulement. Mais il sait également réaliser des interpolations ; cela consiste à générer des formes « intermédiaires » entre deux modèles de chaises, après avoir analysé leurs éléments respectifs. C'est en quelque sorte l'équivalent du morphing, qui permet de passer d'une forme à une autre.

Interpolation entre deux modèles de chaises. Les modèles d'origine sont le premier en haut à gauche et le premier en bas à droite. Le réseau de neurones a appris à générer des chaises « intermédiaires » à ces deux modèles.

La vidéo ci-dessus illustre l'opération en question. Pour réaliser à quel point elle est impressionnante, il faut oublier les représentations de morphing classiques que l'on utilise par exemple pour les effets spéciaux au cinéma. Ces dernières montrent avant tout la capacité d'un spécialiste VFX à suggérer le passage d'une forme à une autre de manière fluide en utilisant tout un arsenal logiciel. Ici, il s'agit de tout autre chose : le petit réseau de neurones, qui est rappelons-le un système de calcul tout simple doté d'une fonction de transfert, a appris tout seul ce que deux objets techniques avaient en commun. C'est plutôt fascinant.

Un réseau de neurones fonctionne comme une boite noire, c'est-à-dire qu'il a une entrée et une sortie, que l'input d'entrée est transformé en output selon des règles déterminées, mais qu'au sein du réseau lui-même, on est parfois bien en peine de comprendre ce qu'il se passe. Ici, les chercheurs précisent qu'ils sont certains « que le réseau en sait plus sur les chaises que ce qu'une simple combinaison linéaire ne leur aurait appris » mais il leur est difficile de caractériser en quoi consiste vraiment cette connaissance.

Publicité

On peut regretter que la base de données sur laquelle le réseau de neurones a été entrainé ne soit pas plus haute en couleurs : cela manque de trônes de fer, de fauteuils Empire, de chaises de plage, et de gros sièges en cuir pivotant pour méchant de film d'espionnage. Quelle est la forme intermédiaire entre le trône du roi Charles III d'Espagne et cette chaise design conçue par Cécile Planchais ? Pas nécessairement un siège sur lequel vous aimeriez vous asseoir. En tout cas, le réseau de neurones est susceptible de connaître la réponse.

Génération d'images exploitant différents paramètres de modification : translation rotation, zoom, étirement, brillance, couleur, etc. La colonne du milieu représente les chaises non transformées.

Il semble que l'équipe ait d'ailleurs eu quelques envies de morphing exotiques. Dans un article plus récent, elle s'est essayé à répéter le procédé en tentant cette fois des interpolations entre objets disparates : chaises et tables, par exemple.

Interpolations entre des chaises et des tables (une interpolation par ligne).

Enfin, les chercheurs ont réussi à apprendre au réseau de neurones à effectuer des sortes d'opérations arithmétiques morphologiques : le programme ayant précédemment appris à décomposer les parties d'un objet donné, il est désormais capable d'établir des correspondances entre deux objets très différents. Ainsi, il peut additionner et soustraire des caractéristiques (formes, couleur, éléments) les unes aux autres. On ne peut peut-être pas additionner des pommes et des poires, mais pour les fauteuils rouges et les chaises de bureau métalliques, ça ne pose pas de problème.

Essai "d'arithmétique morphologique".

L'équipe affirme qu'il sera bientôt possible d'entrainer le réseau de neurones à créer de nouveaux designs à partir de bruit. Si toutefois l'expérience était couronnée de succès, elle serait d'autant plus spectaculaire que la « créativité » du programme aurait alors beaucoup en commun avec la créativité humaine.

En effet, le designer moyen, malgré sa propension à arborer des coupes de cheveux discutables et des costumes un peu trop branchés pour être honnêtes, est une personne comme les autres. Ses idées ne surgissent pas ex nihilo ; elles sont le produit plus ou moins conscient, plus ou moins élaboré, d'observations quotidiennes. Chaque jour, nous percevons des objets, des bâtiments, des perspectives, des êtres vivants aux formes vagues, géométriques, courbes, droites, satisfaisantes ou non satisfaisantes, etc. Pour notre cerveau, chaque nouvelle forme perçue entre immédiatement dans l'immense catégorie des « formes possibles » qui façonnent notre monde. Créer, c'est composer et recomposer ces formes pour obtenir de nouvelles représentations inédites. Puis, éventuellement, de les incarner en objets aux applications techniques et/ou esthétiques.

Pour le moment, nous ne comprenons pas vraiment comment un réseau de neurones est capable de « saisir » la représentation générique, prototypique d'un objet. Selon les chercheurs, « ces expériences suggèrent que les réseaux de neurones entrainés à reconstituer différentes classes d'objets développent une certaine compréhension des formes et de la géométrie en 3D. »

Ces recherches permettront de mettre au point des intelligences artificielles plus raffinées et plus efficaces pour détecter, reconnaître et concevoir des objets ; mais surtout, elles nous offrent de nouvelles pistes pour comprendre comment ces fonctions cognitives sont inscrites chez l'humain.Le concept de créativité n'est pas encore près de tomber de son piédestal. Mais les machines savent parfaitement bien distinguer les modèles de piédestaux entre eux.