Individu de sexe féminin, la trentaine, habitant dans une grande ville, s’intéressant aux nouvelles technologies, à l’actualité et à la politique, achète ponctuellement des vêtements et des articles ménagers.

Ces quelques caractéristiques formaient le profil publicitaire de Fernanda, jusqu’au jour où le test de grossesse qu’elle avait acheté en pharmacie s’est avère positif. Avant même que le prélèvement sanguin ne confirme qu’elle était enceinte, avant même qu’elle ne l’annonce à sa famille, les annonceurs fêtaient déjà la bonne nouvelle sur Internet. Elle était devenue une nouvelle cible marketing, qu’il fallait bombarder de publicités pour la convaincre d’acheter d’innombrables produits destinés aux mamans.

« Petit à petit, tout ce qui n’avait pas de rapport à la grossesse a disparu de ma timeline Facebook », raconte-t-elle. Elle était devenue une mère, et à ce titre, tout son univers numérique la renvoyait désormais à des représentations liées à la maternité et à l’enfance. « Des amies enceintes avec qui je n’avais pas eu de contacts depuis très longtemps ont soudain commencé à apparaître dans mes notifications, » explique-t-elle.

Ce n’est pas tout. Le nom qu’elle avait choisi pour sa fille est soudainement apparu sur des pubs personnalisées, un peu partout sur le web. Il a suffit qu’elle parle de sa maternité sur les réseaux sociaux — comme ce jour où elle a évoqué l’achat de draps pour berceau — pour que de multiples pubs ciblées apparaissent sur Facebook, l’incitant à préparer la naissance de son enfant.

Depuis que sa fille est née, la nature des pubs a changé. Elle est devenue encore plus anxiogène, pour peu que cela soit possible. Soudainement, la timeline de Fernanda a été investie par des reportages sur le syndrome de la mort subite du nourrisson (MSN), une maladie rare qui n’a aucune cause univoque à ce jour, qui ne peut être anticipée, et qui fait la hantise des jeunes mères. Ces reportages étaient suivis de publicités pour un système de surveillance du sommeil du nourrissant, et autres annonces peu engageantes telles que « Maman avec une silhouette parfaite » ou « comment reconquérir le cœur de votre conjoint après la naissance votre enfant ».

Voilà comment les algorithmes de Facebook et autres outils de marketing ciblé se représentent les besoins et projets des femmes qui viennent d’accoucher. Le contenu qu’elles voient en ligne, pensé et créé selon des critères de personnalisation complexes, en est un triste reflet.

Notre expérience sur Internet est de plus en plus conditionnée par nos clics, notre historique de recherche, nos achats, nos conversations, et autres variables que nous peinons à peine à imaginer. Dans le cas du grand bouleversement qu’est l’arrivée d’un bébé dans une vie, l’aubaine est trop belle pour les géants du web et les annonceurs : ce moment de vulnérabilité et d’inquiétude aiguë est propice à la suggestion de produits de consommation sensés aider la jeune mère à entrer sereinement dans cette « nouvelle phase » de sa vie.

De la femme à la mère : la transformation du profil de consommateur

Par commodité, les annonceurs souhaitent faire entrer chaque individu dans un profil spécifique — notamment à des moments de la vie où ceux-ci sont les plus enclins à faire des achats. Or, les femmes enceintes consomment davantage, de part l’anxiété naturelle qui entoure la grossesse et les injonctions publicitaires, familiales et médicales à mener une grossesse “idéale”. À l’âge du Big Data, les données d’un consommateur lambda valent 0,08 euro. Celles des femmes enceintes, 1,25 euro.

C’est la sociologue américaine Janet Vertesi qui a effectué ce calcul. En 2014, elle a démontré — à partir d’une expérience qu’elle a elle-même vécue — que le seul moyen de dissimuler sa grossesse aux annonceurs était de faire appel au navigateur anonyme Tor. Tout click hasardeux, toute recherche non-anonyme — comme un saut par la catégorie maternité sur Doctissimo ou la recherche d’informations permettant d’interpréter une échographie, par exemple — suffit pour que l’internaute soit classée comme “enceinte”. Et une fois que les entreprises de tracking l’auront trouvée, elles ne la lâcheront plus et la bombarderont de pubs ciblées.

« C’est toujours des pubs en rapport avec l’identité », explique Fernanda. Ce qui fait sens, parce que les femmes passent par tout un processus de reconstruction de l’identité après la naissance d’un enfant. Les publicitaires le savent. Ça fait partie du profiling : construire des profils avec des comportements-type de consommateurs, puis leur proposer ce qu’ils désirent. Ou ce qu’ils sont sensés désirer.

Avec Internet, le raffinement du tracking et le pouvoir de persuasion des publicités a atteint des niveaux inimaginables, dont les conséquences sont encore incertaines. Les publicitaires peuvent savoir, par exemple, la semaine exacte de gestation de la mère, et si elle a des prédispositions à la dépression. Ce niveau de détail n’est possible que parce qu’il existe désormais des outils de surveillance sophistiqués qui accompagnent pratiquement tout ce que l’on fait sur Internet.

Nul clic ne passera inaperçu

Il existe différents niveaux de surveillance. Les plus simples sont les outils que les internautes utilisent eux-mêmes. Jusqu’à juin 2017, par exemple, Google accédait au contenu de nos mails pour afficher de la pub selon nos sujets de conversation. Facebook cible ses annonces par rapport à notre activités : nos likes, les likes de nos contacts, les thèmes abordés dans nos posts et les pages que l’on visite, qui trahissent nos intérêts.

Mais les entreprises ont développé une autre forme de collecte de données, bien plus subtile et presque imperceptible pour l’utilisateur lambda. Elle trace les sites visités, enregistre le temps que nous avons passé à les parcourir et les pages de produits que nous avons consultées. (Ce n’est donc pas un hasard si cette paire de chaussures beaucoup trop chère que vous avez admirée une fois sur Sarenza vous poursuit sur Internet. On ne sait jamais, peut-être qu’un de ces jours, vous vous laisserez tenter, après être rentré de soirée avec quelques coups dans le nez).

Malgré les apparences, nos informations ne circulent pas d’un site à l’autre comme par magie.

À chaque fois que nous visitons une page web, nous fournissons des informations sur nous : la version de notre navigateur, la liste des plug-in que nous utilisons, notre localisation et même l’orientation du gyroscope de notre smartphone. Ce n’est par pure machiavélisme que les annonceurs ont organisé cette collecte effrénée de données personnelles. En réalité, il faut y voir les contingences du développement d’Internet, qui a toujours donné la priorité à l’adoption immédiate des nouvelles technologies au détriment de la protection de la vie privée. Ces informations se sont peu à peu révélées très précieuses pour les entreprises, qui s’en sont alors emparées.

Lorsque Fernanda est sur un site web, son navigateur ne se contente pas de télécharger le texte et les images de la page. Il met en route toute une série de programmes incorporés sur le site, comme les fichiers javascript, flash, et d’autres formats script. Ces logiciels parviennent à traiter les données transitant sur la page ainsi que celles du système de l’utilisateur et renvoient ensuite ces informations au site — pour générer des animations, des effets visuels et autres fonctionnalités — mais aussi pour surveiller les aventures numériques de Fernanda.

Une étude récente des chercheurs Steven Englehardt et Arvind Narayanan, de l’Université de Princeton, aux États-Unis, a mis en lumière les tenants et les aboutissants de cette industrie de la surveillance sur Internet. Ils ont analysé 1 million de sites web — les plus visités selon le classement établi par Alexa. À cette occasion, les chercheurs ont trouvé des dizaines de milliers de scriptsdifférents, et surtout, ils ont observé qu’un tout petit groupe d’entreprises (telles que Google, Facebook et Twitter) étaient présent sur une grande quantité des sites ; cela indique que l’industrie de la surveillance est dominée par quelques acteurs ayant un poids considérable.

Si l’exhaustivité des informations que l’on peut tirer des navigateurs est dangereuse en soi, la situation est d’autant plus critique lorsqu’il est question des applications de téléphones portables : les systèmes de permissions d’accès aux informations embarquées sur les smartphones sont très laxistes (« Mais pourquoi cet appli lampe-torche veut accéder mon agenda ? »). De plus, ces informations peuvent être collectées même si l’appli en question est inactive. Enfin, Il existe désormais des preuves que les entreprises de tracking surveillent ce que l’on écrit dans des messageries cryptées comme WhatsApp, voire ce qu’on dit près des micros de nos portables ou de nos ordinateurs.

Anonyme, mais pas totalement

Les entreprises concernées assurent que cette collecte de données est toujours faite de façon anonyme. Cependant, il est toujours possible d’identifier un utilisateur anonyme au milieu d’une foule, pour peu que l’on possède suffisamment d’informations sur lui et qu’on les recoupe correctement : les entreprises responsables des plateformes de tracking ont développé des méthodes d’identification des utilisateurs extrêmement efficaces basées sur les trackers. On estime que chaque site possède, en moyenne, 20 trackers chargés de suivre l’activité des internautes.

À partir d’une technique appelée fingerprinting, les trackers arrivent à obtenir une « empreinte numérique » de toutes les données obtenues via le navigateur — sa version, la taille de l’écran, les plug-in, extensions, API, etc. Cette empreinte permet de savoir que la personne qui entre sur le site X est la même personne qui est entrée sur le site Y tout à l’heure. Cette méthode permet de déduire que Fernanda est une femme, mère d’un bébé, qui achète souvent en ligne et s’intéresse aux nouvelles technologies. Il suffit de s’identifier sur l’un des sites sur lesquels elle a créé un compte, et il devient alors possible de lier son historique de navigation à son nom d’utilisatrice.

Au premier abord, ces informations peuvent paraître banales, superficielles et inutiles. Sauf que de rares données sur les habitudes et comportements d’une personne suffisent à l’identifier avec une grande précision. Groupe social, localisation, situation économique, état de santé, opinions politiques : ces quelques caractéristiques permettront généralement de savoir qui vous êtes.

Un ensemble de techniques permet de croiser ces données collectées sur différents appareils (on appelle ça le cross device tracking) afin de montrer, par exemple, que la personne qui a visité tel site sur son ordinateur personnel est la même que celle qui a utilisé son smartphone pour commander un taxi. Ce sont ces mêmes techniques qui permettent d’afficher une pub identique sur deux appareils différents.

Profils à vendre

Connaître l’utilisateur au maximum est le meilleur moyen de l’inciter à consommer. Et le profiling est l’une des techniques les plus utilisées dans ce sens, puisque ses habitudes de consommation peuvent être obtenues facilement à partir d’une grande quantité de données.

Grosso modo, ces profils publicitaires types n’identifient personne individuellement : ils servent avant tout à caser les gens dans des catégories. Celles-ci peuvent être déterminées à l’avance par la personne qui a programmé l’algorithme — c’est l’approche top-down — ou être le produit du croisement d’informations issues de différentes bases de données, avant d’être interprétéespar des professionnels du domaine – c’est l’approche bottom-up.

« L’objectif n’est pas de produire des connaissances précises sur un individu identifiable, mais d’exploiter le lot d’informations personnelles pour pouvoir intervenir auprès de personnes similaires », explique Fernanda Bruno, professeure à l’Université Fédérale de Rio de Janeiro (UFRJ) et docteure en communication, dans son livre Máquinas de ver, Modos de Ser. « Le profil intervient toujours comme une catégorisation du comportement d’un consommateur type, et permettra de simuler ses comportements à venir ainsi que les comportements de ceux qui lui ressemblent. »

Navegg est l’une des plus grosses entreprises du secteur au Brésil. L’entreprise surveille 400 millions de personnes environ et ses scripts sont présents sur plus de 100 000 sites. Avec la promesse de rendre une « représentation holistique de l’internaute » à ses clients, elle propose différents services de traitement de données, du behavioral targeting (surveillance de comportement) aux analyses de profils de navigation.

L’entreprise est l’une des rares dans le domaine à permettre à l’utilisateur de voir quel est son propre profil, et, s’il le veut, à exiger la fin de son tracking. C’est l’entreprise elle-même qui a voulu instaurer cette pratique “vertueuse” : au Brésil, aucune loi ne définit les limites de la surveillance sur Internet.

Navegg « analyse et catégorise les internautes selon douze critères : genre, âge, niveau d’éducation, catégorie socio-économique, état civil, intérêts, ouverture à l’achat, comportement, marques privilégiées, professions, technologies utilisées (connexion, appareils, navigateurs, etc.) et localisation (pays, ville et région) ». Ainsi, l’entreprise aurait pu analyser Fernanda et se rendre compte que :

° Elle appartient à la catégorie M aternité (« les internautes qui consultent des contenus sur l’éducation des enfants, le soin des bébés, la grossesse »), parce qu’elle a visité des sites sur la signification des prénoms et parce qu’elle a fait des recherches sur des symptômes spécifiques à la grossesse.

° Elle effectue fréquemment des recherches Google sur des sujets liés à la programmation et à la technologie, ce qui la situe dans la catégorie Développement de logiciels (« les internautes qui consultent des sites sur les langages de programmation, les bases de données, les réseaux, la sécurité informatique. »)

° À cause de son travail dans une ONG, elle figure probablement sur la liste Causes sociales (« Les internautes qui consultent du contenu sur des sujets sociaux, environnementaux, le militantisme, les associations, la philanthropie. »)

Avec le développement des technologies de surveillance et le data mining, une nouvelle industrie associée à celle du tracking se développe progressivement. Celle-ci est chargée de collecter, traiter et revendre ces données, en créant des liens entre les différentes bases de données.

Il s’agit des data brokers, ou « traders de données ». Ces entreprises, qui achètent et vendent des données créées sur et en-dehors du web (comme une inscription au programme de fidélité d’un magasin, une inscription sur des registres de personnes victimes d’un interdit bancaire, ou à des programmes d’aides sociales du gouvernement), créent des profils types afin de subdiviser la population en catégories, de manière exceptionnellement précise. Ainsi, lorsque Fernanda fait des courses au supermarché ou à la pharmacie, elle a peut-être contribué à ce que d’autres pubs pour femmes enceintes apparaissent pendant sa navigation sur Internet, uniquement parce qu’elle a utilisé des cartes de fidélité ainsi que sa carte bleue.

Fantasmes et stéréotypes

Dans le meilleur des cas, les femmes à qui l’on présente des publicités en rapport avec la grossesse et l’enfance attendent effectivement un enfant. Dans le pire des cas, elles ont fait une fausse-couche, ce qui rend le matraquage publicitaire d’autant plus glauque et déplacé. Dans son livre Healthcare and Big Data – Digital Specters and Phantom Objects », la sociologue britannique Mary Ebeling explique comment le marché publicitaire simule la vie d’un bébé qui est déjà mort à partir de données, annonces ciblées, newsletters et autres stratégies marketing.

C’est un « marketing du bébé, un marketing du désir d’enfant », explique-t-elle. Il se manifeste par l’intermédiaire de la simulation du désir de vêtements, de lait instantané, de poussettes, de suppléments alimentaires et autres produits et services proposés à la mère sans discontinuer, même si le bébé n’est pas amené à naître. La chercheuse, qui a vécu elle-même cette expérience abominable, a compilé les histoires de femmes qui ont essayé de se débarrasser – en vain – de ces publicités ciblant un enfant qui ne verrait jamais le jour.

Il est impossible de contrôler comment ces données sont collectées et cédées à des tiers, et la simple suppression de compte sur un site associé à la maternité n’est pas suffisante pour changer de profil de consommateur. Dans son ouvrage, la chercheuse démontre toute la complexité du système, ainsi que l’absence totale d’emprise des utilisatrices sur leurs propres informations – qui sont utilisées pour les caser dans un profil qui ne leur correspond plus, ou auquel elles n’ont jamais souhaité appartenir.

La situation décrite par Ebelin est sans doute l’une des plus cruelles que puisse engendrer le système de profiling, mais les conséquences ne s’arrêtent pas là. Le processus est une sorte de route à deux voies : il prend ses sources chez le comportement des utilisateurs, mais nourrit en retour leur comportement en affichant du contenu et des publicités pertinents. À terme, il finit par renforcer des comportements et habitudes qui existent déjà dans la société.

Dans le cas de la maternité, par exemple, le profiling renforce les rôles déterminés par la société patriarcale, selon lesquels la femme est la principale responsable des enfants. « Non seulement les plateformes de profilingfournissent les informations trahissant qui nous sommes, mais elles nous disent aussi qui nous devons être », explique Fernanda.

Lorsqu’elle s’est rendu compte du niveau de surveillance et de l’influence du marketing, elle en a parlé à son partenaire et père de son enfant. Bien qu’il ait cherché des informations et des produits en rapport avec la paternité et avec les bébés, il est resté relativement épargné par la publicité ciblée. « Je pense que c’est parce que c’est un homme. Pour le marché, les hommes ne s’intéressent pas énormément aux enfants, » suggère Fernanda.

La représentation des stéréotypes féminins – mère, grand-mère, étudiante, jeune cadre dynamique – ne laisse que peu de place à la complexité, ce qui est très commode pour les publicitaires. Outre le fait de renforcer les stéréotypes, cette classification en profils de consommateurs a aussi des conséquences politiques : ces mêmes techniques peuvent être utilisées pour identifier de possibles manifestants ou des dissidents politiques, par exemple. D’ailleurs, il existe aujourd’hui des preuves que l’utilisation d’outils sophistiqués de profiling et d’analyse de données a été déterminante pour la victoire de Donald Trump.

Kate Crawford, chercheuse chez Microsoft, cite l’exemple d’un logiciel chinois qui se veut capable d’identifier de possibles criminels à partir de l’analyse de leur visage (soit un retour très troublant à la phrénologie, une pseudoscience qui a vu le jour puis a disparu au 19e siècle). De même, l’entreprise Faceception dit pouvoir reconnaître, également à partir d’un visage, le comportement et le profil social d’une personne. On doute fortement de l’efficacité et de la pertinence de ces outils, mais le fait est que si ces technologies tombent entre les mains d’un régime autoritaire, elles pourraient faire de gros dégâts.