Elyze : risque de manipulation de l’opinion ou innovation au service du débat démocratique

A quelques jours des élections présidentielles, nos experts cyber de onepoint, qui ont publié un livre blanc ayant pour objectif de dépeindre les risques numériques pesant sur les élections présidentielles sont allés à la rencontre des élèves à l’ILERI (Institut Libre des Relations Internationales et des Sciences Politiques).

 

L’objectif était de mieux comprendre l’application mobile Elyze et d’échanger sur les risques numériques liés au codage de l’application et à l’utilisation des données enregistrées.

Elyze a vite conquis le cœur des Français. Ayant comme ambition première de lutter contre le taux d’abstention élevé chez les jeunes ; l’application a réussi son pari en étant téléchargé par plus de 500 000 utilisateurs dès la première semaine de mise en circulation

Initialement prévue pour atteindre un jeune public, l’application a réussi à gagner le téléphone d’une audience généralement peu politisée. D’après plusieurs sondages IFOP, plus de la moitié des jeunes de 18 à 30 ans envisagent de ne pas se rendre aux urnes pour l’élection présidentielles 2022.

Ces chiffres portent en eux un véritable paradoxe : alors que la parole politique est de plus en plus relayée et médiatisée, la proportion de la population désintéressée par le suffrage ne cesse de croître. Elyze a réussi le défi de répondre à un des besoins premiers de la démocratie : réintéresser la population aux élections. En seulement une semaine, l’application a atteint le top des tendances des téléchargements en France dans la catégorie new et magazines.

L’innovation technologique au service de la démocratie

Cet engouement peut s’expliquer par la simplicité d’accès à l’interface et le fait que l’application reprenne des méthodes de communication bien connues du grand public : comme l’application de rencontre Tinder, Elyze permet de faire défiler les propositions de chaque soupirant à la présidence pour réaliser un classement de ses « candidats favoris ». La popularité de l’application peut alors s’expliquer par sa simplicité d’accès qui à l’inverse des longs débats politiques, se rapproche davantage des attentes de la population, et d’une tendance accrue ces dernières années de recherche de l’information instantanée. Elyze serait ainsi le trait d’union entre les politiques et la population non-politisée. Savoir si l’application réduit la problématique de l’abstention chez les personnes non politisées demeurera jusqu’aux élections.

En revanche, l’application est une véritable plus-value pour la démocratie car, malgré les vives critiques reçues, elle informe et intègre une population jusque-là éloignée du système démocratique français.

Cette tendance de fond que constitue la numérisation des campagnes électorales concerne la communication des candidats mais également une question plus profonde du numérique et de la citoyenneté. En effet, la numérisation de l’identité peut être la source de grandes avancées et, à terme, reconnecter une partie des citoyens aux débats politiques. Néanmoins, il reste encore des dérives mises en évidence par l’application Elyze qui interroge sur la légitimité d’utilisation de telles applications pour la création d’un nouveau lien démocratique.

Elyze une application qui interroge

De nombreuses critiques ont émergé contre l’application Elyze, dénonçant les biais de l’algorithme. A ce titre, en cas d’égalité entre les candidats, Emmanuel Macron arrivait en premier par défaut, certains candidats avaient plus de propositions que d’autre.

Pris à partie, les créateurs de l’application ont expliqué que si l’actuel président arrivait le premier dans une égalité, c’était parce qu’il avait été inscrit le premier dans le code informatique. Aussi, les 15 candidats présents dans l’application ont été sélectionné grâce aux estimations d’intentions de vote.

Mathis Hammel, Tech Evangelist chez CodinGame, parrain de l’école de cybersécurité Guardia et expert en programmation, intelligence artificielle et cybersécurité, s’est introduit dans le code de l’application et a accepté de nous faire part de son analyse :

  • « Vous parliez lors de vos découvertes de code « open source », est-ce un réel problème qu’une application comme Elyze ne soit pas open source ?

À mon sens, ce genre d’application, des « Civic Tech », fait par des citoyens pour des citoyens à des fins de recommandations politiques, ont un vrai souci de transparence. Quand il y a un souci sur un algorithme qui dit plus ou moins à un million de français pour qui ils doivent voter en 2022, c’est là qu’il faut rendre des comptes et open sourcer l’algorithme pour que les gens se rendent compte du fonctionnement de l’application et comprennent l’algorithme au lieu de garder une boîte noire.

  • On vous entend parler lors de vos interventions de « transparence algorithmique », est-il possible d’atteindre une transparence totale notamment dans le cas d’Elyze ?

C’est très dur d’avoir une transparence algorithmique totale et parfaite, notamment à cause de biais humains. Même si l’algorithme était parfait, la sélection des programmes des candidats se fait par un humain, le choix des éléments de campagne aussi et l’on pourrait se faire influencer. Mais le fait de publier le code source de manière formelle ou didactique, sur la façon dont sont calculés les différents scores ou bien comment sont classés les candidats, sont des actions nécessaires. Il faut prouver que son application soit honnête et neutre par rapport à tous les candidats.

  • Concernant le fonctionnement de l’application, il y a une base de données qui contient les programmes des candidats mais également les données des utilisateurs stockées au même endroit c’est bien ça ?

Effectivement. Sur la partie base de données utilisateurs, cela a depuis été intégralement supprimé à la suite de soucis juridiques concernant la légalité de ce stockage, l’application ne collecte plus ces données-là.

  • Le cas d’une fuite de données est une menace potentielle ?

Oui tout à fait, une fuite de données c’est comme une revente de données, mais l’on ne sait pas qui récupère ces données et dans quel but. C’est pire.

  • Selon vous, la CNIL, par l’intermédiaire du RGPD notamment, offre-t-elle une réelle protection vis-à-vis des données ?

Selon moi, la CNIL protège très bien vis-à-vis des violations manifestes du RGPD comme en janvier dernier chez Elyze. Mais l’acte du citoyen n’est pas d’attendre que la CNIL soit en veille absolument partout à tout moment même si pour Elyze, j’aurais bien aimé qu’il se penche sur l’application plus tôt. Quand j’ai trouvé la faille et alerté sur les données personnelles stockées, j’ai publié le samedi dans la journée, le lundi suivant la CNIL a annoncé un audit d’Elyze.

  • Elyze n’est pas sans rappeler le scandale de Cambridge Analytica notamment par rapport aux élections américaines de 2016 et le vote du Brexit au Royaume-Uni, selon vous est-ce qu’Elyze présente un risque similaire d’influence politique ?

Cela aurait pu se produire sur Elyze en connaissant les intentions de vote de chaque utilisateur, savoir dans quel département, telle mesure, de tel candidat va être la plus populaire afin d’orienter ces meetings par exemple. C’était une base de données qui était très intéressante pour tous les candidats. Les concepteurs l’ont d’ailleurs rappelé, ils ont été approchés à plusieurs reprises pour des participations à l’application. Dans l’état actuel de l’application il n’y a plus ce genre de risque, elle ne collecte plus de données ni de statistiques générales, le seul risque concerne une fuite de données avant que les données n’aient été supprimées ou bien une sauvegarde du mois de janvier mais qui resterait donc partiel. Le traitement a suffisamment été bien fait pour se dire qu’il n’y a plus de risque sur l’application.

  • Et d’un point de vue technique, qu’est-il possible de faire afin de sécuriser au maximum ce genre d’application ?

Respecter la loi premièrement et ne pas collecter de données, faire en sorte que l’application ne soit là que pour des recommandations et non pas pour revendre des données éventuelles. On comprend aussi qu’il y a un besoin de rémunération, c’est un monde naissant qui doit faire ses preuves dans les années à venir, en 2027 ça sera plus gros. Il faut s’y intéresser maintenant avant qu’il ne soit trop tard.

  • Un mot de la fin ?

Un bravo aux concepteurs d’Elyze car même si leur application a été bugée et dangereuse, il y a eu une bonne correction du tir qui est louable. L’équipe était petite, pour un projet comme celui-là, il y a eu un bon rétablissement de la trajectoire qui est une bonne chose avant tout. »

Entre neutralité, souci d’informer et protection des données récoltées : le jeu d’équilibriste d’Elyze

En swipant à droite et à gauche, l’utilisateur donne son avis sur une question politique. Ce simple geste, à première vue anodin, traduit la circulation d’une information du fin fond de la conscience politique de l’utilisateur, vers le monde merveilleux du net. Un monde où la collecte de données à des fins de ciblage et de profilage est devenu la norme. Les échos des scandales tels que Cambridge Analytica, relatifs à l’exploitation des données personnelles récoltées sur les réseaux sociaux à des fins de microciblage, en vue d’influencer les intentions de vote des électeurs, se font toujours entendre.

Dans le souci de garantir les droits des personnes, le RGPD confère aux données relatives aux opinions politiques des personnes identifiées ou identifiables une catégorie spécifique : les données sensibles, lesquelles nécessitent des garanties supplémentaires, à la fois techniques et organisationnelles, notamment en matière de sécurité et de conservation.

S’agissant d’Elyze, les données traitées par cette application constituent des réponses par oui ou par non à des questions spécifiques, établissant un lien direct et précis entre la personne et ses préférences politiques. En exprimant de la sorte son opinion politique, l’utilisateur met à disposition des données qualifiées de meilleure qualité que les données brutes collectées sur Facebook ou Twitter par exemple. Tout processus de traitement à des fins de profilage ou de ciblage serait donc plus rapide et moins coûteux, d’où l’intérêt que pourraient porter certains organismes, aux données que l’application serait susceptible de conserver.

D’autre part, l’application s’adresse en grande partie à des jeunes de 18 à 30 ans, une partie des utilisateurs consiste en des primo votants ou des adolescents qui n’ont pas encore le droit au vote. En d’autres termes, l’application s’adresse à une catégorie sociale bien définie. L’analyse des données de réponses, même anonymisées, peut aboutir à l’identification de certaines tendances chez cette catégorie. Les enjeux relatifs à l’exploitation de ces données devraient donc être appréciés sur le long terme.

La récupération de données sensibles n’est pas la seule problématique soulevée par l’application Elyze. Comme souligné, Elyze s’adresse majoritairement à un public encore indécis vis-à-vis de son choix de vote. Ce public est peu formé à l’analyse politique. Ainsi, l’impact de l’application sur la décision d’un votant peut être bien réel : elle peut convaincre les « swing voters » ou encore manipuler les citoyens non politisés.

Si Elyze met en avant un candidat plutôt qu’un autre, cela peut influencer les choix du citoyen, et par conséquent le procédé démocratique qu’est le vote. Cependant ;

  • L’application ne présente pas l’ensemble des propositions des candidats. On peut alors se questionner sur le choix réalisé par les créateurs : sont-ils neutres ? Certains éléments peuvent être volontairement évincés ou à l’inverse mis en avant pour favoriser un candidat plutôt qu’un autre.
  • Elyze expose, dans ses annexes, les propositions de chaque candidat par paquet de trois. Cela peut empêcher un public non politisé de se rendre compte de la scission qu’il existe entre les différents programmes.

Si l’utilisateur base son vote sur le podium proposé par l’application, alors, le choix d’un candidat peut être biaisé. À plusieurs reprises les enjeux majeurs de cette application ont été soulignés. Sensibilité des données, problématique d’anonymisation des données, possibilité explicite de vendre les données à des tiers, problèmes de sécurité des données …

La collecte des données n’est pas un phénomène exclusivement moderne : cadastres, cartes marines, recensements de la population, les exemples ne manquent pas. Ce qui change aujourd’hui c’est la quantité massive de données récoltées, d’où le terme Big Data, ainsi que la capacité que nous avons à les traiter. Avec le développement du numérique, le progrès de l’intelligence artificielle et l’apparition de nouveaux métiers comme les Data Analysts, il est dorénavant possible d’extraire une quantité incommensurable de données, toujours plus précises et mieux exploitable.

Onepoint rappelle le principe incontournable du « security by design »

Nous pensons que la campagne de l’élection présidentielle 2022 a ouvert la voie à de nouvelles applications de sondage politique. A l’instar des problèmes rencontrés par l’application Elyze, la priorité est d’appliquer la méthode Privacy & Security by Design qui est une méthode clé opérationnelle qui répond aux obligations de conformité aux règlements de protection des données et aux exigences de sécurité des données.

Onepoint rappelle le principe incontournable du « security by design »

Quels sont Les 7 principes clés ?

  • Des mesures préventives et proactives,
  • Une protection implicite et automatique (by default),
  • Une intégration de la vie privée dans la conception des systèmes et au cœur des pratiques,
  • Une protection intégrale,
  • Une sécurité de bout en bout, durant toute la durée de la conservation des données,
  • Assurer la visibilité et la transparence,
  • Respecter la vie privée des utilisateurs.

Auteur : onepoint

beyond the obvious