Données et IA

Les économistes parlent de l’intelligence artificielle comme d’une technologie à usages multiples, au même titre que l’électricité ou l’automobile. L’intelligence artificielle doit pouvoir se mettre au service d’un monde en profonde mutation pour relever les défis économiques, sociétaux et environnementaux.

La révolution des données est en marche

Chaque révolution industrielle tire son origine d’une source d’énergie. Celle que nous connaissons aujourd’hui ne se fonde ni sur la vapeur, ni sur l’électricité, ni sur le moteur à explosion, mais bien sur la donnée. Nous n’en parlons plus au pluriel d’ailleurs, mais avec un article défini générique qui inclut toutes les données, tant ces dernières sont protéiformes.

Si la vapeur a permis la communication des hommes, par train ou bateau principalement, et des savoirs, par la presse rotative; si le moteur à explosion a relié entre eux les continents, a mécanisé l’agriculture et a rendu les travailleurs mobiles; si l’électricité a apporté l’énergie en continu sur tous les sites, entraînant dans son sillage l’électronique, la microélectronique et l’informatique; la donnée, quant à elle, ouvre la perspective d’une industrialisation du savoir et des services.

Ainsi, après les secteurs secondaires et primaires, c’est au secteur tertiaire de bénéficier de sa révolution industrielle. Pour l’essentiel, l’économie occidentale est une économie de services, et la donnée qu’elle a produite pendant des décennies, dorénavant stockée, traitée et distribuée sous une forme raffinée, contribue à renforcer cette économie. Les femmes et les hommes peuvent se consacrer à d’autres tâches.

Beaucoup de chemin a toutefois été parcouru pour en arriver à cet état de fait. L’électrification de nos sociétés a bien été l’affaire de plusieurs décennies, elle aussi, à l’aube du 20e siècle.

Trois défis se posent aujourd’hui

Premier défi : l’usage, ou plutôt les usages. Les données permettent de fournir une représentation du monde, de visualiser le réel ou de l’anticiper, de raconter une histoire étayée de chiffres ou de faits. La discipline cherche à construire en même temps les meilleurs indicateurs possible et leur représentation narrative.

Prédire, anticiper, comprendre, lire, entendre et finalement aider tous les agents économiques qui manipulent le savoir… telle est la promesse. Les capacités sont en la matière de plus en plus puissantes, qu’il s’agisse de visualisation ou d’algorithmes. Ainsi, naviguer dans des données pour en découvrir la topographie et le sens n’a jamais été aussi accessible. De même, la force de l’analyse prédictive repose sur des algorithmes, longtemps théoriques, désormais activables par les capacités de calcul mises à la portée de presque tout le monde.

L’analyse prédictive suppose non seulement que les données sont disponibles et exploitables, mais aussi que ceux qui les manipulent, ingénieurs ou analystes, connaissent les activités possibles. Avec les usages, ce sont donc une culture et une compétence qui sont attendues.

Second défi : Naturellement, les fonctions de visualisation et de prédiction doivent s’appuyer sur une maîtrise sans faille des données, depuis leur repérage jusqu’à leur mise à disposition aux fins d’utilisation.

En effet, les données produites sont pour la plupart brutes. La collecte et le contrôle de ces données sont une condition préalable essentielle à leur utilisation future. Au-delà, il s’agit d’imaginer les usages de ces données, parfois même avant leur production.

Les données sont porteuses d’un sens qui les dépasse lorsqu’elles sont mises en perspective les unes par rapport aux autres. Elles préexistent à leurs usages, mais peuvent aussi être conçues pour une finalité spécifique. Elles doivent donc faire l’objet d’une stratégie opérationnelle précise, qui reflète la stratégie de l’entreprise.

En termes simples, tout agent économique devrait s’interroger et répondre à la question :« Quelle entreprise axée sur les données ai-je l’ambition d’être? ». De la réponse à cette question dépendra la trajectoire qui permettra à l’entreprise de calibrer les moyens consacrés à la réalisation de son ambition. Mais comment mettre à l’échelle ces ressources?

Troisième défi : l’industrialisation. La révolution dont nous parlons est bien industrielle. Comme la source d’énergie peut être captée de manière massive et généralisée, elle peut être mise au service d’une chaîne de production entière. C’est cet aspect massif et total qui rend la révolution possible.

Dès lors se pose la question de l’inclusion d’un processus de production dans une dynamique plus vaste. L’industrie nouvelle, liée à la source d’énergie, n’est pas une filière parallèle à d’autres plus anciennes. Elle vient bousculer ces dernières de façon orthogonale. À titre d’exemple, l’apparition de la filière électrique ou pétrolière n’a pas eu comme seule conséquence la création d’un réseau de distribution, de câbles et de compteurs électriques dans un cas, ou de stations-service dans l’autre. Elle a plus largement contribué à remodeler l’ensemble des secteurs grâce à la motorisation électrique, l’électronique et l’automobile.

L’industrialisation en matière de données comporte trois étapes clés :

• Acquisition des données : comment les recueillir de manière industrielle?

• Traitement : comment développer de nouveaux utilisations et les intégrer dans la production en continu et à une cadence suffisante?

• Exposition : comment restituer de manière industrielle l’information et le savoir créés à l’endroit où ils doivent être consommés?

S’engager sur la voie d’une « organisation axée sur les données » doit se faire par le biais d’une stratégie appropriée et de solutions efficaces. Accompagner cette transformation de bout en bout auprès des marchés européens, américains et asiatiques est indispensable. Cet accompagnement vise à construire et à fournir des services améliorés d’intelligence artificielle qui révèlent la pleine puissance des « données ».

Certaines problématiques propres à la donnée, sous tous ses aspects, demandent un accompagnement clairvoyant. Il aura pour objectif de contribuer à transformer l’économie, de développer l’intelligence des données et de relever les défis des entreprises.

La responsabilité sociale et environnementale au coeur de la gestion des données

Enfin, un dernier point ne peut être ignoré : puisque les données et l’intelligence artificielle transforment les sociétés et le monde, il est de notre devoir à tous de mettre ces technologies à usages multiples au service d’une révolution industrielle durable et éthique. Dans ce domaine également, les promesses sont fortes et la responsabilité est immense. Bien entendu, l’intelligence artificielle est d’ores et déjà un vecteur d’optimisation qui se met au service des places intelligentes. Par exemple, elle contribue à limiter les déplacements (charges maximales, itinéraires les plus courts selon la circulation, etc.). Toutefois, le défi dans ce domaine va au-delà de l’utilisation.

D’une part, les manipulations de données que nous effectuons doivent être frugales, à faibles émissions de carbone et socialement responsables. À l’heure où le stockage des données semble incontournable, il est indispensable de ne pas encombrer les serveurs de données inutiles. De même, l’annotation ou l’indexation des données – cette technique rudimentaire d’annotation humaine d’un élément numérique qui précède l’apprentissage machine – ne doit pas faire émerger de nouvelles précarités structurées pour produire à moindre coût les bases d’apprentissage de nos machines.

D’autre part, l’apprentissage machine est une responsabilité qui restera humaine pendant un certain temps et qui doit donc nécessiter toute notre attention pour que le meilleur de l’humanité puisse être mis à son service. Les algorithmes, de manière simplifiée, sont entraînés par l’humain, comme s’ils étaient dressés. C’est par cet enseignement qu’ils peuvent accomplir telle ou telle tâche cognitive : reconnaître une intention dans une expression en langage naturel, optimiser un trajet ou suggérer la nécessité d’effectuer un contrôle. Pour tous ces exemples, notre devoir est de permettre aux algorithmes de refléter notre humanité. Il convient de favoriser les décisions écologiques (en ce qui a trait notamment au transport) et les décisions équitables (dans le cas des algorithmes de commande, qui seraient fondés sur des critères d’apparence physique ou vestimentaire plutôt que sur le comportement).

Aborder la problématique des données sans s’attaquer à tous les défis posés n’apportera pas la valeur attendue. Pour ne pas être incantatoire, la stratégie en matière de données doit d’emblée tenir compte de la perspective de l’industrialisation. Malheureusement, l’intelligence artificielle restera artificielle, abstraite et factice si l’application à grande échelle n’est pas envisagée dès les premiers développements, avec tout ce que cela comporte sur les plans du pragmatisme et de l’éthique.