IA générative : quelle forme aura-t-elle demain ?

Lors de la 6e édition de MTL Connecte, la Semaine Numérique de Montréal qui a eu lieu du 15 au 18 octobre 2024, j’ai eu le privilège de participer à une table ronde autour du thème « IA générative : Réinventer les Outils et Réévaluer les Stratégies ».

Ce fut l’occasion de discuter de l’impact de l’Intelligence Artificielle générative sur les outils numériques et les modèles d’affaires, en explorant ses effets sur l’automatisation, la personnalisation et la création de contenu, et de partager avec vous l’approche que j’ai choisie pour comprendre le cheminement de l’IA générative.

 

 

J’ai trouvé le thème de l’événement, la métamorphose, particulièrement bien choisi et adapté à l’IA générative : Méta (« après ») et morphose (« la forme »). En intelligence artificielle, pour concevoir et implémenter des projets depuis une quinzaine d’années, j’ai vu quatre grandes formes d’IA au fil des années (4,5 pour être précis). Je vous propose de découvrir ces 4,5 formes qui permettent de bien comprendre l’évolution de l’IA.

À noter que j’avais déjà présenté ce qui a mené à l’IA générative dans différents événements, en m’appuyant sur des concepts différents et en utilisant alors d’autres terminologies.

La notion de forme m’a vraiment sauté aux yeux lors de cette conférence et permet de bien comprendre l’avènement de cette technologie.

La forme descriptive

Dans les premiers projets, il s’agissait essentiellement d’analyser le passé pour en informer l’humain. Pas forcément de l’IA au sens « apprentissage profond », mais plutôt une boite à outils de méthodes et techniques pour apprendre et comprendre de grands ensembles de données.

Cela impliquait souvent l’utilisation de techniques telles que les statistiques descriptives, le clustering (K-means, DBSCAN…), du PCA, et un peu de réseaux de neurones (CNN, RNN, LSTM, etc). Après ces algorithmes, le retour vers l’utilisateur final se faisait en général via des outils de visualisation de données (Matplotlib, Seaborn, Tableau, Power BI…) qui permettaient de créer des rapports, des graphiques et des tableaux de bord, de plus en plus interactifs et dynamiques.

Cette approche « descriptive » permettait de transformer des données brutes, souvent issues de datawarehouses ou datamarts, en informations compréhensibles et utilisables par les décisionnaires.

La forme prédictive

Au fil de l’acculturation des utilisateurs à la science des données, aux outils toujours plus interactifs, à de meilleurs algorithmes et à une plus grande puissance de calcul disponibles, la forme prédictive permettait d’analyser le passé pour prédire le futur (le ou les futurs possibles), et en informer l’humain.

On rajoutait aux interfaces les résultats de prédictions ; qu’il s’agisse de prédiction de fraude, de rendements agricoles, d’achats en magasin. En plus des rapports « descriptifs », de visualisations, il y avait un besoin d’interaction supplémentaire sur les informations fournies à l’utilisateur ; pouvoir jouer avec les paramètres, faire des scénarios what-if, des séries temporelles etc. les interfaces et outils se sont complexifiées pour l’humain, puisqu’il fallait présenter les données passées (certaines) et les données prédites (incertaines).

Parmi les points clés pour assurer une bonne compréhension de cette forme, était de fournir des indices de confiance conjointement aux prédictions, et de fournir des moyens de jouer avec les paramètres pour pouvoir expliquer l’impact d’un paramètre sur la prédiction.

Cette forme prédictive apportait plus de valeur que la forme descriptive mais était plus complexe surtout dans l’explicabilité et l’interprétabilité des prédictions.

La forme prescriptive

Une fois les prédictions faites, il apparait naturel de vouloir prendre des décisions sur les enseignements. Dans un modèle prescriptif, l’algorithme analyse le passé, prédit le futur, mais indique également ce qui devrait être fait pour influer sur ce futur, c’est-à-dire éviter (ou au contraire augmenter) une prédiction. Par exemple : prescrire les problèmes de qualité sur des lignes de production, ou augmenter l’impact d’une campagne marketing sur les réseaux sociaux.

Ce sont les projets les plus complexes que j’ai pu implémenter, des points de vue :

  • Techniques (compte tenu du fait que si la prescription est efficace, on évite la prédiction, donc la prédiction n’apparait plus dans les données sources… et ne peut plus être prédite),
  • Qu’interactive avec l’utilisateur (qui doit appréhender les données, les prédictions, la prescription, et peut rapidement se perdre entre les informations certaines et incertaines, et la masse d’informations à sa disposition).

Pour utiliser cette forme prescriptive les interfaces se sont encore complexifiées pour permettre d’avoir la description, la prédiction, et la prescription.

La forme générative

Dernière forme, que nous sommes en train de nous approprier collectivement depuis quelques années. Des modèles qui ont acquis tellement de concepts différents, et qui ont un tel contexte à disposition, que l’on change de paradigme.  Il ne s‘agit plus d’analyser le passé, de prédire ou de prescrire. Il s’agit pour l’humain d’interagir en direct avec un modèle.

Au niveau des interfaces, c’est une révolution car les outils de visualisation de données sont délaissés au profit d’interfaces de type chatbot (ou voix). L’interaction et la réactivité deviennent cruciales pour l’adoption de cette forme générative.

 

Je vous ai parlé de 4,5 formes…

La forme… sans forme

Le grand défi du moment pour cette IA générative est de passer elle-même d’un mode où elle est clairement identifiée comme telle par un utilisateur (par exemple lorsqu’on accède à un agent conversationnel), à un mode où cette IA générative est intégrée dans une interface.

Comment peut-elle s’effacer, devenir transparente, de manière à faire rayonner le produit ou le service fourni, plutôt qu’un simple modèle.

Le nouveau changement de forme de l’IA est bien là

Nous avons toutes les cartes en main techniquement pour pouvoir proposer des outils qui soient malléables et qui s’adaptent et se spécialisent à une multitude de contextes spécifiques utilisateurs.

Pour le dire de manière provocatrice : « Si on doit discuter avec une IA, c’est que l’outil est mal conçu ». L’outil fourni à l’utilisateur ou au client devrait s’adapter pour que l’on n’ait pas conscience de converser avec un modèle.

Cela va certainement redéfinir les interfaces graphiques à venir, qui pour l’instant sont limitées à l’adaptation du contenu, mais pas encore du contenant. Ce sera la 5e forme de l’IA : ambiante et proactive.

Auteur

  • Philippe Harel

    Leader Data.IA