Existe-t-il des IA créatives ?

Dans Certains modèles de machine learning sont aujourd’hui capables de générer des images fictives d’un réalisme surprenant. Cet article est le premier d’une série de deux consacrés à ces modèles dit génératifs. Il décrit comment fonctionnent les deux principaux modèles utilisés pour créer ou modifier des images : les Variational Auto-Encoders (VAE) et les Generative Adversarial Networks (GAN). Plus largement, il aborde aussi la question de savoir en quoi consiste au juste leur « créativité ». Le second article sera consacré aux enjeux UX de ces modèles lorsqu’ils sont utilisés dans un contexte d’intelligence augmentée.

1. IA – après l’apprentissage, la création ?

Si l’IA désigne globalement les techniques qui visent à automatiser, un jour, l’ensemble des processus cognitifs humains, il faut bien se rendre à l’évidence que l’immense majorité des applications ne reposent aujourd’hui que sur quelques formes rudimentaires d’apprentissage.

L’apprentissage supervisé, qui présuppose la disponibilité d’exemples de référence pour lesquels on connaît la réponse souhaitée, et l’apprentissage par renforcement, qui consiste à optimiser une stratégie par interaction avec un environnement en vue de maximiser une récompense, en sont les deux formes les plus courantes.

Plus récemment, on a vu apparaître des applications du Deep Learning dans le domaine de la création artistique grâce aux modèles génératifs qui implémentent comme nous le verrons une forme simple d’apprentissage non-supervisé. Ainsi sait-on aujourd’hui visualiser avec Deep Dream les rêves (ou les cauchemars peut-être) d’un réseau de neurones, recréer un Rembrandt plus vrai que nature ou encore appliquer un style Van Gogh à n’importe quelle photo.

Le domaine « littéraire » n’est pas en reste puisque des réseaux de neurones récurrents sont désormais capables de rédiger des pastiches à la manière de Shakespeare. Enfin, sans parvenir pour l’instant à égaler Miles Davis, les réseaux de neurones se sont également essayés à l’improvisation jazz.

Bien que les réseaux génératifs profonds en soient à leurs premiers balbutiements, on pourrait dès à présent y consacrer un ouvrage entier. Notre objectif ici est simplement de répondre à la question figurant dans le titre de cet article.

Sans spéculations grandiloquentes, sans envolées lyriques, mais de manière argumentée, en nous appuyant sur une compréhension approfondie des mécanismes à l’œuvre dans les deux principaux modèles génératifs utilisés pour créer des images synthétiques réalistes.

Auteur : Pirmin Lemberger

Directeur scientifique