26 février 2020

3min

Comprendre les textes grâce à l’intelligence artificielle

Le traitement automatique du langage (TAL) est une branche importante de l’intelligence artificielle dont l’objectif est de parvenir à « comprendre » et à analyser des textes afin d’en extraire des connaissances sans intervention humaine. Les champs d’application sont à la fois très variés et très vastes (traduction instantanée en plusieurs langues, commandes vocales, agents conversationnels, traduction et résumé automatiques, analyse de CV, veille économique…).

La genèse de l’ouvrage

« Fin 2018, j’ai découvert avec surprise et admiration les travaux de recherche fondamentale menés par Google qui ont contribué à révolutionner le TAL (ou NLP en anglais pour Natural Language Processing) par l’introduction de nouvelles architectures de réseaux de neurones et les avancées en matière de techniques d’apprentissage artificiel.

Impatient de décortiquer les trouvailles à l’origine de ces prouesses, j’ai alors engagé une collaboration avec Thomas Scialom, un jeune chercheur chez ReciTAL (une startup parisienne spécialisée en TAL), dans le but de rédiger un article sur l’état de l’art en NLP. Nous l’avons intitulé « Deep Transfer Learning – Le langage naturel à l’aube d’une révolution ? ».

Dans la foulée, un second article intitulé « L’art Difficile de la Conversation Artificielle » consacré aux agents conversationnels avancés est venu compléter le premier. Suite à ces deux publications François-Régis, un ami de longue date expert en linguistique et CEO de Proxem m’a alors contacté pour me proposer conjointement un livre d’introduction, en français, sur le traitement automatique du langage.

J’ai immédiatement accepté avec enthousiasme trouvant là l’occasion de partager ma compréhension de ces avancées fascinantes de l’IA auprès d’un public plus large. »

A qui s’adresse cet ouvrage

Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des technologies de traitement automatique des langues, notamment celles d’analyse sémantique et de fouille de textes (text mining).

Il est destiné à tous ceux qui doivent faire face à la nécessité de gain en efficacité et en rapidité de traitement de l’information sémantique, par le biais du TAL (traitement automatique du langage). Il sera ainsi précieux pour les data scientists, DSI, chefs de projet et consultants qui souhaitent développer des solutions d’analyse des textes pour en extraire de l’information.

Ce livre présente un large panorama de cas d’usages. Pour les curieux, il détaille également les technologies sous-jacentes, allant des classiques systèmes symboliques aux dernières avancées du machine learning et du deep learning.

Combinant la théorie et la pratique, il présente :

  • Des applications du traitement du langage.
  • Les bases de la linguistique informatique.
  • Des formalismes de représentation du sens.
  • Des principales tâches de traitement du langage.
  • Des modèles récents de deep learning appliqués au NLP.
  • L’organisation typique d’un projet de ce type.

Le lecteur y trouvera donc non seulement l’état de l’art technologique en matière de TAL mais aussi des cas d’usage documentés permettant d’entrevoir le potentiel de cette technologie qui n’en est qu’à ses balbutiements.

Pour en savoir plus sur ce sujet fascinant, découvrez le nouvel ouvrage « Le traitement automatique de langues » par François-Régis Chaumartin, fondateur de Proxem, et Pirmin Lemberger, data scientist et chercheur chez onepoint. Pirmin est spécialiste du Machine Learning. Il s’intéresse actuellement au TAL et plus généralement aux questions scientifiques et mathématiques liées à l’IA.