Le Transport Optimal, couteau suisse pour la Data Science
La théorie du transport optimal plonge ses racines dans l’histoire des mathématiques avec un problème formulé au 18ème siècle par Gaspard Monge qui se demandait comment déplacer un tas de sable en fournissant le moindre effort possible. Grace à une succession de progrès théoriques et, plus récemment, algorithmiques, cette théorie trouve aujourd’hui de nombreuses applications pratiques en data science. Elle permet tout à la fois de définir une notion géométrique et naturelle de distance entre deux distributions de probabilités et de « morpher » une distribution en une autre à moindre coût. Cet article est une introduction modérément technique au sujet et s’adresse prioritairement aux data scientist.