Le mécanisme d’attention en IA
Lorsque nous regardons une scène ou une image pour comprendre ce qui s’y déroule, nous focalisons instinctivement notre attention sur certains objets, certaines personnes ou certaines actions car notre expérience nous a appris que c’est là que se trouve l’essentiel de l’information. Des systèmes de traduction automatique ou des systèmes de description d’images parviennent aujourd’hui à exploiter un simulacre de ce mécanisme pour améliorer considérablement leurs performances. On l’appelle le mécanisme d’attention (MA). Dans certains cas le MA apporte par ailleurs une aide appréciable à l’interprétabilité de modèles prédictifs jusque-là considérés comme des boites noires opaques. L’objectif de cet article pédagogique est de présenter comment fonctionne le MA dans deux contextes évoqués : traduction automatique et description d’image. Au-delà de ces deux cas particuliers et des gains de performances et d’interprétabilité nous examinerons brièvement l’hypothèse selon laquelle le MA pourrait jouer un rôle central en IA.