Atelier coanimé par Nathan Noiry et Yannick Guyonvarch, post doctorants, Télécom Paris.
L’exploitation des données massives a permis de développer des algorithmes d’intelligence artificielle performants dans de nombreux domaines (imagerie médicale, traitement automatique du langage,…). Cependant, cette performance repose de manière cruciale sur la qualité des données utilisées lors de la phase d’apprentissage des algorithmes. La notion de biais des données, qui correspond à une inadéquation entre les données d’entraînement et de test, n’est pas sans conséquence et doit être prise au sérieux. Typiquement, la sous- ou sur-représentation d’une certaine frange de la population peut mener à des prises de décision discriminatoires.
Dans cet exposé, Nathan et Yannick commenceront par éclaircir cette notion de biais qui recouvre différentes réalités.
Ils poursuivront en expliquant le processus de formation des biais et en donnant quelques outils pour les détecter.
Dans une dernière partie, ils présenteront une nouvelle méthode de correction des biais et l’illustreront sur des données simulées.
Nos ateliers ont lieu en présentiel, il y a suffisamment d’espace dans nos locaux pour accueillir les participants, tout en respectant les gestes barrières (port du masque et distanciation). Un lien zoom est proposé pour ceux qui ne peuvent pas se déplacer.