Les modèles de deep learning supervisés sont très efficaces pour modéliser des phénomènes du quotidien pour lesquels nous ne disposons pas d’équation déterministe ( traitement du langage naturel, détection d’objets, recommandations,…) mais ils sont très gourmands en données, notamment en annotations. Annotations dont nous ne disposons pas forcément sur le terrain et qui peut-être très couteuse à récupérer.
Il est de plus en plus courant de chercher à développer des modèles faiblement supervisés en générant des annotations à partir de données externes (Wikipedia, Wikidata,…).
Dans cet atelier nous parlerons des méthodes de génération d’annotations à partir de sources externes ( supervision distante ) et nous explorerons les méthodes algorithmiques introduites dans les modèles d’apprentissage profond dans la littérature pour ne pas sur-apprendre le bruit propagé dans les annotations à cause de l’annotation distante.
Plan de l’atelier :
– 9h30 – 10h30 : Introduction à l’annotation distante.
– 10h30 – 12h : Annotation distante, cas pratique.
– 14h – 17h : Modèles faiblement supervisés.
Atelier présenté par Maya Sahraoui, doctorante à Sorbonne Université