Difficulté :
** : Bonnes connaissances en ML/Data/IA et compétences de base en Python
Prérequis techniques :
Ordinateur portable
Intervenants :
Ugo Tanielian, Machine Learning Researcher, Criteo
Présentation de l’atelier :
L’année 2022 a été riche pour la communauté Computer Vision, avec le succès impressionnant des modèles de diffusion. On a vu en quelques mois les réseaux sociaux être envahis d’images générées par tour à tour: DALLE2 (OpenAI), Imagen (Google), Stable Diffusion (RunWayML), et enfin MidJourney. Si le succès de ces modèles génératifs repose sur l’exploitation d’énormes ensembles de données avec des milliards d’échantillons (initiative LAION) et le déploiement de nouveaux réseaux de neurones toujours plus profonds tels que les Transformers, il reste très important de bien comprendre comment fonctionnent ces modèles génératifs.
L’idée de cet état de l’art est donc de retracer l’évolution des modèles génératifs depuis l’apparition des GANs en 2014 jusqu’aux récents modèles de diffusion.
La présentation (environ 1h15-30) sera suivie d’une courte mise en pratique qui se concentrera sur l’utilisation des GANs et des modèles de diffusion.
Etat de l’art des approches algorithmiques :
Liste des différentes approches présentées:
– GANs (Generative Adversarial Networks)
– VAEs (Variational Autoencoders)
– Normalizing Flows
– Score-based models
– Diffusion models
Déroulement de l’atelier :
14h – 15h30 : panorama et évolution des modèles génératifs pour l’image
15h30 – 17h00 : mise en pratique !