
- This event has passed.
DONNEES SYNTHETIQUES : METHODES DE GENERATION ET LIMITES
Atelier animé par Gilles Essoki & Aymeric Floyrac, Health Data Hub
Description
Certaines bases de données sont particulièrement complexes à manipuler, voire inaccessibles pour le datascientist (pour des raisons, par exemple, d’autorisations). Disposer de données synthétiques, c’est-à-dire de données semblables aux données réelles mais générées aléatoirement, permet au datascientist de développer des scripts et d’acquérir une maîtrise de la base sans jamais l’avoir vue.
Programme
- Introduction: les données synthétiques, définition et intérêt
- Comment créer des données synthétiques?
- première approche: sans avoir accès à la base de données réelle
- deuxième approche: les problèmes de confidentialité, l’avatarisation
- troisième approche: les méthodes de deep learning (réseaux adverses génératifs, autoencodeurs variationnels)
- Conclusion: choisir la meilleure approche et savoir en identifier les limites
Pré-requis
- Notions de deep Learning
- Notions de Python
Cet événement est labellisé “Paris AI week”.
