ATELIER - RÉSEAUX BAYÉSIENS : APPRENTISSAGE STATISTIQUE, EXPLICABILITÉ ET CAUSALITÉ (PARTIE 1)

Cet atelier a été animé par Pierre-Henri WUILLEMIN et Gaspard DUCAMP, du laboratoire Lip6.

Descriptif
Les réseaux bayésiens forment un outil de modélisation probabiliste. Ils ont la particularité d’inclure et de s’appuyer sur une représentation graphique aussi bien pour maximiser la compacité de la représentation et que pour minimiser la complexité des calculs. Par ailleurs, cette représentation graphique encode des propriétés qualitatives du modèle, permettant une interaction à la fois aisée et riche avec les experts métiers. Enfin, il existe des algorithmes d’apprentissages statistiques de tels modèles qui amènent donc à un spectre de large d’utilisation de tels modèles. Les réseaux bayésiens sont par ailleurs le support d’une théorie de la causalité probabiliste basée sur un nouveau type de conditionnement par ‘intervention’. Ce cadre dit du « do-calculus » permet une analyse qui montre et peut corriger le risque d’erreur lors de l’utilisation de modèles prédictifs classiques.

Nous avons vu durant cette première partie, à travers d'exemples construits sur la plateforme aGruM, comment:
– les réseaux bayésiens structurent l’information probabiliste sous forme d’un graphe-“boite blanche”.
– les réseaux bayésiens rendent possible le calcul de requêtes probabilistes complexes, appelé inférence bayésienne.
– les réseaux bayésiens peuvent être appris à partir d’un dataset.

La semaine prochaine, lors d'une seconde session, nous verrons :

– un dataset (par exemple Lending Club) qui consiste à apprendre de manière supervisée le statut d’un emprunt bancaire en fonction des paramètres de l’emprunteur et de l’emprunt). Nous verrons comment les BN peuvent calculer cette prédiction suite à un apprentissage supervisé, et ce qu’ils apportent en plus des modèles classiques (réseaux de neurones, arbre de décision….)

– la causalité entre facteurs, qui est au cœur de problèmes majeurs de santé publique ou de société. Jusqu’à récemment, les statistiques ne permettaient de calculer que leur degré de corrélation. On verra comment le do-calculus proposé par Judea Pearl associé aux BN donne enfin une mesure de la causalité liant des facteurs déterministes ou aléatoires.

Si vous souhaitez en savoir plus sur ce qui a été abordé durant cet atelier, n'hésitez pas à vous regarder la rediffusion de ce dernier ainsi que le code présent sur notre Github.

Atelier réalisé le 17 Juin 2021

Share