Atelier animé par Adrian Ahne, Epiconcet
Les données des médias sociaux, comme Twitter, offrent une opportunité unique d’étudier des données en temps-réel qui ne sont pas disponibles dans un cadre clinique traditionnel. Nous avons commencé à collecter des tweets liés au diabète en mai 2017 sur la base d’une liste prédéfinie de mots-clés et avons rassemblé depuis plus de 30 millions de tweets. Dans la présente étude, nous visons à identifier les associations causales possibles liées au diabète dans ces tweets, en mettant particulièrement l’accent sur les associations de détresse liées au diabète. La détresse diabétique regroupe tous les facteurs psychologiques, tels que l’anxiété, la peur, le stress, les émotions, liés à la gestion quotidienne de la maladie. Nous visons à identifier de nouveaux facteurs de risque potentiels pour le diabète et la détresse liée au diabète et à caractériser les possibles paires de cause-effet liées au diabète afin de mieux comprendre la maladie, ses relations avec différentes entités et de décrire les préoccupations et les inquiétudes liées au diabète. partagé par des personnes sur Twitter.
Programme & Discussion:
Présentation NLP (BERT, Transformers) & Active learning & Causality in text data
Présentation cause – effet dataset
Pre-training et nettoyage des données
Identification association causal & Optimisation