Niveau en Machine Learning
Connaissance de base
Intervenants
Cet atelier sera animé par :
Présentation de l’événement
Comment obtenir d’une IA qu’elle comprenne les informations sur un site web aussi bien qu’un humain ? Ce problème n’a pas encore trouvé de solution générique, alors qu’il est estimé que la moitié du trafic internet est effectué par des robots. Des solutions existent néanmoins d’un point de vue sectoriel. Benoît Galy, fondateur de l’aggrégateur immobilier Vizzit partagera son expérience accumulée pendant 4 ans pour développer la technologie sous jacente à l’aggrégateur Vizzit : le VizzitBot. Puis Eric Fenaux, consultant data-science présentera les nouveaux outils à base de graphe neural networks et de transformers envisagés pour la version 2 du scrapper Vizzit.
Traditionnellement, le scrapping d’un site se fait en annotant manuellement la localisation dans le HTML des informations d’intérêts (photos, prix, surface, etc…). Cette technique n’est pas scalable sur un grand nombre de sites, et nécessite une mise à jour manuelle à chaque changement d’un site. Vizzit a développé une approche entièrement non supervisée du problème qui donne de bons résultats. Mais cette approche s’appuie sur un fort feature engineering et voit sa complexité exploser pour arriver à 100% de qualité. La version 2 devra permettre ce passage à l’échelle et être robuste aux évolutions des sites. Les participants pourront partager leurs expériences et/ou connaissances sur des problèmes similaires.
Cet événement est réservé à nos membres, mais nous gardons quelques places pour ceux qui souhaiteraient découvrir le club. N’hésitez à vous inscrire vous serez sur liste d’attente et nous vous confirmerons votre participation 3 jours avant l’événement.
*Un ticket par participant
2311-Fenaux-Scraping