Data Gouv – La qualité des données au service des produits IA

Intervenants
  • Imane Lafnoune, Lead Data Engineer & Data Quality,, Sicara
  • Nicolas Salles, Chief Data Officer, OFI Invest

 

Points clés abordés

 

  • Des études (cf. slides) estiment à 20% la perte en chiffre d’affaires, due à des données erronées, pour les entreprises (l'économie américaine estime cela à 3,1 milliards de dollars par an aux US). 
  • Les problèmes de qualité de données sont souvent des problèmes de qualité des sources ! Les processus d’ingestion, transformation, exploitation peuvent générer des problèmes de qualité, mais ils sont généralement sous-contrôle et maîtrisés, et héritent de la qualité des données produites ou importées en entrée.
  • La qualité des données est à regarder par cas d’usage métier en impliquant producteurs et utilisateurs (souvent les mêmes !), qui doivent être en responsabilité de la qualité
  • La démocratisation des applications d’IA expose la qualité des données à tous dans l’entreprise et peut générer une perte de confiance des utilisateurs (c'était déjà le cas de la BI, mais c’est démultiplier avec l’IA) et un coût important pour regagner cette confiance
  • L’IA peut apporter des réponses à l’amélioration de la qualité des données (certains ont déjà commencé !), mais principalement dans la détection des données erronées et non dans la correction, qui reste un sujet très complexe du fait des impacts que cela peut avoir dans les systèmes utilisateurs !

 

 

Vous trouverez les slides qui ont été présentés lors de cette soirée très collaborative.

 

Merci à tous et à bientôt sur un de nos  futurs ateliers !
Share