Loading Events
  • This event has passed.
1 Apr 2021 12:00 - 14:00
datacraft Paris –
4 Place Jussieu
75005 Paris, France

Share

Annotation d’images appliquée à l’Egyptologie : classification de textes anciens par scribe

Atelier coanimé par Chloé Ragazzoli, Egyptologue et maîtresse de conférences HDR à Sorbonne Université, ainsi que Amir Nakib, Head of IA research & CTO de Vinci Autoroutes, accompagné de Nadiya Shvai, Senior data scientist chez Vinci Autoroutes

Une des tâches des égyptologues consiste à examiner les styles individuels d’écriture pour rapprocher différents documents de la main d’un même scribe. Afin de faire avancer la reconnaissance des caractères et décodage des écritures anciennes, les algorithmes basés sur l’intelligence artificielle pourraient apporter de nouveaux résultats. Cet atelier introductif sera suivi d’un deuxième atelier (le 6 mai) qui mettra en œuvre les approches les plus pertinentes abordées lors de cet atelier.

Au programme :

  • Présentation du dataset
  • Formulation de la problématique
  • Présentation des choix d’annotations
  • Echanges sur les approches de détection de formes et de classification

Introduction au sujet : 
Depuis 2019, l’Institut français d’archéologie orientale au Caire et Sorbonne Université mènent conjointement un programme de recherches (ÉCRITURES – Pour une archéologie et une anthropologie des écritures de l’Égypte ancienne) pour mieux comprendre les usages des différentes écritures égyptiennes et les acteurs impliqués. Les textes de la vie courante sont inscrits en hiératique, une cursive dérivée des hiéroglyphes.

Les outils de la paléographie permettent de comparer la forme des mêmes signes entre eux pour tâcher de reconnaître des textes qui pourraient avoir été tracés par la même personne. Mais de nombreuses caractéristiques sont à prendre en compte : la forme générale du signe, le nombre de traits, la taille, le dynamisme de l’écriture, la mise en page, la régularité. Le corpus considéré provient de l’époque des Ramsès (v. 1295-1069 av. J.-C.), au Nouvel Empire égyptien. Il comprend des ostraca provenant de Deir el-Medina, village des artisans de Pharaon et des papyrus provenant de différentes bibliothèques de scribes de l’époque. Le corpus a été annoté pour une classification par scribes et pour une détection basée sur deux signes fréquents.

Afin de faire avancer la reconnaissance des caractères et décodage des écritures anciennes, les algorithmes basés sur l’intelligence artificielle pourraient apporter de nouveaux résultats. Cependant, leur application pose un certain nombre de problèmes, qui ne sont pas encore résolu dans la discipline, à savoir : l’apprentissage dans le cas d’un volume de données très limité, la conception d’Architectures efficaces, la limitation du sur-apprentissage tout en conservant une performance élevée, la reconnaissance d’écritures non alphabétiques, le volume d’annotations nécessaires, ainsi que le clustering.