Traitement d’images, reconnaissance de formes et de signatures: classification des manuscrits égyptiens anciens

Name: Traitement d’images, reconnaissance de formes et de signatures: classification des manuscrits égyptiens anciens
Start: 2021-05-06T12:00:00+02:00
End: 2021-05-06T14:00:00+02:00

inscription

Atelier coanimé par Chloé Ragazzoli, Egyptologue et maîtresse de conférences HDR à Sorbonne Université, ainsi que Amir Nakib, Head of IA research & CTO de Vinci Autoroutes, accompagné de Nadiya Shvai, Senior data scientist chez Vinci Autoroutes

Cet atelier mettra en œuvre les approches les plus pertinentes abordées lors du premier atelier introductif “annotation d’images appliquée à l’égyptologie: classification de textes anciens par scribes” qui a eu lieu le 1er avril dernier.
Une des tâches des égyptologues consiste à examiner les styles individuels d’écriture pour rapprocher différents documents de la main d’un même scribe. Afin de faire avancer la reconnaissance des caractères et décodage des écritures anciennes, les algorithmes basés sur l’intelligence artificielle pourraient apporter de nouveaux résultats.

Programme prévisionnel:

Présentation des résultats
Expositions des différentes interprétations
Echanges sur les approches de détection de formes et de classification

Nos ateliers ont lieu en présentiel, il y a suffisamment d’espace dans nos locaux pour accueillir les participants, tout en respectant les gestes barrières (port du masque et distanciation). Un lien zoom est proposé pour ceux qui ne peuvent pas se déplacer.

Introduction au sujet :
Depuis 2019, l’Institut français d’archéologie orientale au Caire et Sorbonne Université mènent conjointement un programme de recherches (ÉCRITURES – Pour une archéologie et une anthropologie des écritures de l’Égypte ancienne) pour mieux comprendre les usages des différentes écritures égyptiennes et les acteurs impliqués. Les textes de la vie courante sont inscrits en hiératique, une cursive dérivée des hiéroglyphes.

Les outils de la paléographie permettent de comparer la forme des mêmes signes entre eux pour tâcher de reconnaître des textes qui pourraient avoir été tracés par la même personne. Mais de nombreuses caractéristiques sont à prendre en compte : la forme générale du signe, le nombre de traits, la taille, le dynamisme de l’écriture, la mise en page, la régularité. Le corpus considéré provient de l’époque des Ramsès (v. 1295-1069 av. J.-C.), au Nouvel Empire égyptien. Il comprend des ostraca provenant de Deir el-Medina, village des artisans de Pharaon et des papyrus provenant de différentes bibliothèques de scribes de l’époque. Le corpus a été annoté pour une classification par scribes et pour une détection basée sur deux signes fréquents.

Afin de faire avancer la reconnaissance des caractères et décodage des écritures anciennes, les algorithmes basés sur l’intelligence artificielle pourraient apporter de nouveaux résultats. Cependant, leur application pose un certain nombre de problèmes, qui ne sont pas encore résolu dans la discipline, à savoir : l’apprentissage dans le cas d’un volume de données très limité, la conception d’Architectures efficaces, la limitation du sur-apprentissage tout en conservant une performance élevée, la reconnaissance d’écritures non alphabétiques, le volume d’annotations nécessaires, ainsi que le clustering.

< All past workshops