Accueil > Ateliers > Ateliers 2020-2021 > eScriptorium : une plateforme d’applications web pour la transcription automatique de documents manuscrits ou imprimés

Ateliers Digit_Hum


Journées d’études sur les humanités numériques


Atelier 2020-2021
2 octobre 2020 / 8 octobre 2021
Salle Dussane | ENS - 45 rue d'Ulm 75005 Paris


Sciences de l’Antiquité et humanités numériques



eScriptorium : une plateforme d’applications web pour la transcription automatique de documents manuscrits ou imprimés
Peter Stokes et Benjamin Kiessling (UMR 8546 AOROC - CNRS/ENS/EPHE)

eScriptorium, dans sa forme finale, est destiné à être un outil pour l'ensemble de la chaîne de production des éditions numériques. Les principaux éléments actuellement mis en oeuvre à cette fin sont une méthode de transcription et d'annotation automatique pour le matériel manuscrit et imprimé par machine. Une attention particulière a été accordée à la réduction des hypothèses implicites sur le matériel à traiter, rendant accessible du matériel qui est habituellement hors de portée des méthodes d'apprentissage automatique, comme les documents historiques, les systèmes d'écriture mal desservis et les cas d'utilisation très spécifiques. Contrairement à de nombreuses autres plateformes, elle est totalement ouverte et prend en charge des interfaces standard (ALTO, PageXML, IIIF) pour l'importation et l'exportation. Non seulement les données restent la propriété de chaque utilisateur, mais également tous les artefacts des différentes méthodes d'apprentissage automatique de la plate-forme qui peuvent être utilisés indépendamment de toute installation particulière d'escriptorium, mais également en dehors d'escriptorium lui-même par le biais d'installations locales du moteur ROC Kraken. En tant que telle, la plate-forme s'intègre facilement dans une variété de workflows, des petits projets personnels des utilisateurs individuels à la numérisation à grande échelle dans des projets d'archives.