Skip to content

Instructions Archival City

Alix Chagué edited this page Mar 25, 2021 · 1 revision

Dernière MàJ

Préparation des données

Structure des dossiers

Le scénario de transformation est construit en fonction de l'organisation des données dans les dossiers transmis. Par exemple :

dossier principal/
  - echantillon-Limb-eScriptorium/
    - AD075BI_PER232_0005_0003.xml
    - AD075BI_PER232_0005_0004.xml
    - AD075BI_PER232_0005_0005.xml
    - AD075BI_PER232_0005_1907-0003.jpg
    - AD075BI_PER232_0005_1907-0004.jpg
    - AD075BI_PER232_0005_1907-0005.jpg

⚠️ Gardez cette structure !

⚠️ L’appairage des XML et des images n'étant pas chose aisée, il faut éviter de traiter un dossier contenant plusieurs fois la même numérotation : ne pas avoir AD075BI_PER232_0005_1907-0003.jpg AD075BI_PER232_0005_1898-0003.jpg dans la même archive par exemple.

Format de l'archive

Il faut les documents sous la forme d'un .zip.

Noms des images à charger dans eScriptorium (après application d'Aspyre)

⚠️ Attention, il s'agit ici des noms de fichiers images tels qui devraient être avant de les importer dans eScriptorium, pas avant de faire tourner Aspyre dessus !

Lors de la transformation, Aspyre le contenu de //sourceImageInformation/fileName à partir des noms des fichiers images présents dans le ZIP.

Installation

(Aspyre 0.4 minimum !)

$ git clone https://github.com/alix-tz/aspyre-gt.git
$ cd aspyre-gt
$ virtualenv venv -p python3
$ source venv/bin/activate
(venv)$ pip install -r requirements.txt

Commande

(venv)$ cd aspyre
(venv)$ python3 run.py -i /path/to/archive.zip -sc limb -vp 45

Si vous ne spécifiez pas de chemin d'output, le programme vous indiquera où l'archive a été sauvegardée (normalement dans le même dossier que l'archive source)

L'option -vp permet d'ajuster la hauteur des baselines, car elles sont autrement placés au-dessus de la ligne, ce qui pose problème pour la génération des masques dans eScriptorium ensuite. A priori la valeur de 45 (pixels) permet de remettre la plupart des lignes à la bonne hauteur avec les données du projet Archival City, mais on peut en changer.


Résultat d'Aspyre sans l'ajustement de la hauteur des baselines:

Résultat d'Aspyre avec ajustement de la hauteur par 45 (-vp 45)