Restauration numérique de documents historiques

Restauration numérique de documents anciens

Exemples visuels d’images de documents en couleur : Image dégradée en entrée (rangée du haut), image restaurée à l’aide de la méthode proposée (rangée du bas). Crédit : Hanif et al., 2023, PLOS ONE, CC-BY 4.0 (creativecommons.org/licenses/by/4.0/)

L’une des meilleures façons d’en apprendre davantage sur une période historique est de converser avec les personnes qui l’ont vécue. Parler avec des gens d’un passé lointain est très unilatéral, car ils sont généralement morts et ont cessé d’écouter il y a longtemps. Cependant, ils en disent long si vous avez la patience d’écouter, ou plutôt de lire ce qu’ils disent dans des lettres, des journaux intimes et des post-it primitifs sans dos collant.

Un groupe international d’informaticiens d’Italie, du Royaume-Uni et du Pakistan s’est associé pour ressusciter les morts des écrits qui ont été dégradés par le temps en développant une méthode assistée par ordinateur pour remettre virtuellement les documents dans un état plus lisible et déchiffrable. Dans leur article de recherche, “Restauration et analyse du contenu des manuscrits anciens via la segmentation basée sur l’espace colorimétrique”, publié dans la revue PLOS ONEl’équipe détaille la méthode et les résultats expérimentaux de leur technique de restauration numérique.

Nous avons une idée des civilisations anciennes à partir de leurs écrits, à la fois triviaux et profonds. L’écriture cunéiforme sumérienne sur des tablettes d’argile révèle des transactions marchandes vieilles de 4 000 ans, des calculs géométriques et de la poésie détaillant la chute d’une grande ville. S’ils avaient été écrits sur du papier et non sur de l’argile, nous ne les aurions probablement pas aujourd’hui.

Nous avons des historiens qui écrivent sur des événements anciens, car ils vivaient eux-mêmes dans ce qui est aujourd’hui la Grèce antique. Nous avons des lettres de soldats dans chaque conflit majeur au cours des quatre cents dernières années, une histoire écrite de la plupart des événements majeurs ou même mineurs depuis la révolution industrielle, et tout cela sur du papier susceptible de vieillir et de se dégrader.

Il y a un vide mineur dans le dossier vers la fin des années 1980, car les gens utilisaient des disquettes pour stocker des documents importants pour les jeter tous quelques années plus tard – heureusement, rien d’important ne s’est produit pendant ces années.

La lecture de documents anciens ou anciens, même en bon état, peut obliger un lecteur à se plonger dans le rôle d’un cryptologue déchiffrant des messages codés. Pas tant parce que l’écrivain a cherché à être intentionnellement secret avec ses textes, mais parce que des combinaisons d’alphabétisation, de lisibilité de l’écriture manuscrite, de styles de lettrage, de conventions obsolètes d’orthographe et de grammaire ou d’abréviations ad hoc pour économiser de l’espace peuvent rendre même une langue maternelle peu familière.

Prenez ce même document et réduisez encore plus sa lisibilité en estompant l’encre, en élargissant le lettrage à cause de l’exposition à l’humidité, en saignant ou en transférant des pigments d’une page à l’autre et en reconstituant les informations, cela pourrait devenir une tâche vraiment ardue.

Un aspect de l’effort actuel qui diffère grandement des méthodes passées est l’utilisation de la couleur. La reconstruction numérique typique convertit un document en texte noir sur fond blanc dans le but de révéler le texte grâce au filtrage du bruit et à l’amélioration du contraste. Dans la méthode de couleur actuelle, l’image est beaucoup plus un effort de restauration, conservant une grande partie de l’aspect et de la sensation virtuelle du document d’origine.

Les chercheurs ont appliqué une intégration complexe de plusieurs techniques d’interprétation numérique des couleurs et de modèles de mélange gaussien pour identifier et séparer les caractéristiques du texte, du papier et des artefacts. Cela permet l’extraction sélective de différentes couches d’informations en fonction de différences spectrales parfois subtiles. Ainsi, un utilisateur pouvait décider si une notation griffonnée, une décoration de page, un tampon, une tache de tasse à café ou une autre caractéristique était essentielle à la compréhension en ajoutant ou en supprimant des calques.

Dans certains cas, la technique pourrait préserver des caractéristiques qui seraient autrement perdues, telles que les faibles filigranes d’un fabricant de papier, qui pourraient offrir des informations vitales aux historiens. Par exemple, les œuvres célèbres de Léonard de Vinci, qui ont survécu dans un état remarquable et ne faisaient pas partie de l’étude actuelle, sont écrites sur des pages avec des filigranes de divers fournisseurs de papier qui ont permis aux historiens des documents de les regrouper en groupes probables de périodes d’écriture.

Selon l’article, le traitement peut être effectué sur un ordinateur de bureau standard (core i5, 4 Go de RAM, Windows 10). L’algorithme ne prend que quelques minutes pour restaurer virtuellement un document avec une plus grande lisibilité. Ce niveau de convivialité en ferait un excellent outil pour les chercheurs de documents historiques et les personnes qui tentent de déchiffrer d’anciennes recettes familiales.

Plus d’information:
Muhammad Hanif et al, Restauration et analyse de contenu de manuscrits anciens via une segmentation basée sur l’espace colorimétrique, PLOS ONE (2023). DOI : 10.1371/journal.pone.0282142

© 2023 Réseau Science X

Citation: Restauration numérique de documents historiques (2023, 24 mars) récupéré le 24 mars 2023 sur https://techxplore.com/news/2023-03-digital-historical-documents.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.

Laisser un commentaire