Utiliser l’IA pour combler les lacunes manquantes dans les textes anciens

Utiliser l'IA pour combler les lacunes manquantes dans les textes anciens

Cette inscription restaurée (IG I3 4B) enregistre un décret concernant l’Acropole d’Athènes et date de 485/4 avant notre ère. Crédit : CC BY-SA 3.0, WikiMedia

Une équipe de chercheurs en IA de DeepMind, en collaboration avec des collègues de l’Université de Venise, de l’Université d’Oxford et de l’Université d’économie et de commerce d’Athènes, a développé une application d’intelligence artificielle (IA) pour aider les historiens à combler les lacunes du texte manquant de pierre , objets en métal ou en poterie. Dans leur article publié dans la revue Nature, le groupe décrit comment ils ont construit l’application, comment elle peut être utilisée et comment elle a fonctionné lorsqu’elle a été testée par rapport à des textes connus. Charlotte Roueché, du King’s College de Londres, a publié un article News and Views dans le même numéro de revue décrivant l’histoire de l’utilisation des nouvelles technologies pour mieux comprendre les artefacts historiques et le travail effectué par l’équipe sur ce nouvel effort.

À certains moments de l’histoire, les humains ont commencé à utiliser des textes écrits à des fins telles que la tenue de comptes. De tels récits peuvent donner aux érudits modernes des indices sur la façon dont les gens des sociétés anciennes menaient leurs journées. Mais ce n’est que si les artefacts peuvent être déchiffrés. Beaucoup ont été érodées par les intempéries ou ont été brisées et il manque des pièces. Les chercheurs modernes utilisent une variété d’outils pour déterminer le contenu du texte original. C’est presque toujours un processus long et fastidieux. Dans ce nouvel effort, l’équipe de DeepMind a entrepris de développer un outil pour aider dans ces efforts. Le résultat a été Ithaca, une application d’apprentissage automatique qui apprend d’autres textes anciens pour prédire le texte manquant.

Les chercheurs ont formé l’application en utilisant 60 000 textes grecs des années 700 avant JC à 500 après JC. Chacun avait déjà été largement étudié et reconstruit si nécessaire. L’équipe a ensuite exécuté l’application sur les mêmes textes avant la reconstruction. Ils ont ensuite formé l’application sur 8 000 autres textes bien étudiés pour la tester par rapport au travail effectué par des experts humains. Les chercheurs ont trouvé que le système était précis à 62 %, ce qui était mieux que les performances des historiens. Mais les meilleurs résultats sont venus des collaborations entre le système d’IA et les historiens ; ensemble, ils ont pu atteindre une précision de 72 %.







Cette inscription restaurée (IG I3 4B) enregistre un décret concernant l’Acropole d’Athènes et date de 485/4 avant notre ère. Crédit : CC BY-SA 3.0, WikiMedia

Les chercheurs ont également ajouté une autre fonctionnalité : la possibilité d’attribuer un texte à un moment et à un lieu en utilisant des indices trouvés dans le texte et provenant d’autres sources. Ils ont trouvé que le système était précis à 71% pour déterminer l’origine de l’écrivain et pouvait situer la date d’écriture à moins de 30 ans, en moyenne.







L’apprentissage en profondeur éclaire les chercheurs qui s’interrogent sur des textes anciens


Plus d’information:
Yannis Assael et al, Restauration et attribution de textes anciens à l’aide de réseaux de neurones profonds, Nature (2022). DOI : 10.1038 / s41586-022-04448-z

Charlotte Roueché, AI comble le vide et comble les inscriptions grecques manquantes, Nature (2022). DOI : 10.1038/d41586-022-00641-2

Blog DeepMind : deepmind.com/blog/article/Pred … le-passé-avec-Ithaca

© 2022 Réseau Science X

Citation: Utilisation de l’IA pour combler les lacunes manquantes dans les textes anciens (10 mars 2022) récupéré le 10 mars 2022 sur https://techxplore.com/news/2022-03-ai-gaps-ancient-texts.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.