Google devient plus multilingue, mais obtiendra-t-il la nuance ?

Google devient plus multilingue, mais obtiendra-t-il la nuance ?

Un élève colorie un renard pendant un cours de langue autochtone quechua axé sur les noms d’animaux dans une école primaire publique de Licapa, au Pérou, le mercredi 1er septembre 2021. Environ 10 millions de personnes parlent quechua, mais essaient de traduire automatiquement les e-mails et les SMS dans la famille de langues autochtones la plus parlée des Amériques était presque impossible avant que Google ne l’introduise dans son service de traduction numérique le mercredi 11 mai 2022. Le géant de l’Internet affirme que la nouvelle technologie d’intelligence artificielle lui permet d’élargir considérablement le répertoire de Google Translate des langues, en ajoutant 24 autres cette semaine, dont le quechua et d’autres langues autochtones d’Amérique du Sud telles que le guarani et l’aymara. Crédit : AP Photo/Martin Mejia, fichier

Environ 10 millions de personnes parlent quechua, mais essayer de traduire automatiquement les e-mails et les SMS dans la famille de langues autochtones la plus parlée des Amériques a longtemps été presque impossible.

Cela a changé mercredi, lorsque Google a ajouté le quechua et une variété d’autres langues à son service de traduction numérique.

Le géant de l’Internet affirme que la nouvelle technologie d’intelligence artificielle lui permet d’élargir considérablement le répertoire de Google Traduction des langues du monde. Il en a ajouté 24 cette semaine, dont le quechua et d’autres langues autochtones d’Amérique du Sud telles que le guarani et l’aymara. Il ajoute également un certain nombre de langues africaines et sud-asiatiques largement parlées qui manquaient depuis longtemps dans les produits technologiques populaires.

“Nous avons examiné les langues avec de très grandes populations mal desservies”, a déclaré aux journalistes Isaac Caswell, chercheur chez Google.

Les nouvelles de la vitrine annuelle de la technologie d’E / S de la société californienne peuvent être célébrées dans de nombreux coins du monde. Mais cela attirera probablement les critiques de ceux qui sont frustrés par les produits technologiques précédents qui n’ont pas compris les nuances de leur langue ou de leur culture.

Le quechua était la lingua franca de l’empire inca, qui s’étendait de ce qui est aujourd’hui le sud de la Colombie au centre du Chili. Son statut a commencé à décliner suite à la conquête espagnole du Pérou il y a plus de 400 ans.

L’ajouter aux langues reconnues par Google est une grande victoire pour les militants de la langue quechua comme Luis Illaccanqui, un Péruvien qui a créé le site Web Qichwa 2.0, qui comprend des dictionnaires et des ressources pour apprendre la langue.

“Cela aidera à mettre le quechua et l’espagnol sur le même statut”, a déclaré Illaccanqui, qui n’était pas impliqué dans le projet de Google.

Google devient plus multilingue, mais obtiendra-t-il la nuance ?

L’enseignante Carmen Cazorla écrit en langue indigène quechua lors d’un cours sur les plantes médicinales dans une école primaire publique de Licapa, au Pérou, le mercredi 1er septembre 2021. Environ 10 millions de personnes parlent quechua, mais essaient de traduire automatiquement les e-mails et les SMS en la famille de langues autochtones la plus parlée des Amériques était presque impossible avant que Google ne l’introduise dans son service de traduction numérique le mercredi 11 mai 2022. Le géant de l’Internet affirme que la nouvelle technologie d’intelligence artificielle lui permet d’élargir considérablement le répertoire de Google Traduction des langues du monde , en ajoutant 24 autres cette semaine, dont le quechua et d’autres langues autochtones d’Amérique du Sud telles que le guarani et l’aymara. Crédit : AP Photo/Martin Mejia

Illaccanqui, dont le nom de famille en quechua signifie “tu es l’éclair”, a déclaré que le traducteur contribuera également à maintenir la langue vivante auprès d’une nouvelle génération de jeunes et d’adolescents, “qui parlent quechua et espagnol en même temps et sont fascinés par réseaux sociaux.”

Caswell a qualifié la nouvelle de “très grand pas en avant technologique” car jusqu’à récemment, il n’était pas possible d’ajouter des langues si les chercheurs ne pouvaient pas trouver une quantité suffisante de textes en ligne – tels que des livres numériques, des journaux ou des publications sur les réseaux sociaux – pour leur Des systèmes d’IA pour apprendre.

Les géants américains de la technologie n’ont pas fait leurs preuves pour faire fonctionner leur technologie linguistique bien en dehors des marchés les plus riches, un problème qui leur a également rendu plus difficile la détection de fausses informations dangereuses sur leurs plateformes. Jusqu’à cette semaine, Google Translate était proposé dans des langues européennes telles que le frison, le maltais, l’islandais et le corse, chacune comptant moins d’un million de locuteurs, mais pas dans les langues d’Afrique de l’Est comme l’Oromo et le Tigrinya, qui comptent des millions de locuteurs.

Les nouvelles langues seront déployées cette semaine. Ils ne seront pas encore compris par l’assistant vocal de Google, qui les limite pour l’instant à des traductions de texte à texte. Google a déclaré qu’il travaillait sur l’ajout de la reconnaissance vocale et d’autres fonctionnalités, telles que la possibilité de traduire un panneau en pointant une caméra dessus.

Cela sera important pour les langues largement parlées comme le quechua, en particulier dans le domaine de la santé, car de nombreux médecins et infirmières péruviens qui ne parlent que l’espagnol travaillent dans les zones rurales et « sont incapables de comprendre les patients qui parlent principalement le quechua », a déclaré Illaccanqui.

“La prochaine frontière, ou défi, est de travailler sur la parole”, a déclaré Arturo Oncevay, chercheur péruvien en traduction automatique à l’Université d’Édimbourg, qui a cofondé un groupe de recherche pour améliorer la technologie des langues autochtones à travers les Amériques. “Les langues indigènes des Amériques sont traditionnellement orales.”

Dans son annonce, Google a averti que la qualité des traductions dans les langues nouvellement ajoutées “est encore loin derrière” les autres langues qu’il prend en charge, telles que l’anglais, l’espagnol et l’allemand, et a noté que les modèles “feront des erreurs et montreront leurs propres préjugés”. ” Mais la société n’a ajouté de langues que si ses systèmes d’IA atteignaient un certain seuil de compétence, a déclaré Caswell.

“S’il y a un nombre important de cas où c’est très mal, alors nous ne l’inclurons pas”, a-t-il déclaré. “Même si 90% des traductions sont parfaites, mais que 10% sont des bêtises, c’est un peu trop pour nous.”

Google devient plus multilingue, mais obtiendra-t-il la nuance ?

Des livres écrits en langue indigène quechua sont assis derrière un élève lors d’un cours sur les plantes médicinales, dans une école primaire publique de Licapa, au Pérou, le mercredi 1er septembre 2021. Environ 10 millions de personnes parlent quechua, mais essaient de traduire automatiquement les e-mails et les messages texte dans la famille de langues autochtones la plus parlée des Amériques étaient presque impossibles avant que Google ne l’introduise dans son service de traduction numérique le mercredi 11 mai 2022. Le géant de l’Internet affirme que la nouvelle technologie d’intelligence artificielle lui permet d’élargir considérablement le répertoire de Google Translate de les langues du monde, en ajoutant 24 autres cette semaine, dont le quechua et d’autres langues autochtones d’Amérique du Sud telles que le guarani et l’aymara. Crédit : AP Photo/Martin Mejia

Google a déclaré que ses produits prennent désormais en charge 133 langues. Les 24 dernières sont le plus grand lot à être ajouté depuis que Google a intégré 16 nouvelles langues en 2010. Ce qui a rendu l’expansion possible, c’est ce que Google appelle un modèle de traduction automatique « zero-shot » ou « zéro ressource », qui apprend à traduire dans une autre langue sans jamais en voir un exemple.

La société mère de Facebook et Instagram, Meta, a introduit l’année dernière un concept similaire appelé Universal Speech Translator.

“À un niveau élevé, la façon dont vous pouvez imaginer que cela fonctionne est que vous avez un seul modèle neuronal gigantesque et qu’il est formé dans 100 langues différentes”, a déclaré Caswell à propos du modèle Google.

Il a déclaré que le nouveau groupe allait de langues plus petites comme le mizo, parlées dans le nord-est de l’Inde par environ 800 000 personnes, à des langues plus largement parlées comme le lingala, parlées par environ 45 millions de personnes à travers l’Afrique centrale.

Il y a plus de 15 ans, en 2006, Microsoft a attiré l’attention en Amérique du Sud avec une fonctionnalité logicielle traduisant les menus et commandes familiers de Microsoft en quechua. Mais c’était avant la vague actuelle d’avancées de l’IA dans la traduction en temps réel.

Américo Mendoza-Mori, spécialiste des langues à l’Université de Harvard, qui parle le quechua, a déclaré que l’attention de Google apportait une visibilité nécessaire à la langue dans des endroits comme le Pérou, où les locuteurs du quechua manquent encore dans de nombreux services publics. La survie de bon nombre de ces langues “dépendra de leur utilisation dans des contextes numériques”, a-t-il déclaré.

Les nouvelles langues ajoutées sont : Assamais, Aymara, Bambara, Bhojpuri, Dhivehi, Dogri, Ewe, Guarani, Ilocano, Konkani, Krio, Lingala, Luganda, Maithili, Meiteilon (Manipuri), Mizo, Oromo, Quechua, Sanskrit, Sepedi , kurde sorani, tigrinya, tsonga et twi.


Besoin d’un médecin? Google peut maintenant vous aider à trouver des endroits qui acceptent votre assurance maladie


© 2022 L’Associated Press. Tous les droits sont réservés. Ce matériel ne peut être publié, diffusé, réécrit ou redistribué sans autorisation.

Citation: Google devient plus multilingue, mais obtiendra-t-il la nuance ? (2022, 11 mai) récupéré le 11 mai 2022 sur https://techxplore.com/news/2022-05-google-multilingual-nuance.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.