Un modèle rapproche les ordinateurs de la compréhension de la conversation humaine

Un modèle rapproche les ordinateurs de la compréhension de la conversation humaine

Temps de prédiction pour l’appel SWDA sw2229 par Longformer et XLNet avec différentes tailles de fenêtre. Le graphique de gauche montre le temps moyen qu’il faut pour prédire une seule fenêtre, et le graphique de droite montre le temps nécessaire pour traiter la boîte de dialogue complète. Les tailles de fenêtre supérieures à 512 impliquent un sous-fenêtre pour Longformer, qui dans cette expérience n’a appris que 512 intégrations positionnelles. Crédit : DOI : 10.1162/tacl_a_00420

Un ingénieur du Johns Hopkins Center for Language and Speech Processing a développé un modèle d’apprentissage automatique qui peut distinguer les fonctions de la parole dans les transcriptions de dialogues produits par les systèmes de compréhension du langage, ou LU, dans une approche qui pourrait éventuellement aider les ordinateurs à « comprendre » la parole ou texte écrit de la même manière que les humains.

Développé par le chercheur scientifique adjoint du CLSP Piotr Zelasko, le nouveau modèle identifie l’intention derrière les mots et les organise en catégories telles que « Déclaration », « Question » ou « Interruption » dans la transcription finale : une tâche appelée « reconnaissance des actes de dialogue.  » En fournissant à d’autres modèles une version de texte plus organisée et segmentée avec laquelle travailler, le modèle de Zelasko pourrait devenir une première étape pour donner un sens à une conversation, a-t-il déclaré.

« Cette nouvelle méthode signifie que les systèmes LU n’ont plus à traiter d’énormes morceaux de texte non structurés, avec lesquels ils ont du mal lorsqu’ils essaient de classer des éléments tels que le sujet, le sentiment ou l’intention du texte. Au lieu de cela, ils peuvent travailler avec un série d’expressions, qui disent des choses très spécifiques, comme une question ou une interruption. Mon modèle permet à ces systèmes de fonctionner là où ils auraient pu échouer autrement », a déclaré Zelasko, dont l’étude est parue récemment dans Transactions de l’Association for Computational Linguistics.

Dans cet article, Zelasko adapte certains modèles de compréhension du langage récemment introduits dans le but d’organiser et de catégoriser les mots et les phrases, et étudie comment différentes variables, telles que la ponctuation, affectent les performances de ces modèles.

« Nous avons constaté que la ponctuation fournit aux modèles des indices très forts qui ne semblent pas être autrement présents dans le texte, tels que le contenu d’une conversation », a déclaré Zelasko.

Pendant qu’il travaillait dans l’industrie sur l’analyse conversationnelle interhumaine, Zelasko a remarqué que de nombreux algorithmes de traitement du langage naturel ne fonctionnent bien que lorsque le texte a une structure claire, comme lorsqu’une personne parle en phrases complètes. Cependant, dans la vraie vie, les gens parlent rarement de manière aussi formelle, ce qui rend difficile pour les systèmes de déterminer exactement où commence et se termine une phrase. Zelasko voulait s’assurer que son système pouvait comprendre une conversation ordinaire.

« C’est là qu’intervient le cadre » de l’acte de dialogue «  », a déclaré Zelasko. « Avec cela, nous pouvons au moins trouver des » unités « d’une conversation. Cela peut éventuellement aider avec un large éventail de tâches telles que le résumé, la reconnaissance d’intention et la détection de phrases clés. »

Zelasko pense que son modèle pourrait éventuellement aider les entreprises qui utilisent l’analyse vocale, un processus que certaines entreprises utilisent pour obtenir des informations à partir de l’analyse des interactions entre les clients et les représentants du service client des centres d’appels. L’analyse de la parole implique généralement une transcription automatique de la conversation et des recherches de mots clés, ce qui, selon Zelasko, offre des opportunités limitées d’informations.

« Avec l’ancienne approche, vous pourriez être en mesure de dire que les points forts d’une conversation impliquent le type de téléphone que possède le client, des « problèmes techniques » et un « remboursement », mais que se passe-t-il si quelqu’un explorait simplement ses options et ne demande à être remboursé? » dit Zelasko. « C’est pourquoi nous devons réellement comprendre la conversation et pas simplement la rechercher à la recherche de mots-clés. »

Zelasko prédit que son modèle pourrait également un jour être utilisé par les médecins, leur faisant gagner un temps précieux qu’ils passent désormais à prendre des notes tout en interagissant avec les patients. Au lieu de cela, un appareil utilisant le modèle de Zelasko pourrait rapidement parcourir la transcription de la conversation, remplir des formulaires et rédiger des notes automatiquement, permettant aux médecins de se concentrer sur leurs patients.

Zelasko a rejoint Johns Hopkins et le CLSP en janvier 2020, et attribue le progrès de son travail à l’environnement de recherche innovant et collaboratif.

« Pour bien faire ces choses, il faut de l’espace pour laisser libre cours à votre créativité et du temps pour digérer les résultats de vos expériences, en tirer des leçons et réussir la prochaine fois que vous essayez », a déclaré Zelasko. « Mais il est également important de tenir compte des considérations et des limites pratiques lors de la conduite de ce type de recherche. C’est ce qui fait du CLSP un endroit idéal pour cela, car nous avons une excellente expérience de collaboration avec l’industrie. »


Les limites du texte généré par l’IA


Plus d’information:
Piotr Żelasko et al, Qu’est-ce qui aide les transformateurs à reconnaître la structure conversationnelle ? Importance du contexte, de la ponctuation et des étiquettes dans la reconnaissance des actes de dialogue, Transactions de l’Association for Computational Linguistics (2021). DOI : 10.1162 / tacl_a_00420

Fourni par l’Université Johns Hopkins

Citation: Le modèle rapproche les ordinateurs de la compréhension de la conversation humaine (2021, 21 décembre) récupéré le 21 décembre 2021 sur https://techxplore.com/news/2021-12-closer-human-conversation.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.