Un nouvel outil pourrait aider les auteurs à briser le blocage de l’écrivain dans les romans

Un nouvel outil pourrait aider les auteurs à briser le blocage de l'écrivain dans les romans

Dans leur approche pour prévoir le développement futur d’une histoire écrite en cours, les chercheurs caractérisent d’abord le monde narratif en utilisant plus de 1 000 « cadres sémantiques » différents, où chaque cadre représente un groupe de concepts et de connaissances associées. Un algorithme prédictif examine ensuite l’histoire précédente et prédit les cadres sémantiques qui pourraient se produire dans les 10, 100 ou même 1 000 phrases suivantes d’une histoire en cours. Crédit : Université d’État de Pennsylvanie

Les auteurs confrontés à Writer’s Block pourraient bientôt disposer d’une nouvelle façon d’aider à développer la prochaine section de leur histoire.

Des chercheurs du Penn State College of Information Sciences and Technology ont récemment introduit une nouvelle technologie qui prévoit le développement futur d’une histoire écrite en cours. Dans leur approche, les chercheurs caractérisent d’abord le monde narratif à l’aide de plus de 1 000 « cadres sémantiques » différents, où chaque cadre représente un groupe de concepts et de connaissances associées. Un algorithme prédictif examine ensuite l’histoire précédente et prédit les cadres sémantiques qui pourraient se produire dans les 10, 100 ou même 1 000 phrases suivantes d’une histoire en cours.

Contrairement aux méthodes de génération de texte automatisées actuelles, l’approche des chercheurs pourrait aider les auteurs à créer un langage pour l’histoire de suivi au-delà de la portée de quelques phrases, une limitation des modèles existants.

« Ces tâches d’écriture créative semblent presque impossibles à automatiser entièrement », a déclaré Kenneth Huang, professeur adjoint de sciences et technologies de l’information. « La raison pour laquelle nous nous attaquons à ces tâches très créatives est de repousser les limites de l’IA et du traitement du langage naturel. Développer des solutions pour des tâches créatives stimulantes nous apprendra la capacité et les limites des techniques de calcul actuelles, et nous permettra de nous améliorer davantage. l’informatique. »

Bien que les modèles existants puissent générer une histoire complète, ils sont testés et prouvés efficaces sur des œuvres courtes de 15 phrases ou moins. Huang et son équipe voulaient développer un outil qui pourrait aider les auteurs qui écrivent des romans, qui comptent généralement 50 000 mots ou plus.

« Lorsque nous fournissons une prédiction de texte plus longue, nous proposons essentiellement des idées de suivi pour aider les romanciers à planifier leur histoire et à se fixer des objectifs au lieu de générer des histoires détaillées pour eux », a déclaré Chieh-Yang Huang, doctorant en informatique. « Nous envisageons qu’à l’avenir, nous pourrons proposer diverses idées pour stimuler les romanciers à réfléchir à différents arcs narratifs. »

Le cadre des chercheurs, appelé prévision du cadre sémantique, décompose un long récit en une séquence de blocs de texte contenant chacun un nombre fixe de phrases. La fréquence d’occurrence de chaque trame sémantique est alors calculée. Ensuite, le texte est converti en un vecteur – des données numériques comprises par une machine – où chaque dimension désigne la fréquence d’une image. Il est ensuite calculé pour quantifier le nombre de fois qu’un cadre sémantique apparaît et signifie son importance. Enfin, le modèle saisit un nombre fixe de blocs de texte et prédit le cadre sémantique du bloc à venir.

Pour rendre la sortie compréhensible pour les utilisateurs humains, les chercheurs ont reconverti le vecteur résultant d’un ensemble de nombres en un nuage de mots. Les crowd workers en ligne ont testé et confirmé la représentativité et la spécificité des nuages ​​de mots produits.

Les auteurs pourraient utiliser l’outil en introduisant une partie de leur texte déjà écrit dans le système pour générer un ensemble de nuages ​​de mots avec des noms, des verbes et des adjectifs suggérés pour les inspirer lors de l’élaboration de la prochaine partie de leur histoire.

Les chercheurs ont testé leur modèle sur un ensemble de données de près de 5 000 livres de fiction et ont mesuré l’effet de l’outil sur la représentation des cadres pour différentes longueurs de contexte, faisant varier la longueur des blocs d’histoire entre cinq et 1 000 phrases. En outre, ils ont testé les prévisions du cadre sémantique sur près de 8 000 articles scientifiques à l’aide de résumés annotés par l’homme de l’ensemble de données CODA-19, mettant en évidence l’impact potentiel de l’outil dans les applications de non-fiction.

« Cela montre la généralisabilité de la technologie. Notre approche fonctionne non seulement dans les histoires, mais aussi dans les articles scientifiques », a déclaré Kenneth. « Si nous pouvons le faire à la fois sur des articles scientifiques et des romans, nous pourrions probablement le faire sur des nouvelles et sur d’autres genres. »

Chieh-Yang a ajouté : « Notre expérience montre que la prévision des prochains cadres sémantiques est difficile mais possible.

Les chercheurs prévoient d’intégrer la prévision du cadre sémantique dans un système alimenté par la foule qu’ils ont précédemment développé, qui permet aux écrivains de susciter des idées d’histoires de la foule en ligne, afin d’étudier plus avant comment l’outil peut être utilisé pour aider les auteurs.

« Si un système automatisé peut augmenter la créativité humaine, il aura un impact », a déclaré Kenneth. « Même si l’auteur n’utilise pas directement ce qui est généré, les sorties de la machine pourraient inspirer quelque chose auquel l’écrivain n’avait pas pensé auparavant. »

Les travaux ont été présentés lors de la conférence annuelle 2021 de la section nord-américaine de l’Association for Computational Linguistics (NAACL), qui s’est tenue virtuellement début juin.


Crowdsourcing des intrigues pour aider le processus créatif


Plus d’information:
Lien de la conférence : 2021.naacl.org/

Fourni par l’Université d’État de Pennsylvanie

Citation: Un nouvel outil pourrait aider les auteurs à briser le bloc de l’écrivain dans les œuvres de longueur roman (2021, 25 août) récupéré le 25 août 2021 à partir de https://techxplore.com/news/2021-08-tool-authors-writer-block-novel-length .html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.