Les DRNets peuvent résoudre le Sudoku et accélérer la découverte scientifique

Les DRNets peuvent résoudre le Sudoku et accélérer la découverte scientifique

Crédit : Université Cornell

Supposons que vous conduisez avec un ami dans un quartier familier et que l’ami vous demande de tourner à la prochaine intersection. L’ami ne dit pas dans quel sens tourner, mais comme vous savez tous les deux que c’est une rue à sens unique, c’est compris.

Ce type de raisonnement est au cœur d’un nouveau cadre d’intelligence artificielle – testé avec succès sur des puzzles Sudoku qui se chevauchent – qui pourrait accélérer la découverte dans la science des matériaux, la technologie des énergies renouvelables et d’autres domaines.

Une équipe de recherche interdisciplinaire dirigée par Carla Gomes, professeure Ronald C. et Antonia V. Nielsen d’informatique et de sciences de l’information au Cornell Ann S. Bowers College of Computing and Information Science, a développé des réseaux de raisonnement profond (DRNets), qui combinent l’apprentissage – même avec une quantité relativement faible de données – avec une compréhension des limites et des règles du sujet, connu sous le nom de « raisonnement par contrainte ».

Di Chen, doctorant en informatique dans le groupe de Gomes, est le premier auteur de « Automating Crystal-Structure Phase Mapping by Combining Deep Learning with Constraint Reasoning », publié le 16 septembre dans Nature Machine Intelligence.

Gomes et John Gregoire, Ph.D. ’09, professeur-chercheur au California Institute of Technology, sont les auteurs principaux. Gregoire est un ancien chercheur postdoctoral dans le laboratoire du co-auteur R. Bruce van Dover, Walter S. Carpenter, Jr., professeur d’ingénierie.

Les DRNets, introduits lors de la 37e conférence internationale sur l’apprentissage automatique, qui s’est tenue virtuellement en juillet 2020, vont encore plus loin dans l’apprentissage automatique en ajoutant un raisonnement par contraintes – la capacité de prendre en compte des règles et des connaissances scientifiques antérieures, afin de résoudre des problèmes avec très peu de données comme saisir.

Vous pouvez apprendre à une machine à reconnaître un chien en lui montrant 1 000 photos de chiens, a déclaré Gomes, mais la découverte scientifique n’est pas comme ça.

« Vous n’allez pas avoir beaucoup, beaucoup de données étiquetées », a-t-elle déclaré. « Et en général, les exemples que vous avez ne sont pas exactement ce que vous recherchez, mais ensuite vous raisonnez sur ce que vous savez scientifiquement sur le domaine, et vous pouvez en déduire de nouvelles connaissances. »

Le groupe de Gomes, qui travaille sur l’utilisation de techniques d’IA et d’apprentissage automatique pour accélérer la découverte de matériaux depuis plus d’une décennie, a testé le cadre DRNets en démixant des puzzles Sudoku manuscrits qui se chevauchent, des grilles avec deux chiffres ou lettres dans chaque case. L’ordinateur a dû séparer les énigmes en deux Sudokus résolus, sans aucune donnée d’entraînement, ce qu’il a pu réaliser avec une précision proche de 100 %.






Deep Reasoning Networks, ou DRNets, est un nouveau cadre d’intelligence artificielle qui pourrait accélérer la découverte dans la science des matériaux, la technologie des énergies renouvelables et d’autres domaines. Crédit : Université Cornell

Les chercheurs ont ensuite mis les DRNets au travail sur un problème du monde réel : automatiser la cartographie de phase de la structure cristalline des matériaux de combustibles solaires, à l’aide de modèles de diffraction des rayons X (XRD). La cartographie de phase de structure cristalline consiste à séparer les signaux XRD source des structures cristallines souhaitées des mélanges « bruyants » de motifs XRD, une tâche pour laquelle les données d’apprentissage étiquetées ne sont généralement pas disponibles.

En utilisant les règles thermodynamiques comprises, quelques bits de données non étiquetées, un total de 307 modèles XRD et des informations minimales concernant les éléments du système chimique – dans ce cas, l’oxyde de bismuth, de cuivre et de vanadium (Bi-Cu-V) – DRNets a été capable d’identifier et de séparer un total de 13 phases cristallines (matériaux monophasiques) dans 19 mélanges uniques de matériaux monophasiques.

Les résultats de DRNets, vérifiés à l’aide d’une analyse manuelle, permettent la découverte de mélanges complexes de matériaux cristallins qui convertissent l’énergie solaire en combustibles chimiques solaires stockables.

« Les 13 phases et leurs mélanges comprennent les connaissances scientifiques dérivées des milliers de caractéristiques des modèles XRD mesurés », a déclaré Grégoire, soulignant que les experts humains et les algorithmes antérieurs « étaient incapables d’extraire ces connaissances des modèles XRD en raison du niveau élevé Les humains peuvent raisonner sur les règles physiques et les ordinateurs peuvent traiter des données complexes, mais la découverte scientifique nécessite l’intégration de ces approches.

Gomes a déclaré: « Vérifier qu’une solution de système chimique satisfait aux règles de la physique est plus facile que de la produire, de la même manière qu’il est plus facile de vérifier qu’un Sudoku terminé est correct que de le terminer. »

La clé des DRNets est l’idée d’un « espace latent interprétable ». Fondamentalement, cela donne aux DRNet la possibilité de raisonner sur les contraintes du domaine – dans ce cas la science des matériaux – à partir de données d’entrée.

« C’est vraiment la grande avancée de notre méthodologie : nous le faisons sans avoir de données sur lesquelles l’ordinateur s’entraîner », a déclaré Gomes, notant que dans le

Expériences de Sudoku, « la machine n’a jamais vu à quoi ressemble un chevauchement ‘6’ et ‘D’, mais peut résoudre le problème en raisonnant, en utilisant des connaissances préalables sur les règles de Sudoku.

« De la même manière », a-t-elle déclaré, « les DRNet raisonnent sur les règles thermodynamiques et les phases cristallines connues pour démixer les modèles XRD, sans données sur lesquelles s’entraîner. »

DRNets s’appuie sur les travaux antérieurs du groupe impliquant la science citoyenne liée à la distribution des espèces, réalisés en collaboration avec le programme eBird du Cornell Lab of Ornithology. La nécessité de capturer et d’interpréter les interactions entre les espèces et leurs environnements locaux a été la motivation et l’inspiration initiales de l’espace latent interprétable dans le cadre des DRNets, a déclaré Gomes, un pionnier dans le domaine émergent de la durabilité informatique.


L’IA s’adapte aux lacunes des données scientifiques citoyennes


Plus d’information:
Di Chen et al, Automatisation de la cartographie des phases de la structure cristalline en combinant l’apprentissage en profondeur avec le raisonnement par contraintes, Nature Machine Intelligence (2021). DOI : 10.1038 / s42256-021-00384-1

Fourni par l’Université Cornell

Citation: Les DRNets peuvent résoudre Sudoku, accélérer la découverte scientifique (2021, 23 septembre) récupéré le 23 septembre 2021 à partir de https://techxplore.com/news/2021-09-drnets-sudoku-scientific-discovery.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.