Utiliser l’apprentissage automatique pour prédire la recherche à fort impact

Utiliser l'apprentissage automatique pour prédire la recherche à fort impact

Les chercheurs du MIT ont conçu un cadre d’apprentissage automatique qui, en calculant sur le graphique de la recherche scientifique historique, est capable de prédire l’impact futur de la recherche scientifique. Crédit: Massachusetts Institute of Technology

Un cadre d’intelligence artificielle construit par des chercheurs du MIT peut donner un signal «d’alerte précoce» pour les futures technologies à fort impact, en apprenant des modèles glanés dans les publications scientifiques précédentes.

Dans un test rétrospectif de ses capacités, DELPHI, abréviation de Dynamic Early-Warning by Learning to Predict High Impact, a pu identifier tous les articles pionniers sur une liste d’experts des biotechnologies fondamentales clés, parfois dès la première année après leur publication. .

James W. Weis, une filiale de recherche du MIT Media Lab, et Joseph Jacobson, professeur d’arts et de sciences médiatiques et chef du groupe de recherche Molecular Machines du Media Lab, ont également utilisé DELPHI pour mettre en évidence 50 articles scientifiques récents qu’ils prédisent impact élevé d’ici 2023. Les sujets couverts par les articles comprennent les nanorobots d’ADN utilisés pour le traitement du cancer, les batteries lithium-oxygène à haute densité d’énergie et la synthèse chimique à l’aide de réseaux neuronaux profonds, entre autres.

Les chercheurs considèrent DELPHI comme un outil qui peut aider les humains à mieux tirer parti du financement de la recherche scientifique, en identifiant les technologies «diamant à l’état brut» qui pourraient autrement languir et en offrant aux gouvernements, aux philanthropies et aux sociétés de capital-risque un moyen de soutenir la science de manière plus efficace et productive. .

«Essentiellement, notre algorithme fonctionne en apprenant des modèles de l’histoire de la science, puis en faisant correspondre des modèles sur de nouvelles publications pour trouver les premiers signaux à fort impact», explique Weis. « En suivant la diffusion précoce des idées, nous pouvons prédire la probabilité qu’elles deviennent virales ou se propagent à la communauté universitaire au sens large de manière significative. »

L’article a été publié dans Biotechnologie de la nature.

À la recherche du « diamant brut »

L’algorithme d’apprentissage automatique développé par Weis et Jacobson tire parti de la grande quantité d’informations numériques désormais disponibles avec la croissance exponentielle des publications scientifiques depuis les années 1980. Mais au lieu d’utiliser des mesures unidimensionnelles, telles que le nombre de citations, pour juger de l’impact d’une publication, DELPHI a été formé sur un réseau de séries chronologiques complet de métadonnées d’articles de revues pour révéler des modèles de plus grande dimension dans leur propagation à travers l’écosystème scientifique.

Le résultat est un graphe de connaissances qui contient les connexions entre les nœuds représentant des articles, des auteurs, des institutions et d’autres types de données. La force et le type des connexions complexes entre ces nœuds déterminent leurs propriétés, qui sont utilisées dans le cadre. «Ces nœuds et arêtes définissent un graphique basé sur le temps que DELPHI utilise pour apprendre des modèles prédictifs d’un impact futur élevé», explique Weis.

Ensemble, ces fonctionnalités de réseau sont utilisées pour prédire l’impact scientifique, les articles qui se situent dans le top 5 pour cent de la centralité des nœuds échelonnés dans le temps cinq ans après la publication, considérés comme l’objectif «très impactant» que DELPHI vise à identifier. Ces 5 pour cent des articles les plus importants représentent 35 pour cent de l’impact total du graphique. DELPHI peut également utiliser les seuils des 1, 10 et 15% supérieurs de centralité des nœuds échelonnés dans le temps, selon les auteurs.

DELPHI suggère que les articles à fort impact se propagent presque viralement en dehors de leurs disciplines et des petites communautés scientifiques. Deux articles peuvent avoir le même nombre de citations, mais les articles à fort impact atteignent un public plus large et plus profond. Les papiers à faible impact, d’un autre côté, «ne sont pas vraiment utilisés et mis à profit par un groupe de personnes en expansion», déclare Weis.

Le cadre pourrait être utile pour «inciter des équipes de personnes à travailler ensemble, même si elles ne se connaissent pas déjà – peut-être en leur orientant des fonds pour qu’elles se réunissent pour travailler sur des problèmes multidisciplinaires importants», ajoute-t-il.

Comparé au seul numéro de citation, DELPHI identifie plus de deux fois le nombre d’articles très percutants, y compris 60 pour cent de «joyaux cachés», ou articles qui seraient manqués par un seuil de citation.

«Faire progresser la recherche fondamentale consiste à prendre beaucoup de tirs au but et à pouvoir ensuite doubler rapidement les meilleures de ces idées», déclare Jacobson. « Cette étude visait à voir si nous pouvions faire ce processus de manière plus échelle, en utilisant la communauté scientifique dans son ensemble, comme intégré dans le graphique académique, ainsi qu’en étant plus inclusif dans l’identification des directions de recherche à fort impact. »

Les chercheurs ont été surpris de la rapidité avec laquelle, dans certains cas, le « signal d’alerte » d’un article très percutant apparaît en utilisant DELPHI. «Moins d’un an après la publication, nous identifions déjà des joyaux cachés qui auront un impact significatif plus tard», déclare Weis.

Il prévient cependant que DELPHI ne prédit pas exactement l’avenir. « Nous utilisons l’apprentissage automatique pour extraire et quantifier les signaux qui sont cachés dans la dimensionnalité et la dynamique des données qui existent déjà. »

Financement équitable, efficient et efficace

L’espoir, disent les chercheurs, est que DELPHI offrira un moyen moins biaisé d’évaluer l’impact d’un article, car d’autres mesures telles que les citations et le nombre de facteurs d’impact des revues peuvent être manipulées, comme l’ont montré des études antérieures.

«Nous espérons pouvoir utiliser cela pour trouver les recherches et les chercheurs les plus méritants, quelles que soient les institutions auxquelles ils sont affiliés ou leur niveau de connexion», déclare Weis.

Cependant, comme pour tous les frameworks d’apprentissage automatique, les concepteurs et les utilisateurs doivent être attentifs aux préjugés, ajoute-t-il. «Nous devons être constamment conscients des biais potentiels dans nos données et modèles. Nous voulons que DELPHI aide à trouver la meilleure recherche de manière moins biaisée. Nous devons donc faire attention que nos modèles n’apprennent pas à prédire l’impact futur uniquement sur le base de mesures sous-optimales telles que l’indice h, le nombre de citations des auteurs ou l’affiliation institutionnelle. « 

DELPHI pourrait être un outil puissant pour aider le financement scientifique à devenir plus efficace et efficient, et peut-être être utilisé pour créer de nouvelles catégories de produits financiers liés à l’investissement scientifique.

«La métascience émergente du financement scientifique indique la nécessité d’une approche de portefeuille pour l’investissement scientifique», note David Lang, directeur exécutif de la Experiment Foundation. « Weis et Jacobson ont apporté une contribution significative à cette compréhension et, plus important encore, à sa mise en œuvre avec DELPHI. »

C’est quelque chose auquel Weis a beaucoup réfléchi après ses propres expériences de lancement de fonds de capital-risque et d’incubation de laboratoires pour les startups biotechnologiques.

«Je suis devenu de plus en plus conscient que les investisseurs, y compris moi-même, recherchaient constamment de nouvelles entreprises aux mêmes endroits et avec les mêmes idées préconçues», dit-il. «J’ai commencé à entrevoir une multitude de personnes hautement talentueuses et une technologie incroyable, mais cela est souvent négligé. Je pensais qu’il devait y avoir un moyen de travailler dans cet espace – et que l’apprentissage automatique pourrait nous aider à trouver et à réaliser plus efficacement tout ce potentiel inexploité.  »


Les plans de Delphi se divisent en entreprises technologiques et traditionnelles d’ici avril


Plus d’information:
James W. Weis et coll. L’apprentissage de la dynamique des graphes de connaissances fournit un avertissement précoce d’une recherche d’impact Biotechnologie de la nature (2021). DOI: 10.1038 / s41587-021-00907-6

Fourni par le Massachusetts Institute of Technology

Citation: Utiliser l’apprentissage automatique pour prédire la recherche à fort impact (2021, 18 mai) récupéré le 18 mai 2021 sur https://techxplore.com/news/2021-05-machine-high-impact.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.