Les chercheurs proposent des normes pour les études utilisant l’apprentissage automatique

à la

Crédit : CC0 Domaine public

Les chercheurs en sciences de la vie qui utilisent l’apprentissage automatique pour leurs études devraient adopter des normes permettant à d’autres chercheurs de reproduire leurs résultats, selon un article de commentaire publié aujourd’hui dans la revue. Méthodes naturelles.

Les auteurs expliquent que les normes sont essentielles pour faire avancer les percées scientifiques, faire progresser les connaissances et garantir que les résultats de la recherche sont reproductibles d’un groupe de scientifiques à l’autre. Les normes permettraient à d’autres groupes de scientifiques de se concentrer sur la prochaine percée plutôt que de passer du temps à recréer la roue construite par les auteurs de l’étude originale.

Casey S. Greene, Ph.D., directeur du Center for Health AI de la faculté de médecine de l’Université du Colorado, est l’auteur correspondant de l’article, qu’il a co-écrit avec le premier auteur Benjamin J. Heil, membre de la recherche de Greene. et des chercheurs des États-Unis, du Canada et d’Europe.

« En fin de compte, toute science nécessite de la confiance – aucun scientifique ne peut reproduire les résultats de chaque article lu », écrivent Greene et ses co-auteurs. « La question est donc de savoir comment s’assurer que les analyses d’apprentissage automatique dans les sciences de la vie peuvent être fiables. »

Greene et ses co-auteurs définissent les normes pour se qualifier pour l’un des trois niveaux d’accessibilité : Bronze, argent et or. Ces normes fixent chacune des niveaux minimaux pour le partage du matériel d’étude afin que d’autres chercheurs en sciences de la vie puissent faire confiance au travail et, si cela est justifié, valider le travail et s’appuyer sur celui-ci.

Pour se qualifier pour une norme de bronze, les chercheurs en sciences de la vie devraient rendre leurs données, leur code et leurs modèles accessibles au public. Dans l’apprentissage automatique, les ordinateurs apprennent à partir des données d’entraînement et l’accès à ces données permet aux scientifiques de rechercher des problèmes susceptibles de perturber le processus. Le code indique aux futurs chercheurs comment l’ordinateur a été chargé d’effectuer les étapes du travail.

En apprentissage automatique, le modèle résultant est d’une importance cruciale. Pour les futurs chercheurs, connaître le modèle de l’équipe de recherche d’origine est essentiel pour comprendre comment il se rapporte aux données qu’il est censé analyser. Sans accès au modèle, les autres chercheurs ne peuvent pas déterminer les biais qui pourraient influencer le travail. Par exemple, il peut être difficile de déterminer si un algorithme favorise un groupe de personnes par rapport à un autre.

« L’incapacité d’examiner un modèle rend également difficile la confiance en lui », écrivent les auteurs.

L’étalon argent appelle les données, les modèles et le code fournis au niveau bronze et ajoute plus d’informations sur le système dans lequel exécuter le code. Pour les prochains scientifiques, ces informations permettent théoriquement de dupliquer le processus de formation.

Pour se qualifier pour l’étalon-or, les chercheurs doivent ajouter un « bouton facile » à leur travail pour permettre aux futurs chercheurs de reproduire l’analyse précédente avec une seule commande. Les chercheurs d’origine doivent automatiser toutes les étapes de leur analyse afin que « la charge de reproduire leur travail soit aussi réduite que possible ». Pour les futurs scientifiques, ces informations permettent pratiquement de dupliquer le processus de formation et de l’adapter ou de l’étendre.

Greene et ses co-auteurs proposent également des recommandations pour documenter les étapes et les partager.

Les Méthodes naturelles L’article est une contribution importante au perfectionnement continu de l’utilisation de l’apprentissage automatique et d’autres méthodes d’analyse de données dans les sciences de la santé et d’autres domaines où la confiance est particulièrement importante. Greene est l’un des nombreux leaders récemment recrutés par la CU School of Medicine pour établir un programme de développement et d’application de méthodologies robustes de science des données pour faire progresser la recherche biomédicale, l’éducation et les soins cliniques.


Comment les pirates peuvent « empoisonner » le code open source


Plus d’information:
Benjamin J. Heil et al, Normes de reproductibilité pour l’apprentissage automatique dans les sciences de la vie, Méthodes naturelles (2021). DOI : 10.1038 / s41592-021-01256-7

Fourni par le campus médical CU Anschutz

Citation: Les chercheurs proposent des normes pour les études utilisant l’apprentissage automatique (2021, 30 août) récupéré le 30 août 2021 à partir de https://techxplore.com/news/2021-08-standards-machine.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.