Un nouveau modèle améliore la précision de l’apprentissage automatique dans le diagnostic COVID-19 tout en préservant la confidentialité

Des chercheurs au Royaume-Uni et en Chine ont développé un modèle d’intelligence artificielle (IA) capable de diagnostiquer le COVID-19 ainsi qu’un panel de radiologues professionnels, tout en préservant la confidentialité des données des patients.

L’équipe internationale, dirigée par l’Université de Cambridge et l’Université des sciences et technologies de Huazhong, a utilisé une technique appelée apprentissage fédéré pour construire son modèle. Grâce à l’apprentissage fédéré, un modèle d’IA dans un hôpital ou un pays peut être formé et vérifié de manière indépendante à l’aide d’un ensemble de données d’un autre hôpital ou pays, sans partage de données.

Les chercheurs ont basé leur modèle sur plus de 9 000 tomodensitogrammes d’environ 3 300 patients dans 23 hôpitaux au Royaume-Uni et en Chine. Leurs résultats, publiés dans la revue Nature Machine Intelligence, fournissent un cadre dans lequel les techniques d’IA peuvent être rendues plus fiables et plus précises, en particulier dans des domaines tels que le diagnostic médical où la confidentialité est vitale.

L’IA a fourni une solution prometteuse pour rationaliser les diagnostics COVID-19 et les futures crises de santé publique. Cependant, les préoccupations concernant la sécurité et la fiabilité empêchent la collecte de données médicales représentatives à grande échelle, ce qui pose un défi pour la formation d’un modèle pouvant être utilisé dans le monde entier.

Au début de la pandémie de COVID-19, de nombreux chercheurs en IA ont travaillé pour développer des modèles capables de diagnostiquer la maladie. Cependant, bon nombre de ces modèles ont été construits à l’aide de données de faible qualité, d’ensembles de données « Frankenstein » et d’un manque de contribution des cliniciens. Bon nombre des mêmes chercheurs de la présente étude ont souligné que ces modèles antérieurs n’étaient pas adaptés à une utilisation clinique au printemps. de 2021.

« L’IA a beaucoup de limites en ce qui concerne le diagnostic de COVID-19, et nous devons soigneusement filtrer et conserver les données afin d’obtenir un modèle qui fonctionne et qui soit digne de confiance », a déclaré le co-premier auteur Hanchen Wang de Cambridge’s Département d’ingénierie. « Là où les modèles précédents reposaient sur des données arbitraires open source, nous avons travaillé avec une grande équipe de radiologues du NHS et du groupe hospitalier de Wuhan Tongji pour sélectionner les données, de sorte que nous partions d’une position de force. »

Les chercheurs ont utilisé deux ensembles de données de validation externes bien organisés et de taille appropriée pour tester leur modèle et s’assurer qu’il fonctionnerait bien sur des ensembles de données de différents hôpitaux ou pays.

« Avant COVID-19, les gens ne se rendaient pas compte de la quantité de données qu’il fallait collecter pour créer des applications d’IA médicales », a déclaré le co-auteur, le Dr Michael Roberts d’AstraZeneca et du département de mathématiques appliquées et de physique théorique de Cambridge. « Différents hôpitaux, différents pays ont tous leurs propres façons de faire les choses, vous avez donc besoin que les ensembles de données soient aussi volumineux que possible afin de créer quelque chose qui sera utile au plus grand nombre de cliniciens. »

Les chercheurs ont basé leur cadre sur des tomodensitogrammes tridimensionnels au lieu d’images bidimensionnelles. Les tomodensitogrammes offrent un niveau de détail beaucoup plus élevé, résultant en un meilleur modèle. Ils ont utilisé 9 573 tomodensitogrammes de 3 336 patients collectés dans 23 hôpitaux situés en Chine et au Royaume-Uni.

Les chercheurs ont également dû atténuer les biais causés par les différents ensembles de données et ont utilisé l’apprentissage fédéré pour former un modèle d’IA mieux généralisé, tout en préservant la confidentialité de chaque centre de données dans un cadre collaboratif.

Pour une comparaison équitable, les chercheurs ont validé tous les modèles sur les mêmes données, sans chevauchement avec les données d’entraînement. L’équipe a demandé à un groupe de radiologues de faire des prédictions diagnostiques sur la base du même ensemble de tomodensitogrammes et de comparer la précision des modèles d’IA et des professionnels humains.

Les chercheurs affirment que leur modèle est utile non seulement pour COVID-19, mais pour toute autre maladie pouvant être diagnostiquée à l’aide d’un scanner. « La prochaine fois qu’il y aura une pandémie, et il y a tout lieu de croire qu’il y en aura, nous serons dans une bien meilleure position pour exploiter rapidement les techniques d’IA afin de pouvoir comprendre les nouvelles maladies plus rapidement », a déclaré M. Wang.

« Nous avons montré que le cryptage des données médicales est possible, nous pouvons donc créer et utiliser ces outils tout en préservant la confidentialité des patients au-delà des frontières internes et externes », a déclaré le Dr Roberts. « En travaillant avec d’autres pays, nous pouvons faire bien plus que nous ne pouvons le faire seuls. »

Les chercheurs collaborent maintenant avec le nouveau centre de l’OMS pour le renseignement sur les pandémies et les épidémies, pour explorer la possibilité de faire progresser les cadres de soins de santé numériques préservant la confidentialité.


Les modèles d’apprentissage automatique pour diagnostiquer le COVID-19 ne sont pas encore adaptés à une utilisation clinique : étude


Plus d’information:
Xiang Bai et al, Faire progresser le diagnostic COVID-19 avec une collaboration préservant la confidentialité en intelligence artificielle, Nature Machine Intelligence (2021). DOI : 10.1038/s42256-021-00421-z

Fourni par l’Université de Cambridge

Citation: Un nouveau modèle améliore la précision de l’apprentissage automatique dans le diagnostic COVID-19 tout en préservant la confidentialité (2021, 16 décembre) récupéré le 16 décembre 2021 à partir de https://techxplore.com/news/2021-12-accuracy-machine-covid-diagnosis-privacy .html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.