La plate-forme d’apprentissage automatique à guichet unique transforme les données de soins de santé en informations

La plate-forme d'apprentissage automatique à guichet unique transforme les données de soins de santé en informations

En guidant les données hospitalières à travers un ensemble toujours croissant de modèles d’apprentissage automatique, Cardea est conçu pour aider les hôpitaux à planifier des événements aussi importants que les pandémies mondiales et aussi petits que les rendez-vous de non-présentation. Crédits: Arash Akhgari

Au cours de la dernière décennie, les hôpitaux et autres prestataires de soins de santé ont consacré énormément de temps et d’énergie à l’adoption de dossiers de santé électroniques, transformant à la hâte les notes des médecins griffonnées en sources d’informations durables. Mais la collecte de ces données représente moins de la moitié de la bataille. Cela peut prendre encore plus de temps et d’efforts pour transformer ces enregistrements en informations réelles – celles qui utilisent les apprentissages du passé pour éclairer les décisions futures.

Cardea, un système logiciel conçu par des chercheurs et des ingénieurs logiciels du Data to AI Lab du MIT (DAI Lab), est conçu pour y parvenir. En guidant les données hospitalières à travers un ensemble toujours croissant de modèles d’apprentissage automatique, le système pourrait aider les hôpitaux à planifier des événements aussi importants que des pandémies mondiales et aussi petits que des rendez-vous de non-présentation.

Avec Cardea, les hôpitaux pourraient éventuellement être en mesure de résoudre «des centaines de types différents de problèmes d’apprentissage automatique», déclare Kalyan Veeramanchaneni, chercheur principal du DAI Lab et chercheur principal au Laboratoire des systèmes d’information et de décision (LIDS) du MIT. Parce que le framework est open-source et utilise des techniques généralisables, ils peuvent également partager ces solutions entre eux, augmentant ainsi la transparence et permettant le travail d’équipe.

Automatisé pour le peuple

Cardea appartient à un domaine appelé apprentissage automatique automatisé, ou AutoML. L’apprentissage automatique est de plus en plus courant, utilisé pour tout, du développement de médicaments à la détection de la fraude par carte de crédit. L’objectif d’AutoML est de démocratiser ces outils prédictifs, ce qui permet aux personnes – y compris, éventuellement, aux non-experts – de les construire, de les utiliser et de les comprendre, explique Veeramachaneni.

Au lieu d’obliger les gens à concevoir et à coder un modèle d’apprentissage automatique complet, les systèmes AutoML comme Cardea exposent ceux qui existent déjà, ainsi que des explications sur ce qu’ils font et comment ils fonctionnent. Les utilisateurs peuvent ensuite mélanger et assortir les modules pour atteindre leurs objectifs, comme aller à un buffet plutôt que de cuisiner un repas à partir de zéro.

Par exemple, les scientifiques des données ont créé un certain nombre d’outils d’apprentissage automatique pour les soins de santé, mais la plupart d’entre eux ne sont pas très accessibles, même pour les experts. «Ils sont écrits dans des papiers et cachés», explique Sarah Alnegheimish, étudiante diplômée de LIDS. Pour construire Cardea, elle et ses collègues ont déniché ces outils et les ont réunis, dans le but de former «une référence puissante» pour les résolveurs de problèmes hospitaliers, dit-elle.

Pas à pas

Pour transformer des rames de données en prédictions utiles, Cardea guide les utilisateurs à travers un pipeline, avec des choix et des sauvegardes à chaque étape. Ils sont d’abord accueillis par un assembleur de données, qui ingère les informations qu’ils fournissent. Cardea est conçu pour fonctionner avec Fast Healthcare Interoperability Resources (FHIR), la norme actuelle de l’industrie pour les dossiers de santé électroniques.

Les hôpitaux varient dans la manière dont ils utilisent exactement le FHIR, c’est pourquoi Cardea a été conçu pour «s’adapter à différentes conditions et à différents ensembles de données de manière transparente», déclare Veeramachaneni. S’il y a des divergences dans les données, l’auditeur de données de Cardea les signale, afin qu’elles puissent être corrigées ou rejetées.

Ensuite, Cardea demande à l’utilisateur ce qu’il veut savoir. Peut-être voudraient-ils estimer combien de temps un patient peut rester à l’hôpital. Même des questions apparemment petites comme celle-ci sont cruciales lorsqu’il s’agit des opérations hospitalières quotidiennes – surtout maintenant, car les établissements de santé gèrent leurs ressources pendant la pandémie de COVID-19, dit Alnegheimish. Les utilisateurs peuvent choisir entre différents modèles, et le système logiciel utilise ensuite l’ensemble de données et les modèles pour apprendre les modèles des patients précédents et pour prédire ce qui pourrait se passer dans ce cas, aidant les parties prenantes à planifier à l’avance.

Actuellement, Cardea est configuré pour répondre à quatre types de questions sur l’affectation des ressources. Mais comme le pipeline incorpore autant de modèles différents, il peut être facilement adapté à d’autres scénarios qui pourraient survenir. À mesure que Cardea se développe, l’objectif est que les parties prenantes puissent éventuellement l’utiliser pour «résoudre tout problème de prédiction dans le domaine des soins de santé», explique Alnegheimish.

L’équipe a présenté son article décrivant le système à la Conférence internationale de l’IEEE sur la science des données et l’analyse avancée en octobre 2020. Les chercheurs ont testé l’exactitude du système par rapport aux utilisateurs d’une plate-forme populaire de science des données et ont constaté qu’il dépassait 90% des eux. Ils ont également testé son efficacité, demandant aux analystes de données d’utiliser Cardea pour faire des prédictions sur un ensemble de données de démonstration sur les soins de santé. Ils ont constaté que Cardea avait considérablement amélioré leur efficacité – par exemple, l’ingénierie des fonctionnalités, qui, selon les analystes, leur prenait généralement en moyenne deux heures, leur prenait cinq minutes à la place.

Faites confiance au processus

Le personnel hospitalier est souvent chargé de prendre des décisions importantes et critiques. Il est essentiel qu’ils fassent confiance à tous les outils qu’ils utilisent en cours de route, y compris Cardea. Il ne suffit pas aux utilisateurs de brancher des chiffres, d’appuyer sur un bouton et d’obtenir une réponse: «Ils doivent avoir une idée du modèle et savoir ce qui se passe», déclare Dongyu Liu, post-doctorant à LIDS.

Pour renforcer encore plus la transparence, la prochaine étape de Cardea est un audit de modèle. Comme tous les appareils prédictifs, les modèles d’apprentissage automatique ont des forces et des faiblesses. En les présentant, Cardea donne à l’utilisateur la possibilité de décider d’accepter les résultats de ce modèle ou de recommencer avec un nouveau.

Cardea a été rendu public plus tôt cette année. Parce qu’il est open source, les utilisateurs sont invités à intégrer leurs propres outils. L’équipe a également veillé à ce que le système logiciel soit non seulement disponible, mais aussi compréhensible et facile à utiliser. Cela aidera également à la reproductibilité, dit Veeramachaneni, de sorte que les prédictions faites sur les modèles construits avec le logiciel puissent être comprises et vérifiées par d’autres.

L’équipe prévoit également d’intégrer davantage de visualiseurs de données et d’explications, afin de fournir une vue encore plus approfondie et de rendre le système logiciel plus accessible aux non-experts, explique Liu.

«L’espoir est que les gens l’adoptent et commencent à y contribuer», dit Alnegheimish. « Avec l’aide de la communauté, nous pouvons en faire quelque chose de beaucoup plus puissant. »


Les chercheurs construisent des modèles à l’aide d’une technique d’apprentissage automatique pour améliorer les prédictions des résultats du COVID-19


Plus d’information:
Cardea: un cadre d’apprentissage automatique automatisé ouvert pour les dossiers de santé électroniques. arXiv: 2010.00509 [cs.LG] arxiv.org/abs/2010.00509

Fourni par le Massachusetts Institute of Technology

Cette histoire est republiée avec l’aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l’actualité de la recherche, de l’innovation et de l’enseignement du MIT.

Citation: La plate-forme d’apprentissage automatique à guichet unique transforme les données de soins de santé en informations (12 avril 2021) récupéré le 14 avril 2021 sur https://techxplore.com/news/2021-04-one-stop-machine-platform-health-insights. html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.