Apprivoiser le déluge de données en enrichissant les algorithmes d’IA de nouveaux processeurs

Apprivoiser le déluge de données

La vision d’A3D3 est d’établir une organisation étroitement couplée de scientifiques du domaine, d’informaticiens et d’ingénieurs qui unissent trois composants essentiels qui sont essentiels pour réaliser l’IA en temps réel pour transformer la science : les techniques d’IA, le matériel informatique et les applications scientifiques. Crédit : A3D3

Un tsunami de données imminent menace de submerger d’énormes projets de recherche riches en données dans des domaines allant du minuscule neutrino à l’explosion d’une supernova, ainsi que les mystères au plus profond du cerveau.

Lorsque LIGO capte un signal d’onde gravitationnelle provenant d’une collision lointaine de trous noirs et d’étoiles à neutrons, une horloge se met en marche pour capturer la lumière la plus précoce possible qui peut les accompagner : le temps est essentiel dans cette course. Les données recueillies à partir de capteurs électriques surveillant l’activité cérébrale dépassent les capacités de calcul. Les informations provenant des faisceaux de particules brisées du Grand collisionneur de hadrons (LHC) dépasseront bientôt 1 pétabit par seconde.

Pour s’attaquer en temps réel à ce goulot d’étranglement des données qui approche, une équipe de chercheurs de neuf institutions dirigée par l’Université de Washington, dont le MIT, a reçu un financement de 15 millions de dollars pour établir l’institut Accelerated AI Algorithms for Data-Driven Discovery (A3D3). Du MIT, l’équipe de recherche comprend Philip Harris, professeur adjoint de physique, qui servira de directeur adjoint de l’Institut A3D3; Song Han, professeur adjoint de génie électrique et d’informatique, qui sera le co-PI de l’A3D3 ; et Erik Katsavounidis, chercheur principal au MIT Kavli Institute for Astrophysics and Space Research.

Infusé de cette subvention de cinq ans Harnessing the Data Revolution Big Idea, et financé conjointement par l’Office of Advanced Cyberinfrastructure, A3D3 se concentrera sur trois domaines riches en données : l’astrophysique multi-messagers, la physique des particules de haute énergie et les neurosciences en imagerie cérébrale. En enrichissant les algorithmes d’IA de nouveaux processeurs, A3D3 cherche à accélérer les algorithmes d’IA pour résoudre les problèmes fondamentaux de la physique des collisionneurs, de la physique des neutrinos, de l’astronomie, de la physique des ondes gravitationnelles, de l’informatique et des neurosciences.

« Je suis très enthousiasmé par les opportunités de recherche du nouvel institut en physique nucléaire et des particules », a déclaré Boleslaw Wyslouch, directeur du Laboratoire de sciences nucléaires. « Les détecteurs de particules modernes produisent une énorme quantité de données, et nous recherchons des signatures extraordinairement rares. L’application de processeurs extrêmement rapides pour passer au crible ces montagnes de données fera une énorme différence dans ce que nous allons mesurer et découvrir. »

Les graines d’A3D3 ont été plantées en 2017, lorsque Harris et ses collègues du Fermilab et du CERN ont décidé d’intégrer des algorithmes d’IA en temps réel pour traiter les taux incroyables de données au LHC. Grâce à une correspondance par courrier électronique avec Han, l’équipe de Harris a construit un compilateur, HLS4ML, capable d’exécuter un algorithme d’IA en quelques nanosecondes.

« Avant le développement de HLS4ML, le traitement le plus rapide que nous connaissions était d’environ une milliseconde par inférence d’IA, peut-être un peu plus rapide », explique Harris. « Nous avons réalisé que tous les algorithmes d’IA étaient conçus pour résoudre des problèmes beaucoup plus lents, tels que la reconnaissance d’images et de voix. Pour atteindre des échelles de temps d’inférence de la nanoseconde, nous avons reconnu que nous pouvions créer des algorithmes plus petits et nous appuyer sur des implémentations personnalisées avec des processeurs Field Programmable Gate Array (FPGA) dans une approche largement différente de ce que faisaient les autres. »

Quelques mois plus tard, Harris a présenté ses recherches lors d’une réunion de faculté de physique, où Katsavounidis est devenu intrigué. Au cours d’un café dans le bâtiment 7, ils ont discuté de la combinaison du FPGA de Harris avec l’utilisation de l’apprentissage automatique par Katsavounidis pour trouver les ondes gravitationnelles. Les FPGA et autres nouveaux types de processeurs, tels que les unités de traitement graphique (GPU), accélèrent les algorithmes d’IA pour analyser plus rapidement d’énormes quantités de données.

« J’avais travaillé avec les premiers FPGA qui étaient sur le marché au début des années 90 et j’ai été témoin de la façon dont ils ont révolutionné l’électronique frontale et l’acquisition de données dans les grandes expériences de physique des hautes énergies sur lesquelles je travaillais à l’époque », se souvient Katsavounidis. « La possibilité de leur faire analyser les données des ondes gravitationnelles me trotte dans la tête depuis que j’ai rejoint LIGO il y a plus de 20 ans. »

Il y a deux ans, ils ont reçu leur première subvention, et Shih-Chieh Hsu de l’Université de Washington s’est joint à eux. L’équipe a lancé le Fast Machine Lab, publié environ 40 articles sur le sujet, construit le groupe à environ 50 chercheurs et  » l’industrie sur la façon d’explorer une région de l’IA qui n’a pas été explorée dans le passé », explique Harris. « Nous avons essentiellement commencé cela sans aucun financement. Nous avons reçu de petites subventions pour divers projets au fil des ans. A3D3 représente notre première grande subvention pour soutenir cet effort. »

« Ce qui rend A3D3 si spécial et adapté au MIT, c’est son exploration d’une frontière technique, où l’IA n’est pas implémentée dans un logiciel de haut niveau, mais plutôt dans un micrologiciel de niveau inférieur, reconfigurant des portes individuelles pour répondre à la question scientifique », explique Rob Simcoe, directeur du MIT Kavli Institute for Astrophysics and Space Research et Francis Friedman Professor of Physics. « Nous sommes à une époque où les expériences génèrent des torrents de données. L’accélération obtenue grâce à la personnalisation d’ordinateurs reprogrammables et sur mesure au niveau du processeur peut faire avancer l’analyse en temps réel de ces données à de nouveaux niveaux de vitesse et de sophistication. »

Les énormes données du Grand collisionneur de hadrons

Avec des débits de données dépassant déjà les 500 térabits par seconde, le LHC traite plus de données que tout autre instrument scientifique sur terre. Ses futurs débits de données agrégés dépasseront bientôt 1 pétabit par seconde, le plus grand débit de données au monde.

« Grâce à l’utilisation de l’IA, A3D3 vise à effectuer des analyses avancées, telles que la détection d’anomalies et la reconstruction de particules sur toutes les collisions se produisant 40 millions de fois par seconde », explique Harris.

L’objectif est de trouver dans toutes ces données un moyen d’identifier les quelques collisions sur les 3,2 milliards de collisions par seconde qui pourraient révéler de nouvelles forces, expliquer la formation de la matière noire et compléter le tableau de la façon dont les forces fondamentales interagissent avec la matière. Le traitement de toutes ces informations nécessite un système informatique personnalisé capable d’interpréter les informations du collisionneur avec des latences ultra-faibles.

« Le défi de l’exécuter sur l’ensemble des 100 térabits par seconde en temps réel est intimidant et nécessite une refonte complète de la façon dont nous concevons et implémentons les algorithmes d’IA », explique Harris. « Avec de fortes augmentations de la résolution du détecteur conduisant à des débits de données encore plus importants, le défi de trouver une collision parmi tant d’autres deviendra encore plus intimidant. »

Le cerveau et l’univers

Grâce aux progrès de techniques telles que l’imagerie médicale et les enregistrements électriques à partir d’électrodes implantées, les neurosciences collectent également de plus grandes quantités de données sur la façon dont les réseaux neuronaux du cerveau traitent les réponses aux stimuli et effectuent les informations motrices. A3D3 prévoit de développer et de mettre en œuvre des algorithmes d’IA à haut débit et à faible latence pour traiter, organiser et analyser des ensembles de données neuronales massifs en temps réel, pour sonder la fonction cérébrale afin de permettre de nouvelles expériences et thérapies.

Avec l’astrophysique multi-messagers (MMA), A3D3 vise à identifier rapidement les événements astronomiques en traitant efficacement les données des ondes gravitationnelles, des sursauts gamma et des neutrinos captés par les télescopes et les détecteurs.

Les chercheurs A3D3 comprennent également un groupe multidisciplinaire de 15 autres chercheurs, dont le chef de projet de l’Université de Washington, ainsi que Caltech, Duke University, Purdue University, UC San Diego, University of Illinois Urbana-Champaign, University of Minnesota, et le L’universite de Wisconsin-Madison. Il comprendra la recherche sur les neutrinos à Icecube et DUNE, et l’astronomie visible à Zwicky Transient Facility, et organisera des ateliers d’apprentissage en profondeur et des camps d’entraînement pour former les étudiants et les chercheurs sur la manière de contribuer au cadre et d’élargir l’utilisation de stratégies d’IA rapides.

« Nous avons atteint un point où la croissance du réseau de détecteurs sera transformatrice, à la fois en termes de taux d’événements et en termes de portée astrophysique et, finalement, de découvertes », a déclaré Katsavounidis. «  » Rapide  » et  » efficace  » est le seul moyen de combattre le  » faible  » et le  » flou  » qui existent dans l’univers, et la voie pour tirer le meilleur parti de nos détecteurs. A3D3 d’une part va apporter l’IA à l’échelle de la production à la physique des ondes gravitationnelles et à l’astronomie multi-messagers ; mais d’un autre côté, nous aspirons à aller au-delà de nos domaines immédiats et à devenir le lieu de prédilection à travers le pays pour les applications de l’IA accélérée aux disciplines axées sur les données.  »


Augmenter la puissance de calcul pour l’avenir de la physique des particules


Plus d’information:
Alec Gunny et al, Inférence accélérée par le matériel pour l’astronomie des ondes gravitationnelles en temps réel. arXiv : 2108.12430v1 [gr-qc], arxiv.org/abs/2108.12430

Fourni par le Massachusetts Institute of Technology

Cette histoire est republiée avec l’aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l’actualité de la recherche, de l’innovation et de l’enseignement du MIT.

Citation: Apprivoiser le déluge de données en enrichissant les algorithmes d’IA de nouveaux processeurs (2021, 1er novembre) récupéré le 1er novembre 2021 sur https://techxplore.com/news/2021-11-deluge-enriching-ai-algorithms-processors.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.