La nouvelle architecture matérielle offre un avantage dans le calcul de l'IA

À mesure que les applications de l’intelligence artificielle se répandent, davantage de calculs doivent être effectués – et plus efficacement avec une consommation d’énergie réduite – sur des appareils locaux plutôt que dans des centres de données géographiquement éloignés afin de surmonter les retards de réponse frustrants. Un groupe d’ingénieurs de l’Université de Tokyo a testé pour la première fois l’utilisation de matériaux ferroélectriques à base d’oxyde d’hafnium pour le calcul physique des réservoirs – un type de réseau neuronal qui cartographie les données sur des systèmes physiques et peut réaliser précisément une telle avancée – sur une application de reconnaissance vocale .

Ils ont décrit leurs résultats dans un article présenté au symposium hybride 2022 IEEE sur la technologie et les circuits VLSI, qui s’est tenu à Honolulu, Hawaï, du 12 au 17 juin.

Le développement de la technologie de l’intelligence artificielle (IA) et de sa myriade d’applications a explosé ces dernières années, mais un obstacle majeur à son déploiement ultérieur provient du coût colossal des calculs et de la consommation d’énergie, en particulier lorsque ces calculs sont effectués par des logiciels dont l’emplacement physique réside dans les données. centres à une distance considérable de l’utilisateur.

Même avec des données circulant sur les réseaux à la vitesse de la lumière, il peut y avoir des délais d’une fraction de seconde ou plus entre la demande d’un utilisateur et la livraison de la réponse d’une application. Cela est dû aux grandes distances parcourues par les photons entre l’utilisateur et le centre de données, parfois à un demi-monde de distance, puis reviennent. Pour les applications grand public, des jeux vidéo aux assistants vocaux, ce petit délai peut être frustrant, mais pour les applications critiques au sein du gouvernement, des soins de santé à la défense, de tels retards, appelés latence, peuvent coûter des vies.

Les informaticiens et les ingénieurs se concentrent sur deux lignes d’attaque pour surmonter ce défi : déplacer au moins une partie du calcul requis du logiciel vers le matériel, et des centres de données centralisés, ou cloud, vers un appareil local.

La première stratégie est nécessaire car cela n’a aucun sens de tenter des gains d’efficacité uniquement dans les programmes en cours d’exécution et pas également dans les machines sur lesquelles ils s’exécutent. La deuxième stratégie, connue sous le nom d’edge computing, réduit la latence car il y a simplement moins de distance à parcourir pour les données. Lorsque votre smartphone effectue les calculs impliqués dans une vérification biométrique (et non le centre de données à une certaine distance), il s’agit d’un exemple de la dispersion des calculs de l’informatique de pointe du cloud vers l’appareil.

Dernièrement, l’informatique de réservoir physique (PRC) – dans laquelle des gains d’efficacité sont obtenus dans le matériel de l’appareil local – a attiré beaucoup d’attention de la part des chercheurs en ingénierie pour sa capacité à faire progresser ces deux lignes d’attaque. Le PRC est une conséquence du développement des réseaux de neurones récurrents (RNN), un type d’apprentissage automatique bien adapté au traitement des données dans le temps (données temporelles) plutôt qu’à celui des données statiques. En effet, les RNN prennent en compte les informations des entrées précédentes pour considérer une entrée actuelle (donc “récurrente”), et à partir de là, la sortie. En raison de cette capacité à traiter des données temporelles, les RNN conviennent aux applications dont les conclusions (ou inférences) sont sensibles à la séquence des données ou au contexte temporel, telles que la reconnaissance vocale, le traitement du langage naturel ou la traduction de la langue, et utilisées par des applications telles que comme Google Traduction ou Siri.

Dans l’informatique de réservoir physique, les données d’entrée sont mappées sur des modèles dans un système physique ou un réservoir (tels que les modèles dans la structure d’un matériau magnétique, un système de photons ou un dispositif mécanique), qui bénéficie d’un espace dimensionnel plus élevé que l’entrée. (Un morceau de papier est un espace qui a une dimension supérieure à un morceau de ficelle, et une boîte a encore une dimension de plus que le morceau de papier.) Ensuite, une analyse de modèle est effectuée sur les modèles spatio-temporels sur la lecture finale “couche” pour comprendre l’état du réservoir. Étant donné que l’IA n’est pas formée sur les connexions récurrentes au sein du réservoir, mais uniquement sur la lecture, des algorithmes d’apprentissage plus simples sont réalisables, réduisant considérablement le calcul requis, permettant un apprentissage à grande vitesse et réduisant la consommation d’énergie.

Les ingénieurs de l’Université de Tokyo avaient précédemment conçu une nouvelle architecture PRC qui utilise des transistors à grille ferroélectrique (FeFET) constitués de matériaux ferroélectriques à base d’oxyde d’hafnium. La plupart des gens connaissent le ferromagnétisme, dans lequel un aimant en fer est magnétisé en permanence dans une direction polaire particulière (une partie de l’aimant devient son “nord” et l’autre extrémité son “sud”). La ferroélectricité implique un phénomène analogue dans lequel certains matériaux – dans ce cas l’oxyde d’hafnium et l’oxyde de zirconium – subissent une polarisation électrique (un déplacement de charge électrique positive et négative) qui peut ensuite être inversée par l’application d’un champ électrique externe. Cette polarisation commutable peut ainsi stocker de la mémoire comme n’importe quel transistor. En 2020, les chercheurs avaient également démontré qu’une opération basique de calcul de réservoir était possible en utilisant ces matériaux.

“Ces matériaux sont déjà couramment utilisés dans les processus de fabrication de circuits intégrés à semi-conducteurs”, a déclaré Shinichi Takagi, co-auteur de l’article et professeur au Département de génie électrique et des systèmes d’information de l’Université de Tokyo. “Cela signifie que les réservoirs FeFET devraient être intégrés à la fabrication de circuits intégrés à semi-conducteurs à grande échelle avec peu de difficulté par rapport à un matériau plus nouveau.”

Alors que les matériaux ferroélectriques à base d’oxyde d’hafnium avaient suscité beaucoup d’attention dans l’industrie des semi-conducteurs en raison de leur ferroélectricité, le type d’applications pour lesquelles l’informatique de réservoir physique à base de FeFET était adaptée et ses performances dans les applications réelles n’avaient pas encore été étudiées.

Après avoir prouvé la faisabilité de leur architecture PRC il y a deux ans, les chercheurs l’ont ensuite testée sur une application de reconnaissance vocale. Ils ont trouvé qu’il était précis à 95,9 % pour la reconnaissance vocale des nombres de zéro à neuf. Cela a prouvé pour la première fois la facilité d’utilisation de la technologie dans une application réelle.

Les chercheurs veulent maintenant voir s’ils peuvent augmenter les performances de calcul de leurs réservoirs FeFET, ainsi que les tester sur d’autres applications.

En fin de compte, les chercheurs espèrent démontrer qu’une puce d’IA avec l’architecture PRC ferroélectrique à base d’oxyde d’hafnium peut atteindre un haut niveau de performance en termes de consommation d’énergie extrêmement faible et de traitement en temps réel par rapport aux méthodes de calcul et au matériel d’IA conventionnels.

Construire une nouvelle mémoire de stockage de données

Plus d’information:
E. Nako, K. Toprasertpong, R. Nakane, M. Takenaka et S. Takagi, “Démonstration expérimentale d’un nouveau schéma de calcul de réservoir HZO/Si FeFET avec traitement parallèle des données pour la reconnaissance vocale”, Symposium IEEE 2022 sur la technologie VLSI et Circuits : 12-17 juin 2022.

Conférence : www.vlsisymposium.org/

Fourni par l’Université de Tokyo

Citation: Une nouvelle architecture matérielle fournit un avantage dans le calcul de l’IA (13 juin 2022) récupéré le 13 juin 2022 sur https://techxplore.com/news/2022-06-hardware-architecture-edge-ai.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.

La nouvelle architecture matérielle offre un avantage dans le calcul de l’IA

J’aime ça :

testeurjoe

Laisser un commentaireAnnuler la réponse.

Partager :

J’aime ça :

testeurjoe

Vous pourriez aussi aimer

Économies spectaculaires de 102 $ sur cet épique moniteur de jeu HP Omen 27″ 4K

L'outil de fabrication de puces High-NA d'ASML coûtera 380 millions de dollars. La société a déjà commandé entre 10 et 20 machines et accélère sa production.

Carte mère MSI A620 répertoriée pour 87 €, prix inférieur à 100 $ US pour les PC AMD AM5 abordables

Laisser un commentaireAnnuler la réponse.