Une nouvelle version du stockage de données ADN permet aux utilisateurs de prévisualiser les fichiers stockés

ADN

Un fragment d’ADN double brin. Crédit : Vcpmartin/Wikimedia/CC BY-SA 4.0

Des chercheurs de l’Université d’État de Caroline du Nord ont transformé un défi de longue date du stockage de données ADN en un outil, l’utilisant pour offrir aux utilisateurs des aperçus des fichiers de données stockés, tels que des versions miniatures de fichiers image.

Le stockage de données ADN est une technologie attrayante car il a le potentiel de stocker une énorme quantité de données dans un petit paquet, il peut stocker ces données pendant une longue période, et il le fait de manière économe en énergie. Cependant, jusqu’à présent, il n’était pas possible de prévisualiser les données d’un fichier stocké sous forme d’ADN. Si vous vouliez savoir ce qu’était un fichier, vous deviez « ouvrir » le fichier en entier.

« L’avantage de notre technique est qu’elle est plus efficace en termes de temps et d’argent », explique Kyle Tomek, auteur principal d’un article sur le travail et d’un doctorat. étudiant à NC State. « Si vous n’êtes pas sûr du fichier contenant les données que vous souhaitez, vous n’avez pas besoin de séquencer tout l’ADN dans tous les fichiers potentiels. Au lieu de cela, vous pouvez séquencer des portions beaucoup plus petites des fichiers ADN pour servir d’aperçus. « 

Voici un aperçu rapide de la façon dont cela fonctionne.

Les utilisateurs « nomment » leurs fichiers de données en attachant des séquences d’ADN appelées séquences de liaison d’amorces aux extrémités des brins d’ADN qui stockent des informations. Pour identifier et extraire un fichier donné, la plupart des systèmes utilisent la réaction en chaîne par polymérase (PCR). Plus précisément, ils utilisent une petite amorce d’ADN qui correspond à la séquence de liaison à l’amorce correspondante pour identifier les brins d’ADN contenant le fichier souhaité. Le système utilise ensuite la PCR pour faire de nombreuses copies des brins d’ADN pertinents, puis séquence l’ensemble de l’échantillon. Parce que le processus fait de nombreuses copies des brins d’ADN ciblés, le signal des brins ciblés est plus fort que le reste de l’échantillon, ce qui permet d’identifier la séquence d’ADN ciblée et de lire le fichier.

Cependant, un défi auquel les chercheurs en stockage de données ADN ont été confrontés est que si deux fichiers ou plus ont des noms de fichiers similaires, la PCR copiera par inadvertance des morceaux de plusieurs fichiers de données. En conséquence, les utilisateurs doivent donner aux fichiers des noms très distincts pour éviter d’avoir des données désordonnées.

« À un moment donné, il nous est venu à l’esprit que nous pourrions peut-être utiliser ces interactions non spécifiques comme un outil, plutôt que de les considérer comme un problème », explique Albert Keung, co-auteur d’un article sur le travail et assistant. professeur de génie chimique et biomoléculaire à NC State.

Plus précisément, les chercheurs ont développé une technique qui utilise des noms de fichiers similaires pour leur permettre d’ouvrir un fichier entier ou un sous-ensemble spécifique de ce fichier. Cela fonctionne en utilisant une convention de nommage spécifique lors du nommage d’un fichier et d’un sous-ensemble donné du fichier. Ils peuvent choisir d’ouvrir l’intégralité du fichier, ou seulement la version « preview », en manipulant plusieurs paramètres du processus PCR : la température, la concentration d’ADN dans l’échantillon, et les types et concentrations de réactifs dans l’échantillon.

« Notre technique rend le système plus complexe », déclare James Tuck, co-auteur de l’article et professeur d’ingénierie informatique à NC State. « Cela signifie que nous devons être encore plus prudents dans la gestion des conventions de nommage des fichiers et des conditions de la PCR. Cependant, cela rend le système à la fois plus efficace en matière de données et considérablement plus convivial.

Les chercheurs ont démontré leur technique en enregistrant quatre gros fichiers d’images JPEG dans le stockage de données ADN et en récupérant les vignettes de chaque fichier, ainsi que les fichiers haute résolution complets dans leur intégralité.

« Bien que nous n’ayons stocké que des fichiers image, cette technologie est largement compatible avec d’autres types de fichiers. Elle fournit également cette nouvelle fonctionnalité sans coût supplémentaire », déclare Kevin Volkel, co-auteur de l’ouvrage et titulaire d’un doctorat. étudiant à NC State.

La nouvelle technique de « prévisualisation du fichier » est également compatible avec le système d’enrichissement de l’ADN et de séparation emboîtée (DENSe) que les chercheurs ont créé pour rendre le stockage des données ADN plus pratique. DENSe a effectivement rendu les systèmes de stockage d’ADN plus évolutifs en introduisant des techniques améliorées pour l’étiquetage et la récupération des fichiers de données.

« Nous recherchons actuellement des partenaires industriels pour nous aider à explorer la viabilité commerciale de la technologie », a déclaré Keung.

L’article, « Promiscuous Molecules for Smarter File Operations in DNA-based Data Storage », sera publié le 10 juin dans Communication Nature. Le document a été co-écrit par Elaine Indermaur, une ancienne étudiante de premier cycle à NC State.


La recherche surmonte les principaux obstacles à l’extension du stockage des données ADN


Plus d’information:
« Molécules prometteuses pour des opérations de fichiers plus intelligentes dans le stockage de données basé sur l’ADN », Communication Nature (2021). DOI : 10.1038/s41467-021-23669-w

Fourni par l’Université d’État de Caroline du Nord

Citation: Une nouvelle version du stockage des données ADN permet aux utilisateurs de prévisualiser les fichiers stockés (2021, 10 juin) récupérés le 10 juin 2021 à partir de https://techxplore.com/news/2021-06-dna-storage-users-preview.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.