Новое достижение учёных из Microsoft позволит создать эксабайтные диски

Новое достижение учёных из Microsoft позволит создать эксабайтные диски
Перспектива появления огромных хранилищ данных, основанных на ДНК, стала вполне реальной благодаря новому методу извлечения данных.

Уже сейчас Microsoft видит в синтетической ДНК перспективный носитель информации, который сможет удовлетворить потребности в хранении больших данных. Предыдущие исследования показали, что всего лишь несколько грамм ДНК способны хранить в себе эксабайт данных, при этом срок их хранения составляет около 2000 лет.

Но главным недостатком этой технологии явялется дороговизна и медленность записи, которая включает в себя преобразование нулей и единиц в сенуклеотиды. Извлечение данных из ДНК представляет собой секвенирование и обратный перевод файлов в нули и единицы. Поиск и извлечение определенных файлов также является большой проблемой.

Но это осталось в прошлом — ученые из Microsoft Research и Вашингтонского университета впервые получили произвольный доступ к ДНК-носителю в крупном масштабе. Как они объяснили, отсутствие произвольного доступа или возможности выборочного извлечения файлов из ДНК-хранилища приводит к тому, что для нахождения нужных файлов пользователь должен секвенировать и декодировать весь набор данных. Получение произвольного доступа позволит уменьшить количество операций по секвенированию.

Для получения произвольного доступа к ДНК учёные создали библиотеку праймеров, которые прикреплены к каждой последовательности молекулы и используются в качестве мишеней для выбора нужных её фрагментов.

Исследователи также разработали алгоритм для более эффективного декодирования и восстановления данных. Старший научный сотрудник Microsoft Сергей Еханин отметил, что новые алгоритмы более терпимы к ошибкам в написании и чтении последовательностей ДНК, что сокращает секвенирование и обработку данных, необходимую для их восстановления.

В синтетической ДНК было закодировано 200 мегабайт данных, состоящих из 35 файлов объёмом от 29 килобайт до 44 мегабайт. В данных файлах содержатся HD-видео, аудиофайлы, изображения и тексты. Учёные полагают, что метод, который они использовали для случайного доступа, будет масштабироваться до физически изолированных ДНК-пулов, способных вмещать в себя несколько терабайт.

 
Источник

Читайте также