Хабрахабр

«Принцип макарон»: ученые организовали произвольный доступ к ДНК-памяти

Ученым из Иллинойсского университета в Урбане-Шампейне удалось реализовать ДНК-хранилище со случайным (произвольным) доступом к данным. Об их подходе и о том, что общего у цепочек ДНК с макаронами, расскажем далее.


/ фото Tim Sackton CC

Как это работает

Для хранения данных в ДНК учёные преобразуют бинарный код в последовательности из четырёх азотистых оснований — аденина (A), тимина (T), гуанина (G) и цитозина (С). После они синтезируются в короткие цепочки, перекрывающие друг друга. Например, если цепочки состоят из ста пар оснований, то последние 75 пар из предыдущей цепочки будут первыми для следующей.

Приходится расшифровывать весь объём информации для получения одного файла. По этой причине получение доступа к произвольным «точкам в памяти» вызывает определенные сложности. Вероятность произвольно схватить ее невелика. Выбрать среди множества молекул необходимую, это все равно, что пытаться выловить конкретную макаронину из супа.

Если реплицировать одну и ту же макаронину снова и снова до тех пор, пока тарелка не заполнится, то любая из них будет нужной. Однако ученые из Иллинойсского университета нашли решение. Потому они решили синтезировать закодированные цепочки с дополнительными последовательностями, которые бы выступали в качестве адреса.

В результате ученые получили возможность определять и воспроизводить цепи ДНК с необходимыми данными, используя метод полимеразной цепной реакции. Эти адреса используются праймерами для идентификации цепочек ДНК, которые нужно реплицировать. Это упрощает процесс поиска копии желаемой цепочки.

Часть из них связана с особенностями работы секвенсоров. Сейчас ученые должны преодолеть ряд трудностей. Потому сейчас ведется работа над «кодами корректировки ошибок». Они подвержены воздействию ошибок замещения — оказалось сложно восстановить геном после того, как он был разбит на отдельные компоненты для чтения, и не перепутать сегменты.

Поэтому исследователям еще предстоит провести определенную работу, направленную на удешевление всех операций. Другая сложность — компании, которые занимаются синтезом ДНК, пока не готовы переходить на новые методы работы, так как их производственные процессы автоматизированы, и перестраивать их для генерации дополнительных цепочек слишком дорого.


/ фото University of Michigan CC

Кто еще занимается ДНК-хранилищами

Microsoft совместно с Вашингтонским университетом тоже работают над созданием ДНК-хранилища с произвольным доступом (мы писали об этом в одном из наших предыдущих материалов). И в начале года им удалось закодировать и безошибочно восстановить более 400 Мбайт данных. В дальнейшем объем хранилища планируется увеличить до 1 Тбайт и больше, а в Microsoft даже строят планы по добавлению ДНК-хранилища в свою облачную платформу.

Им удалось записать в бактерию анимацию с наездником на лошади, сонеты Шекспира, а один из исследователей — Джордж Черч (George Church) увековечил в ДНК свою книгу «Regenesis» (он создал 90 млрд её экземпляров). Также в этой области работают ученые из Гарварда.

Эта система — естественный защитный механизм, с помощью которого бактерии создают иммунитет к вторжению вирусов. Для записи и считывания информации биологи использовали систему CRISPR. Ученые закодировали желаемую информацию в спейсеры и передали её бактериям под видом вирусной ДНК. Они захватывают молекулы ДНК вирусов, генерируют так называемые спейсеры и «вставляют» их локус.

Когда наступит ДНК-будущее?

Несмотря на успех всех упомянутых экспериментов, ученые пока не могут поставить технологии «на поток» (в основном из-за высокой стоимости). Потому об их выходе на широкий рынок пока говорить не приходится.

Например, стартап Twist Bioscience «консервирует» пользовательские данные за 100 тысяч долларов (12 мегабайт). Однако уже сегодня есть коммерческие компании, которые предлагают своим клиентам услугу записи информации в ДНК. При этом руководство компании прогнозирует, что через пару лет стоимость записи снизится всего до 10 центов.

Она «выдавливает» молекулы A, T, G и C в 9,6 тыс. В Twist Bioscience синтезом ДНК-цепочек занимается специальная машина, внешне напоминающая струйный принтер. Эти крошечные лунки расположены на пластине из черного кремния размером с почтовую открытку. «нанолунок» диаметром с человеческий волос. Всего в Twist Bioscience синтезируют около 3 млн цепочек в день.

Кодированием музыкального наследия займутся сотрудники лаборатории в Цюрихе. Другой пример: британская трип-хоп группа Massive Attack в качестве подарка на свое двадцатилетие решила сохранить третий студийный альбом Mezzanine в ДНК. Результат их работы должен появиться через месяц.

P.S. Несколько постов из Первого блога о корпоративном IaaS:
P.P.S. Другие материалы из нашего блога на Хабре:

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть