Хабрахабр

ДНК. Механизмы хранения и обработки информации. Часть II

Привет Хабр! Сегодня мы продолжим прошлый рассказ о ДНК. В нем мы поговорили о том, сколько ее бывает, как ДНК хранится и почему так важно то, как она хранится. Сегодня мы начнем с исторической справки и закончим основами кодирования информации в ДНК.

История

Сама по себе ДНК была выделена еще в 1869 году Иоганном Фридрихом Мишером из лейкоцитов, которые он получал из гноя. Лейкоциты это белые клетки крови, выполняющие защитную функцию. В гное их довольно много, ведь они стремятся к поврежденным тканям, где «поедают» бактериальные клетки. Он выделил вещество, в состав которого входят азот и фосфор. Вначале оно получило название нуклеин, однако, когда у него обнаружили кислотные свойства, название изменили на нуклеиновую кислоту. Биологическая функция новооткрытого вещества была неясна, и долгое время считалась, что в нем запасается фосфор. Даже в начале XX века многие биологи считали, что ДНК не имеет никакого отношения к передаче информации, поскольку строение молекулы, как тогда казалось, было слишком однообразным и не могло закодировать столько информации.
К 1901 году Альбрехт Коссель выделил и описал пять азотистых оснований, входящих в состав ДНК и РНК. А еще чуть позже Петр Левен установил, что углеводным компонентом нуклеиновых кислот являются дезоксирибоза и рибоза. Нуклеиновые кислоты, в состав которых входит рибоза стали называть рибонуклеиновыми кислотами или, сокра­щенно, РНК, а те, которые содержали дезоксирибозу, дезоксирибонуклеиновыми кислотами, или ДНК.

Для этого цепи ДНК нужно было разрушить и посмотреть на то, что получится после разрушения. Теперь, встал вопрос, как отдельные звенья соединены между собой. Однако Левен изменил метод гидролиз. Для этого полимер ДНК подвергался гидролизу. На этот раз из гидролизатов удалось выделить не только отдельные аденин, гуанин, тимин, цитозин, дезоксирибозу и фосфорную кислоту, но и более крупные фраг­менты, например соединения азотистых оснований с углеводом или углевода с фосфорной кислотой. Теперь вместо многочасового кипячения в закисленной среде он использовал ферменты. То есть стало понятно, что фосфорная кислота соединяется с сахаром, а он в свою очередь, с азотистым основанием. Вместе с тем в гидролизатах нуклеиновых кислот не были обнаружены соедине­ния, состоящие из двух азотистых оснований, или соединения типа основание – фосфорная кислота. Соединения азотистых ос­нований с углеводом было предложено называть нуклеозидами, а фос­форные эфиры нуклеозидов назвали нуклеотидами.

В качестве мономеров служат нуклео­тиды. В результате этих работ Левен пришел к выводу, что нуклеиновые кислоты являются полимерами. Поэтому Левен предложил следую­щую теорию строения нуклеиновых кислот: они являются поли­мерами, мономерами которых служат блоки из четырех нуклео­тидов, соединенных последовательно.
Теория тетрануклеотидного строения в то время выглядела вполне обоснованно, войдя во все учебники довоенного времени. Содержание каждого из четырех нуклеотидов в ДНК, или РНК, по данным химического анализа того времени, представлялось Левену равным. Чтобы прояснить этот вопрос понадобилось почти полвека. Однако вопрос функции ДНК оставался неясным.

Наступил период, во время которого биологи накапливали сведения об распространении нуклеиновых кислот в различных типах животных и растительных тканей, в бактериях и вирусах, в некоторых одноклеточных организмах.

Традиционное представление о первичной роли белков в жизненном процессе не позволяло и думать о том, что столь важное ве­щество, как вещество наследственности, могло быть чем-либо, кроме белка. В то время научное сообщество всерьез полагало, что за хранение генетической информации ответственны именно белки. Известный советский генетик-цитолог Н. Белки были крайне разнообразны по своей структуре, чего тогда не могли сказать о нуклеиновых кислотах. Кольцов подсчитал, что, варьируя последовательность 20 аминокислот, входящих в состав белковой молекулы, можно создать триллионы непохожих друг на друга белков. К.

Если бы мы захотели напечатать в самой упрощенной форме, как печатаются логарифмические таблицы, этот триллион молекул и предоставили для выполнения этого плана все ныне существующие типографии мира, выпуская в год 50000 томов по 100 печатных листов, то до конца предпринятой работы протекло б столько времени, сколько его прошло с архейского периода д наших дней.

Действительно много… 20 в 20й… А ведь последовательности бывают куда длиннее чем 20 аминокислот.

Р. А вот как пишет по этому поводу А. Кизель – один из наиболее эрудированных биохимиков того времени.

Этого материала мы еще достоверно не знаем, несмотря на то, что он в большинстве случаев прямо называется белком. Из только что приведенных воззрений на роли нуклеиновой кислоты… вытекает ее непричастность к строению генов и следует, что гены составлены из какого-то другого материала.

Первый успех пришел из микробиологии. В 1944 г. были опубликованы результаты опытов Эвери и сотрудников (США) по трансформации бактерий. Пару слов о трансформации.

Сама трансформация была открыта в 1928 году микробиологом Гриффитсом.

Некоторые штаммы этой бактерии являются вирулентными, вызывая воспаление легких. Гриффит работал с культурами пневмококка (Streptococcus pneumoniae) возбудителя одной из форм пневмонии. В культуре такие бактерии образуют крупные гладкие колонии правильной сферической формы. Их клетки покрыты полисахаридной капсулой, защищающей бактерию от действия иммунной системы. Благодаря этому, они получили название S–штаммы (от английского smooth – гладкий).

Их называют IS, IIS, IIIS и т. Существуют различные вирулентные штаммы пневмококка, они отличаются по антителам, которые вырабатываются в организме при попадании в него бактерий. Время от времени некоторые клетки вирулентных штаммов S мутируют, утрачивая способность синтезировать полисахаридную оболочку, и становятся авирулентными. д. Иногда происходят обратные мутации, восстанавливающие способность к синтезу полисахаридной оболочки, но только в группах соответствующих штаммов: В культуре они образуют мелкие шероховатые колонии неправильной формы, из-за этого получили название R–штаммов (от английского rough – шероховатый).

IIS — IIR
IIIS — IIIR

Это говорит о том, что авирулентные R–штаммы всегда соответствуют родительскому вирулентному S–штамму.

В первой контрольной группе инъекция вирулентного штамма IIIS приводила к гибели животных. Гриффит вводил разным группам лабораторных мышей вирулентный и авирулентный штамм пневмококка. После этого Гриффит нагревал раствор с культурой вирулентого штамма IIIS при температуре 60 °С, что привело к гибели бактерий. Животные второй контрольной группы после инъекции авирулентного штамма IIR оставались живы. Животные остались живы, что в принципе и ожидалось. Убитые нагреванием бактерии он ввел третьей группе подопытных мышей. Он ввел части выживших мышей бактерии авирулентного штамма IIR. Однако это не все.

Однако вопреки ожиданиям, животные погибли. Казалось, ни к каким страшным последствиям для мышей это не могло привести. Когда из их тел были выделены бактерии и высеяны в культуру, оказалось, что они относятся к вирулентному штамму IIIS.

Из этого Гриффит сделал очень важный вывод. Тот факт, что вызывающие гибель мышей клетки синтезировали полисахаридную оболочку типа III, а не II, свидетельствовал о том, что они не могли возникнуть в результате обратной мутации IIR — IIS. Другими словами, авирулентные бактерии штамма IIR получают от мертвых бактерий штамма IIIS некий фактор, превращающий их в вирулентные. Авирулентные бактерии штамма IIR могут трансформироваться в вирулентные как-то взаимодействуя с убитыми нагреванием бактериями штамма IIIS, которые еще оставались в теле мышей. Однако, что это за фактор, Гриффит не знал.

Он представляет собой однонаправленный перенос наследственных признаков от одной бактериальной клетки к другой. Собственно этот феномен и был назван бактериальной трансформацией.

Схема их экспериментов несколько схожа с экспериментами Гриффитса. Теперь вернемся к опытам Эвери. Они разру­шали суспензию пневмококков и удаляли из экстракта белки, капсульный полисахарид и РНК, однако трансформирующая активность экстракта сохранялась. Эвери и сотрудники поставили перед собой задачу выяснить химическую природу трансформирующего агента. Было ясно, что препарат не являлся ни белком, ни РНК. Трансформирующая активность препарата не терялась при его обработке кристаллическим трипсином или химотрипсином (разрушающими белки), рибонуклеазой (разрушает РНК). Таким образом, было установлено, что трансформирующий фактор у бактерий является чис­той ДНК. Однако трансформирующая активность препарата полностью утрачивалась при обработке его дезоксирибонуклеазой (разрушающей ДНК), причем ничтожные количества фермента вызывали полную инактивацию препарата. Он писал, что это как раз то, о чем дав­но мечтали генетики, а именно вещество гена. Этот вывод явился значительным открытием, и Эвери отлично сознавал это. Но уж слишком сильна была вера в белок, как вещество наследственности. Кажется вот оно доказательство. Некоторые считали, что трансформацию могут вызывать и те ничтожные примеси белка, которые оставались в препарате.

Они работали с бактериофагом Т2 (Бактериофаги — вирусы бактерий), который заражает бактерию Escherichia coli (кишечную палочку). Новым доказательством прямой генетической роли ДНК явились опыты вирусологов Херши и Чейз.

В состав ДНК одних бактериофагов они включили радиоактивный фосфор (P32), а в состав белков других — изотоп серы (S35). Собственно что они сделали. Затем к этим бактериям добавлялся бактериофаг Т2, который, размножаясь в клетках бактерий, включал радиоактивную метку в свою ДНК (P есть в ДНК, но нет в белках), или белки (S есть в белках, но нет в ДНК). Для этого одни бактерии выращивались на среде с добавлением радиоактивного фосфора в составе фосфат иона, другие — на среде с добавлением радиоактивной серы в составе сульфат иона.

Что приводило к инфицированию этих бактерий. После выделения радиоактивно-меченых бактериофагов их добавляли к культуре свежих (не содержащих изотопов) бактерий. После этого среду с бактериями подвергали энергичному встряхиванию в специальном смесителе (было показано, что при этом оболочки фага отделяются от поверхности бактериальных клеток), а затем инфицированных бактерий отделяли от среды. Бактериофаг присоединяется к клетке бактерии и «впрыскивает» свою ДНК. Когда же во втором опыте к бактериям добавлялись бактериофаги, меченые серой-35, то метка была обнаружена во фракции среды с белковыми оболочками, но её не было в бактериальных клетках. Когда в первом опыте к бактериям добавлялись меченые фосфором-32 бактериофаги, оказалось, что радиоактивная метка находилась в бактериальных клетках. Поскольку внутри инфицированных бактерий формируются полные вирусные частицы, содержащие белки вируса, данный опыт стал одним из решающих доказательств того факта, что генетическая информация (информация о структуре белков) содержится в ДНК. Это подтвердило, что материалом, которым инфицировались бактерии, является ДНК.

В особенности на знаменитого своими правилами Чаргаффа. Эти открытия сильно повлияли на многих биологов того времени. Он считал, что Эвери по сути открыл 'новый язык', или как минимум показал, где его искать.

И, поскольку методов позволяющих точно дать химическую характеристику ДНК, в то время не существовало… ему пришлось их придумать. Чаргафф при­нялся искать разницу в нуклеотидном составе и расположении нуклеотидов в препаратах ДНК, полученных из различных источников. ДНК у разных организмов по составу и строению сильно отличаются. Им было показано, что старая тетрануклеотидная теория строения нуклеиновых кислот неверна. Сейчас даже школьники знают их, как правила Чаргаффа. При этом обнаружились новые факты, не установленные ранее для других природных полимеров, а именно регулярности в соотношении отдельных ос­нований в составе всех исследованных ДНК.

  1. Количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц.
  2. Количество пуринов равно количеству пиримидинов: А+Г=Т+Ц.
  3. Вытекает из первого и второго. Количество оснований с аминогруппами в положении 6 равно количеству оснований с кетогруппами в положении 6: А+Ц=Т+Г.

Механизм мы затрагивали в прошлой статье, поэтому тут я останавливаться на нем не буду.

Фрэнсис Крик и Джеймс Уотсон встретились впервые в 1951 году. Потихоньку мы подошли к двум легендарным людям, открывшим структуру ДНК. Как биолог, он понимал, что при выборе определенной структуры ДНК нужно учитывать существование какого-то простого принципа удвоения молеку­лы ДНК, заложенного в ее структуре. Уотсон тогда решил заняться структурой ДНК. В то вре­мя рентгенограммы ДНК уже существовали. Ведь одним из важнейших свойств генов является передача наследственной информации.
Криком же была создана теория дифракции рентгеновских лучей на спи­ралях, позволяющая опреде­лить, находится исследуемая структура в спиральной конформации или нет. Их получили в Лондоне Морис Уилкинс и Розалинд Фрэнклин.

Они знали также, что молекула ДНК представляет собой длинную линейную полимерную цепь, состоящую из мономеров-нуклеотидов. По характеру рентгенограммы ДНК Уотсон и Крик поняли, что исследуемая структура находится в спираль­ной конформации. Для построения моделей оставалось решить вопрос, сколько цепей линейного полимера уложено в компактную структуру. Фосфодезоксирибозный костяк этого полимера непрерывен, а сбоку к дезоксирибозным остаткам присоединены азотистые основания.

Что в последствии подтвердилось. На основании рентгенограммы В-формы ДНК Уотсон и Крик предположили, что молекула ДНК состоит из двух линейных полинуклеотидных цепей с фосфодезоксирибозным остовом снаружи молекулы и азотистыми основаниями внутри ее. Оставалось только решить вопрос о порядке расположения азотистых оснований двух цепей внутри биспирали.

Сразу же объяснялись и правила Чаргаффа: если в биспирали ДНК аденин одной цепи всегда соединяется с тимином другой цепи, а гуанин всегда входит в паре с цитозином, то аденина в составе ДНК должно быть всегда столько же, сколько тимина, а гуанина – столько же, сколько цитозина. Рассматривая возможные комбинации пар азоти­стых оснований, Уотсон обнаружил, что пары аденин–тимин и гуанин–цитозин имеют одинаковый размер и ста­билизируются водородными связями. Каждая цепь комплементарна другой, и в процессе репликации ДНК цепи биспирали должны разойтись и на каж­дой полинуклеотидной цепи должна достроиться комплемен­тарная к ней цепь. Ясно было также, как должно происходить удвоение молекулы ДНК. Тут тоже было несколько теорий, но о них через неделю, в следующей статье.

Кодирование информации

Итак, мы знаем, что ДНК — носитель информации, знаем из чего она состоит. Но как кодирует информацию — все еще не понятно.

ДНК кодирует 20 аминокислот (можно сказать, что 21, но селеноцистенин пока не трогаем). Пойдем от задачи. То есть один нуклеотид может кодировать 4 варианта, 2 — 16, 3 -64. Нуклеотидов имеется 4 варианта. Про экспериментальное подтверждение можете почитать здесь. Логично предположить, что код — триплетен (то есть три основания кодируют одну аминокислоту). Боюсь, что тут и без того много истории…

Аминокислоты могут кодироваться разными кодонами. Собственно у нас есть 64 варианта и 20 аминокислот. Помним, что в РНК нет тимина, вместо него идет урацил. Так же существуют старт и стоп кодоны, с которых начинается считывание.
Не забываем, что сначала ДНК считывается в РНК, с которой уже происходит считывание в белок.
Таблица внизу — соответствие кодонов РНК аминокислотам.

Он кодирует метионин и одновременно является стартовым. Если вы не нашли в таблице старт кодон — поищите AUG. При трансляции генов прокариот, пластидных и митохондриальных генов стартовой аминокислотой является N-формилметионин (это просто для справки)).

Если расписать весь путь от ДНК до белка, получим что-то такое.

Как следствие РНК будет совпадать с синей цепью (не забываем про замену Т на У) На данном рисунке синтез идет с красной цепи.

На первый взгляд это кажется не особо нужным побочным эффектом избыточности числа кодонов. Как я уже говорил, каждую аминокислоту может кодировать несколько кодонов. Но у него, на самом деле, довольно важная роль.

Они бывают разных типов. Тут мы немного затронем мутации. Сфокусируемся на точечных мутациях. От хромосомных, когда целые куски хромосом удаляются из генома, меняются местами, дублируются, до точечных, когда происходит замена одного азотистого основания на другое.

К чему могут привести точечные мутации?

Кодон может начать кодировать другую аминокислоту, что не всегда страшно. Такие мутации называются миссенс-мутацими (то есть со сменой смысла). Это может повлиять на структуру белка. Например если положительно заряженная аминокислота заменится на отрицательно заряженную — это может сделать белок нестабильным, или приведет к тому, что он свернется в другую конформацию (да, линейная последовательность аминокислот обычно сворачивается в определенную форму) и не сможет выполнять свои функции (или начнет делать это лучше, это уже попахивает эволюцией).

В результате триплет ГАГ, кодирующий глутамат, заменяется на ГТГ, кодирующий валин. Если конкретно, то гемоглобин S имеет единичную замену нуклеотида (А на Т) в кодирующем гене. Гемоглобин S тоже может транспортировать кислород, но делает это хуже чем обычный гемоглобин.

В молекуле гемоглобина Хикари аспарагин замещен на лизин, однако он все также хорошо перенести кислород.

Другая точечная мутация в гене гемоглобина приводит к полной утрате функции (гистидин меняется на тирозин в активном центре). Как пример с потерей функции рассмотрим гемоглобин M.

Кстати, сворачивание белка выглядит примерно так, если опустить все нюансы.

Что еще может произойти?

На выходе получится либо неполная цепь, либо экстремально длинная цепь, которые в любом случае не смогут нормально функционировать. Замена одного азотистого основания может так же привести к появлению стоп кодона в центре последовательности, или наоборот стоп кодон в конце исчезнет. Такие мутации называются нонсенс.

По сути происходит смена кодона на другой, кодирующий ту же аминокислоту. Есть еще третий тип мутации — сайленс-мутация. Свойства белка не меняются.

Подитожим общей схемой.

Одну аминокислоту может кодировать несколько кодонов. В завершение хотел бы еще рассказать об одной интересной особенности. Но что это значит? Это мы знаем. Но какие-то чаще, какие-то реже. Организм использует сразу все кодоны для кодирования.

Сравним человека и… кишечную палочку (Escherichia coli) по частоте использования кодонов кодирующих цистеин.

Он кодируется двумя кодонами UGU и UGC.

6
UGC 12. Человек
UGU 10. 6

1
UGC 0. Кишечная палочка (штамм O127:H6)
UGU 19.

Видно, что мы используем оба кодона примерно с одинаковой частотой, в то время как E. Цифры это встречаемость триплета на тысячу. coli почти не использует UGC кодон.

Если ген человека, с частой встречаемость UGC кодона попытаться вставить в кишечную палочку данного штамма — вас ждет разочарование. Об этой особенности нужно помнить, особенно когда ты занимаешься геноинженерией и хочешь нарабатывать продукт гена одного организма в другом. Так вот тРНК соответствующих UGC кодону будет крайне мало, что сильно замедлит синтез. В клетке аминокислоты связаны с транспортными РНК, каждая из которых соответствует своему кодону.

Если интересно, тут можно посмотреть отличия в кодонном составе у разных организмов.

Так у Escherichia coli O157:H7 EDL933 все более менее поровну в плане UGC и UGU. Кодонный состав может сильно отличаться как у организмов разных видов, так и разных штаммов. У штаммов туберкулезной палочки выделенных в разных странах также отличается кодовый состав. Или вот еще пример.

Подытожу

В этот раз было очень много истории и относительно мало биологии. Больше такого не будет. Мы поговорили о том, как стало понятно, что ДНК — носитель информации, как она хранится в самой ДНК. Поговорили об избыточности ген кода и о том, к чему это приводит. Немного затронули мутации и разницу в частоте использования определенных кодонов.

В следующий раз поговорим о репликации ДНК.

S.: там тоже будет история, но куда меньше. P. Постараюсь больше не делать таких пауз в написании.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть