Дезоксирибонуклеи́новая кислота́ (ДНК) — макромолекула, обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования организмов. Молекула ДНК хранит биологическую информацию в виде генетического кода, состоящего из последовательности нуклеотидов. ДНК содержит информацию о структуре различных видов
Дезоксирибонуклеи́новая кислота́ (ДНК) — макромолекула (одна из трёх основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования организмов. Молекула ДНК хранит биологическую информацию в виде генетического кода, состоящего из последовательности нуклеотидов[1]. ДНК содержит информацию о структуре различных видов РНК и белков.
В клетках эукариотов (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органеллах (митохондриях и пластидах). В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У прокариот и у низших эукариот (например дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами. Кроме того, одно- или двухцепочечные молекулы ДНК могут образовывать геном ДНК-содержащих вирусов.
С химической точки зрения ДНК — длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в полимерной цепи образуются за счёт дезоксирибозы и фосфатной группы (фосфодиэфирные связи).
В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух нуклеотидных цепей. В нуклеотидах, входящих в состав ДНК, встречаются четыре азотистых основания: аденин (A), гуанин (G), тимин (T) и цитозин (C). Азотистые основания одной цепи соединены с азотистыми основаниями другой цепи водородными связями, обеспечивая таким образом связь двух цепей макромолекулы ДНК друг с другом. Азотистые основания образуют связи попарно согласно принципу комплементарности: аденин (A) соединяется только с тимином (T), гуанин (G) — только с цитозином (C) ➤.
Двухцепочечная молекула ДНК закручена по винтовой линии. Структура молекулы ДНК в целом получила традиционное, но ошибочное название «двойной спирали»: на самом деле, она является «двойным винтом». Винтовая линия может быть правой (A- и B-формы ДНК) или левой (Z-форма ДНК)[2]. Формы ДНК также различаются по диаметру, количеству оснований на виток спирали и шагу спирали[3][4] ➤.
Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и далее принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК содержит последовательности, выполняющие в клетках регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например транспозонам.
Расшифровка структуры ДНК (1953 год) стала одним из поворотных моментов в истории биологии. За выдающийся вклад в это открытие Фрэнсису Крику, Джеймсу Уотсону и Морису Уилкинсу была присуждена Нобелевская премия по физиологии или медицине 1962 года. Розалинд Франклин, получившая рентгенограммы, без которых Уотсон и Крик не имели бы возможность сделать выводы о структуре ДНК, умерла в 1958 году от рака (Нобелевскую премию не дают посмертно)[5].
История изучения
ДНК как химическое вещество была выделена Иоганном Фридрихом Мишером в 1869 году из остатков клеток, содержащихся в гное. Он выделил вещество, в состав которого входят азот и фосфор. Вначале новое вещество получило название нуклеин, а позже, когда Мишер определил, что это вещество обладает кислотными свойствами, вещество получило название нуклеиновая кислота[6]. Биологическая функция новооткрытого вещества была неясна, и долгое время ДНК считалась запасником фосфора в организме. Более того, даже в начале XX века многие биологи считали, что ДНК не имеет никакого отношения к передаче информации, поскольку строение молекулы, по их мнению, было слишком однообразным и не могло содержать закодированную информацию.
До 1930-х годов считалось, что ДНК содержится только в животных клетках, а в растительных — РНК. В 1934 году в журнале «Hoppe-Seyler’s Zeitschrift für physiologishe Chemie»[7], затем в 1935 году в «Учёных записках МГУ»[8] вышли статьи советских биохимиков А. Н. Белозерского и А. Р. Кизеля, в которых доказывалось присутствие ДНК в растительных клетках. В 1936 году группой Белозерского ДНК была выделена из семян и тканей бобовых, злаковых и других растений[9]. Результатом исследований этой же группы советских учёных в 1939—1947 годах стала первая в мировой научной литературе информация о содержании нуклеиновых кислот у различных видов бактерий.
Постепенно было доказано, что именно ДНК, а не белки, как считалось раньше, является носителем генетической информации. Одно из первых решающих доказательств принесли эксперименты Освальда Эвери, Колина Маклауда и Маклина Маккарти (1944 г.) по трансформации бактерий. Им удалось показать, что за так называемую трансформацию (приобретение болезнетворных свойств безвредной культурой в результате добавления в неё мёртвых болезнетворных бактерий) отвечает выделенная из пневмококков ДНК. Эксперимент американских учёных Алфреда Херши и Марты Чейз (эксперимент Херши — Чейз, 1952 г.) с помеченными радиоактивными изотопами белками и ДНК бактериофагов показали, что в заражённую клетку передаётся только нуклеиновая кислота фага, а новое поколение фага содержит такие же белки и нуклеиновую кислоту, как исходный фаг[10].
Вплоть до 1950-х годов точное строение ДНК, как и способ передачи наследственной информации, оставалось неизвестным. Хотя и было доподлинно известно, что ДНК состоит из нескольких цепочек, состоящих из нуклеотидов, никто не знал точно, сколько этих цепочек и как они соединены.
В результате работы группы биохимика Эрвина Чаргаффа в 1949—1951 гг. были сформулированы так называемые правила Чаргаффа. Чаргаффу и сотрудникам удалось разделить нуклеотиды ДНК при помощи бумажной хроматографии и определить точные количественные соотношения нуклеотидов разных типов. Соотношение, выявленное для аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), оказалось следующим: количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц[11][12]. Эти правила, наряду с данными рентгеноструктурного анализа, сыграли решающую роль в расшифровке структуры ДНК.
Структура двойной спирали ДНК была предложена Френсисом Криком и Джеймсом Уотсоном в 1953 году на основании рентгеноструктурных данных, полученных Морисом Уилкинсом и Розалинд Франклин, и правил Чаргаффа[13]. Позже предложенная Уотсоном и Криком модель строения ДНК была доказана, а их работа отмечена Нобелевской премией по физиологии или медицине 1962 г. Среди лауреатов не было скончавшейся к тому времени от рака Розалинд Франклин, так как премия не присуждается посмертно[14].
В 1957 году американцы Александер Рич, Гэри Фелзенфелд и Дэйвид Дэйвис описали нуклеиновую кислоту, составленную тремя спиралями[15]. В 1985—1986 годах Максим Франк-Каменецкий в Москве показал, как двухспиральная ДНК складывается в так называемую H-форму, составленную уже не двумя, а тремя нитями ДНК[16][17].
Структура молекулы
Нуклеотиды
Дезоксирибонуклеиновая кислота (ДНК) представляет собой биополимер (полианион), мономером которого является нуклеотид[18][19].
Каждый нуклеотид состоит из остатка фосфорной кислоты, присоединённого по 5'-положению к сахару дезоксирибозе, к которому также через гликозидную связь (C—N) по 1'-положению присоединено одно из четырёх азотистых оснований. Именно наличие характерного сахара и составляет одно из главных различий между ДНК и РНК, зафиксированное в названиях этих нуклеиновых кислот (в состав РНК входит сахар рибоза)[20]. Пример нуклеотида — аденозинмонофосфат, у которого основанием, присоединённым к фосфату и рибозе, является аденин (A) (показан на рисунке).
Исходя из структуры молекул, основания, входящие в состав нуклеотидов, разделяют на две группы: пурины (аденин [A] и гуанин [G]) образованы соединёнными пяти- и шестичленным гетероциклами; пиримидины (цитозин [C] и тимин [T]) — шестичленным гетероциклом[21].
В виде исключения, например, у бактериофага PBS1, в ДНК встречается пятый тип оснований — урацил ([U]), пиримидиновое основание, отличающееся от тимина отсутствием метильной группы на кольце, обычно заменяющее тимин в РНК[22].
Тимин (T) и урацил (U) не так строго приурочены к ДНК и РНК соответственно, как это считалось ранее. Так, после синтеза некоторых молекул РНК значительное число урацилов в этих молекулах метилируется с помощью специальных ферментов, превращаясь в тимин. Это происходит в транспортных и рибосомальных РНК[23].
Двойная спираль
См. также: Двойная спираль нуклеиновых кислотПолимер ДНК обладает довольно сложной структурой. Нуклеотиды соединены между собой ковалентно в длинные полинуклеотидные цепи. Эти цепи в подавляющем большинстве случаев (кроме некоторых вирусов, обладающих одноцепочечными ДНК-геномами) попарно объединяются при помощи водородных связей во вторичную структуру, получившую название двойной спирали[13][20]. Остов каждой из цепей состоит из чередующихся фосфатов и сахаров[24]. Внутри одной цепи ДНК соседние нуклеотиды соединены фосфодиэфирными связями, которые формируются в результате взаимодействия между 3'-гидроксильной (3'—ОН) группой молекулы дезоксирибозы одного нуклеотида и 5'-фосфатной группой (5'—РО3) другого. Асимметричные концы цепи ДНК называются 3' (три прайм) и 5' (пять прайм). Полярность цепи играет важную роль при синтезе ДНК (удлинение цепи возможно только путём присоединения новых нуклеотидов к свободному 3'-концу).
Как уже было сказано выше, у подавляющего большинства живых организмов ДНК состоит не из одной, а из двух полинуклеотидных цепей. Эти две длинные цепи закручены одна вокруг другой в виде двойной спирали, стабилизированной водородными связями, образующимися между обращёнными друг к другу азотистыми основаниями входящих в неё цепей. В природе эта спираль, чаще всего, правозакрученная. Направления от 3'-конца к 5'-концу в двух цепях, из которых состоит молекула ДНК, противоположны (цепи «антипараллельны» друг другу).
Диаметр двойной спирали составляет от 22 до 24 Å, или 2,2—2,4 нм, длина каждого нуклеотида — 3,3 Å (0,33 нм)[25]. Подобно тому, как в винтовой лестнице сбоку можно увидеть ступеньки, на двойной спирали ДНК в промежутках между фосфатным остовом молекулы можно видеть рёбра оснований, кольца которых расположены в плоскости, перпендикулярной по отношению к продольной оси макромолекулы.
В двойной спирали различают малую (12 Å) и большую (22 Å) бороздки[26]. Белки, например, факторы транскрипции, которые присоединяются к определённым последовательностям в двухцепочечной ДНК, обычно взаимодействуют с краями оснований в большой бороздке, где те более доступны[27].
Образование связей между основаниями
См. также: Полимеразная цепная реакцияКаждое основание на одной из цепей связывается с одним определённым основанием на второй цепи. Такое специфическое связывание называется комплементарным. Пурины комплементарны пиримидинам (то есть способны к образованию водородных связей с ними): аденин образует связи только с тимином, а цитозин — с гуанином. В двойной спирали цепочки также связаны с помощью гидрофобных взаимодействий и стэкинга, которые не зависят от последовательности оснований ДНК[28].
Комплементарность двойной спирали означает, что информация, содержащаяся в одной цепи, содержится и в другой цепи. Обратимость и специфичность взаимодействий между комплементарными парами оснований важна для репликации ДНК и всех остальных функций ДНК в живых организмах.
Так как водородные связи нековалентны, они легко разрываются и восстанавливаются. Цепочки двойной спирали могут расходиться как замок-молния под действием ферментов (хеликазы) или при высокой температуре[29]. Разные пары оснований образуют разное количество водородных связей. АТ связаны двумя, ГЦ — тремя водородными связями, поэтому на разрыв ГЦ требуется больше энергии. Процент ГЦ-пар и длина молекулы ДНК определяют количество энергии, необходимой для диссоциации цепей: длинные молекулы ДНК с большим содержанием ГЦ более тугоплавки[30]. Температура плавления нуклеиновых кислот зависит от ионного окружения, рост ионной силы стабилизирует ДНК по отношению к денатурированию. При добавлении к ДНК хлорида натрия существует линейная зависимость между температурой плавления и логарифмом ионной силы раствора. Предполагается, что добавление электролита ведёт к экранированию зарядов в цепях ДНК и этим уменьшает силы электростатического отталкивания между заряженными фосфатными группами, способствуя жёсткости структуры. Аналогично температуру плавления ДНК повышают ионы марганца, кобальта, цинка и никеля, но ионы меди, кадмия и свинца, напротив, понижают её[31].
Части молекул ДНК, которые из-за их функций должны быть легко разделяемы, например, ТАТА последовательность в бактериальных промоторах, обычно содержат большое количество А и Т.
Химические модификации азотистых оснований
Основная статья: Метилирование ДНКАзотистые основания в составе ДНК могут быть ковалентно модифицированы, что используется при регуляции экспрессии генов. Например, в клетках позвоночных метилирование цитозина с образованием 5-метилцитозина используется соматическими клетками для передачи профиля генной экспрессии дочерним клеткам. Метилирование цитозина не влияет на спаривание оснований в двойной спирали ДНК. У позвоночных метилирование ДНК в соматических клетках ограничивается метилированием цитозина в последовательности ЦГ[32]. Средний уровень метилирования отличается у разных организмов, так, у нематоды Caenorhabditis elegans метилирование цитозина не наблюдается, а у позвоночных обнаружен высокий уровень метилирования — до 1 %[33]. Другие модификации оснований включают метилирование аденина у бактерий и гликозилирование урацила с образованием «J-основания» в кинетопластах[34].
Метилирование цитозина с образованием 5-метилцитозина в промоторной части гена коррелирует с его неактивным состоянием[35]. Метилирование цитозина важно также для инактивации Х-хромосомы у млекопитающих[36]. Метилирование ДНК используется в геномном импринтинге[37]. Значительные нарушения профиля метилирования ДНК происходят при канцерогенезе[38].
Несмотря на биологическую роль, 5-метилцитозин может спонтанно утрачивать аминную группу (деаминироваться), превращаясь в тимин, поэтому метилированные цитозины являются источником повышенного числа мутаций[39].