Геном эукариотов обнаруживает высокую пластичность, играющую важную роль в регуляции активности некоторых генов и увеличивающую разнообразие клеточных ответов. У млекопитающих реализуются следующие варианты изменений в структуре генов:
Амплификация (или увеличение числа) геновиспользуется организмом в том случае, когда возникает необходимость увеличить синтез определённого генного продукта. Многие гены, кодирующие белки или РНК, необходимые организму в больших количествах (например, гистоны, рРНК, тРНК), постоянно присутствуют в амплифицированном соетрянии. Так, у человека 20% общего генома состоит из участков, кодирующих рибосомные, транспортные и ядрышковые РНК, последние из которых обеспечивают посттранскрипционные модификации РНК. Амплифицированные участки могут располагаться друг за другом (тандемно) в хромосоме или образовывать внехромосомные фрагменты ДНК, называемые двойными мини-хромосомами, их размер колеблется от 100 до 1000 килобаз (1 килобаза = 1000 пар нуклеотидов). Описано более 20 генов, способных амплифицироваться при определённых условиях.
К числу генов, для которых обнаружена амплификация, относят ген металлотионеина. Продукт экспрессии этого гена - низкомолекулярный белок металлотионеин, обладающий способностью связывать тяжёлые металлы (медь, цинк, кадмий, ртуть) и защищать клетки от отравления этими соединениями. Установлено, что в ответ на повышение концентрации тяжёлых металлов в крови в клетках происходит амплификация гена металлотионеина. Другими примерами генов, количество которых увеличивается под влиянием лекарственных препаратов, являются ген дигидрофолатредуктазы и ген Р-гликопротеина, ответственный за синтез белка, обеспечивающего множественную лекарственную устойчивость опухолевых клеток.
Утрата генетического материала -довольно редкий способ регуляции. Наиболее яркий пример потери всех генов за счёт разрушения ядра - процесс созревания эритроцитов. Нестабильны амплифицированные гены, двойные хромосомы. Они, как правило, исчезают в последующих генерациях. Утрата генетического материала происходит в процессе созревания лимфоцитов и образования плазматических клеток разных клонов, синтезирующих секретируемые формы иммуноглобулинов.
Перестройка генов. У высших организмов, так же как и у прокариотов, отмечают процесс обмена, перемещения генов между хромосомами или внутри хромосомы, объединение генов с образованием изменённой хромосомы, которая после таких структурных изменений способна к репликации и транскрипции. Этот процесс получил название "генетическая рекомбинация".
У эукариотов рекомбинации наблюдают:
· при половом слиянии яйцеклетки и сперматозоида;
· при перемещении подвижных генетических элементов - транспозонов, в состав которых входят отдельные гены или группа генов, с исходной позиции в какое-либо другое место той же или другой хромосомы;
· при формировании в лимфоцитах "библиотеки" генов, кодирующих антитела или иммуноглобулины.
Рассмотрим более подробно механизмы, обеспечивающие образование в организме каждого человека около 10 млн (107) различных антител, т.е. количества значительно большего, чем число всех других белков, существующих у каждого индивидуума. Антителас одинаковыми антигенсвязывающими свойствами синтезируются В-лимфоцитами, принадлежащими к одному определённому клону (т.е. группе клеток, возникшей из одной родоначальной клетки), При попадании в организм любого антигена среди имеющегося набора В-лимфоцитов всегда найдётся такой клон клеток, антитела которого имеют комплементарный ему активный центр. Антитела встроены в плазматическую мембрану В-лимфоцитов, и их антигенсвязывающие участки локализованы на поверхности клеток. Антиген, присоединяясь к активному центру антитела, вызывает пролиферацию клеток и превращение В-лимфоцитов в плазматические клетки, в которых идут активный синтез и секреция не связанных с мембраной антител.
Изучение вопроса о происхождении антител позволило сделать вывод о том, что огромное многообразие белков иммунной системы кодируется ограниченным количеством генетического материала, изменения в котором обеспечиваются рекомбинациями и соматическими мутациями (или изменениями в структуре ДНК, которые сохраняются при последующих делениях клеток).
Вспомним, что мономерные антитела - доменные белки, состоящие из двух идентичных тяжёлых (Н) цепей и двух идентичных лёгких (L) цепей. Лёгкие цепи имеют двухдоменную структуру и включают вариабельный (VL) и константный (CL) домены. Тяжёлая цепь состоит из 4-5 доменов: одного вариабельного (VH) и, как правило, трёх константных (СH). Иммуноглобулины - гликопротеины; их углеводная часть присоединяется к константной области Н-цепей. В связывании антигенов участвуют 2 активных центра антитела, образованные вариабельными областями Н-цепей (VH) и L-цепей (VL). L-цепи бывают двух типов: λ (лямбда) и κ (каппа), значительно различающиеся по первичной структуре С-областей. Наличие в антителах С- и V-областей позволило предположить, что гены, обеспечивающие синтез L- и Н-цепей, образуются в результате соединения двух участков гена, один из которых кодирует вариабельную область, а второй - константную. И действительно вскоре было установлено, что в зародышевых клетках и соматических клетках, не синтезирующих иммуноглобулины, участки гена, кодирующие V- и С-области L-цепей λ-типа, разделены протяжёнными нуклеотидными последовательностями, но сближены в зрелых В-лимфоцитах, синтезирующих Lλ Из этого следовал вывод о том, что в процессе дифференцировки В-лимфоцита из зародышевой клетки происходит "вырезание" протяжённого участка генетического материала, обеспечивающее сближение VL- и Cλ-областей с образованием полного гена L-цепи иммуноглобулина.
Этот процесс перестройки в геноме получил название соматической рекомбинации, так как он связан с созреванием лимфоцитов и не передаётся по наследству. Описано 3 разных семейства генных фрагментов, или сегментов, кодирующих строение L- и Н-цепей Ig. Два семейства ответственны за синтез лёгких цепей: сегменты, кодирующие строение L-цепей типа λ, расположены в хромосоме 22, генетический материал L-цепей типа к (каппа) - в хромосоме 2, а информация о всём разнообразии Н-цепей локализована в хромосоме 14. Полные гены L-цепейλ и κ типов в ходе дифференцировки собираются из 3 сегментов: вариабельного (VL), соединительного (JL) и константного (CL). Так, для L-цепей к типа обнаружено около 300 сегментов, кодирующих N-концевой вариабельный (Vκ) участок полипептидной цепи длиной в 95 аминокислотных остатков, 5 сегментов, в которых содержится информация об остальных 13 аминокислотах Vκ области, и 1 сегмент константной области. В зародышевых клетках 300 сегментов Vκ расположены в хромосоме последовательно на расстоянии 7 килобаз друг от друга. Каждый V-сегмент состоит из 2 экзонов, разделённых коротким интроном: лидирующий экзон (L) кодирует сигнальный пептид (20-25 аминокислотных остатков), а экзон Vκ - основную часть вариабельного домена. Семейство Vκ-сегментов отделено от группы соединительных сегментов (Тк) участком ДНК размером в 20 килобаз. Между последним из Jκ-сегментов и Сκ-экзоном, кодирующим домен константной области, расположен интрон размером в 2,4 килобазы. В ходе дифференцировки В-клеток один из вариабельных VL-сегментов путём соматической рекомбинации переносится из отдалённого участка в участок той же хромосомы, рядом с одним из сегментов JL. Например, сегмент V2 объединяется с соединительным мини-сегментом J4, и формируется полный ген L-цепи. Он состоит из 3 экзонов и 2 нитронов, расположенных в гене в следующем порядке: 5'L-I1-V2-J4-J5-I2-С-3', где L - лидерная последовательность, кодирующая сигнальный пептид, I, - интрон V2-сегмента, а 12 - интрон между семейством JL-сегментов и Сκ-экзоном. После транскрипции гена в ходе сплайсинга из первичного транскрипта удаляются интроны I1, I2и лишний сегмент J5, а все кодирующие последовательности соединяются в единую информационную молекулу зрелой мРНК. В процессе синтеза L-цепи на рибосоме лидерный участок, состоящий в основном из гидрофобных аминокислот, обеспечивает прохождение белка через мембрану ЭР и затем отщепляется. Образуется L-цепь, имеющая аминокислотный состав, характерный для L-цепи κ-типа в молекуле Ig. Расчёты показывают, что из имеющихся сегментов κ-гена в организме можно синтезировать 4500 полных генов, кодирующих L-цепи κ-типа. Формирование полных генов L-цепей λ-типа происходит так же, как L-цепей κ-типа.
Ещё большее разнообразие вариантов возникает при сборке полных генов тяжёлых (Н) цепей Ig. Н-цепи кодируются четырьмя сегментами: VH, DH (от англ, diversity) сегментами разнообразия, JH и СH. У человека обнаружено около 500 VH, 15 DH и 4 JH сегментов. Каждый VH сегмент содержит информацию об аминокислотной последовательности сигнального пептида и около 100 аминокислот VH домена. В сегменте DH закодирован участок полипептидной цепи, содержащий от 2 до 13 аминокислот, а в сегменте JH - 4-6 аминокислот. Полный ген вариабельного домена образуется путём соединения VH, DH и JH сегментов. При формировании полного гена вариабельной части Н-цепи Ig, состоящей из VH, D и JH сегментов, происходит 2 рекомбинационные состыковки: на первом этапе удаляется участок между выбранными Dx и Jy кодирующими последовательностями, а на втором - между Vi и DxJy сегментами. Экзонов, кодирующих константную область Н-цепей, описано 10: Сμ, Сσ, Сγ3, Сγ1, Сα1, Сγ2α, Сγ2β, Сγ4, Сε и Сα2, они определяют классы и подклассы иммуноглобулинов - IgM, IgG, IgA и т.д. Первыми в иммунном ответе появляются IgM, поскольку к полному гену вариабельного домена ближе всех остальных С-экзонов находится Cμ, сегмент Н-цепи. Активированные В-клетки могут синтезировать мембранно-связан-ную и секретируемую формы IgM.
Кроме того, они могут переключаться с синтеза IgM на образование антител других классов. Перед каждым СH экзоном имеется участок ДНК, называемый "участок переключения", или "свич-сайт"(от англ, swich site), построенный из повторяющихся нуклеотидных последовательностей. Эти участки облегчают протекание дополнительной рекомбинации, в ходе которой удаляются С-сегменты между полным геном вариабельной области и С-сегментом того класса, который должен быть включён.
Исследование нуклеотидных последовательностей генов некоторых подклассов L-цепей к-типа и Н-цепей показало, что разнообразие структуры сегментов, закодированных в зародышевой клетке, увеличивают соматические мутации.Мутации происходят в дифференцированных клетках на участках VL-JL и VHDHJH сегментов в процессе или после рекомбинаций, делая, таким образом, количество антител практически неограниченным. Очень важно, что мутации происходят в областях, ответственных за узнавание антигенов, обеспечивая более полное соответствие активного центра антитела антигену.
Таким образом, перестройки генетического материала в процессе формирования полных генов Ig происходят в несколько этапов, каждый из которых приурочен к строго определённой стадии дифференцировки В-лимфоцитов. Из сегментов, которые кодируют различные участки полипептидной цепи, входящей в вариабельные домены, и одного из экзонов константного домена собираются полные гены тяжёлых и лёгких нитей Ig. Сборка L-цепей включает одну соматическую рекомбинацию, а сборка Н-цепей происходит с помощью двух соматических рекомбинаций. Когда В-лимфоциты синтезируют Ig не класса М, то это сопровождается ещё одним дополнительным рекомбинационным событием. Соматические мутации, происходящие в зрелых В-лимфоцитах, делают многообразие антител неисчерпаемым. Аналогичные процессы наблюдают и в ходе дифференцировки Т-лимфоцитов.
Регуляция работы генов у эукариот.
Регуляция транскрипции генов высших организмов сходна с регуляцией экспрессии генов прокариотов. Основное различие состоит в значительно большем количестве участков ДНК и регуляторных факторов, контролирующих этот процесс. У животных и человека различные гены экспрессируются в разные моменты времени и с разной интенсивностью. Здесь, так же, как у прокариотов, есть гены "домашнего хозяйства", транскрибирующиеся конститутивно, т.е. постоянно и во всех тканях. Это гены гликолиза, синтеза РНК и некоторых белков (например, альбумина). Существуют гены, транскрибирующиеся только в специализированных клетках, т.е. имеет место тканеспецифическая экспрессия. Например, экспрессия генов α- и β-цепей глобина происходит только в клетках-предшественниках эритроцитов. Многие гены подвергаются адаптивной регуляции и являются объектами индуцибельных воздействий или негативного контроля.
Ранее уже говорилось о том, что минимальный синтез любого белка поддерживается в том случае, если к ТАТА-участку промотора присоединяется ТАТА-связывающий белок, факторы транскрипции и РНК-полимераза, образующие инициирующий комплекс, осуществляющий синтез небольшого количества мРНК. Формирование комплекса - многоступенчатый процесс, от образования которого зависит скорость инициации транскрипции.
Идентифицировано более 100 различных белков, способных взаимодействовать со специфическими регуляторными последовательностями ДНК, влияя главным образом на процесс сборки транскрипционного комплекса и скорость транскрипции.
Эти белки имеют один или несколько доменов, обеспечивающих выполнение регуляторных функций.
ДНК-связывающие домены,ответственные за узнавание и связывание регуляторных факторов со специфическими участками на молекуле ДНК;
Домены, активирующие транскрипциюза счёт связывания с белками основного инициаторного комплекса: транскрипционными факторами, коактиваторами и РНК-полимеразой;
Антирепрессорные домены,благодаря которым белки способны взаимодействовать с гистонами нуклеосом и освобождать транскрибируемые участки ДНК от связи с этими ингибиторными структурами;
Домены, связывающие лиганды,присоединение которых к белку изменяет его конформацию и обеспечивает связывание с молекулой ДНК.
Лиганды-индукторы транскрипции - стероидные гормоны, ретиноевая кислота, кальцитриол (производное витамина D3) и гормоны щитовидной железы. Лигандами-репрессорами могут быть конечные продукты метаболических путей, некоторые гормоны. Будучи липофильными молекулами, они проходят плазматическую, а иногда и ядерную мембраны, взаимодействуют с внутриклеточными рецепторами, присоединяясь к лиганд-связывающему участку. Присоединение лиганда к рецептору образует ДНК-связывающий участок, узнающий специфическую последовательность в регуляторной зоне ДНК и индуцирующий транскрипцию определённых генов.
Схема регуляции транскрипции у эукариот разработана Г.П.Георгиевым (1972). Принцип регуляции (обратная связь) сохраняется, но механизмы ее более сложные. Единица транскрипции у эукариот называется транскриптоном. Он состоит из неинформативной (акцепторной) и информативной (структурной) зон. Неинформативная зона начинается промотором с инициатором. Далее следуют группа генов-операторов, за которыми расположена информативная зона. Информативная зона образована структурным геном, разделенным на экзоны (информативные участки) и интроны (неинформативные участки). Заканчивается транскриптон терминатором
Схема регуляции транскрипции у эукариот.
Работу транскриптона регулирует несколько генов-регуляторов, дающих информацию для синтеза нескольких белков-репрессоров. Индукторами в клетках эукариот являются сложные молекулы (например, гормоны), для расщепления которых требуется несколько ферментов (многоступенчатые реакции). Когда индукторы освобождают гены-операторы от белков-репрессоров, РНК-полимераза разрывает водородные связи между двумя цепочками ДНК транскриптона и по правилу комплементарности на нем сначала синтезируется большая молекула проинформационной РНК, списывающая информацию как с информативной, так и с неинформативной зон. В дальнейшем в ядре клетки происходит процессинг - ферментативное разрушение неинформативной части РНК и расщепление ферментами рестриктазами информативной части на фрагменты, соответствующие экзонам. Молекула и-РНК (моноцистронная), соответствующая экзонам структурного гена, формируется посредстров сплайсинга (сплавления) отдельных информативных фрагментов ферментами лигазами. Далее и-РНК выходит из ядра, идет в рибосомы, где и происходит синтез белка-фермента, необходимого для расщепления индукторов. Включение и выключение транскриптона происходит принципиально так же, как и оперона.
На молекуле ДНК на расстоянии 100-200 пар оснований от стартовой точки транскрипции имеются короткие специфические последовательности ДНК: СААТ - элемент (или бокс), CG-бокс и октамерный бокс (включающий 8 пар оснований), узнающие транскрипционные факторы. Эти элементы есть во всех клетках, и конститутивно экспрессируемые гены нуждаются только в них. В то же время для генов, подвергающихся адаптивной регуляции, обнаружены участки молекулы ДНК, которые удалены (до 1000 и более пар оснований) от промотора, но тоже участвующие в регуляции транскрипции. Эти нуклеотидные последовательности бывают 2 типов.
Энхансеры - участки ДНК размером 10-20 пар оснований, присоединение к которым регуляторных белков увеличивает скорость транскрипции. Если участки ДНК, связываясь с белками, обеспечивают замедление транскрипции, то их называют сайленсерами. Эти структурные элементы молекулы ДНК контролируют транскрипцию, даже если они ориентированы на молекуле ДНК в любом направлении (от 5'- к З'-концу или наоборот);
Элементы ответа, или cis-элементы -регуляторные последовательности ДНК, общие для группы генов. Они обеспечивают координированную регуляцию транскрипции генов и, как правило, располагаются на расстоянии примерно в 250 пар оснований выше промотора каждого гена. В остальном эти нуклеотидные последовательности имеют много общего с энхансерами.
В данном варианте регуляции один и тот же индуктор, связываясь с соответствующим регуляторным белком, может активировать много разных генов, так как каждый из них в регуляторной области содержит один и тот же cis-элемент. Один из белков-продуктов этой группы генов может оказаться индуктором другой группы генов. Конечный результат регуляции - серия ответных реакций за счёт активации различных генов одним индуктором. К генам, регулируемым cis-элементами, относят гены, чувствительные к стероидным гормонам, гены белков теплового шока и многие другие. Например, при повышении температуры или после какого-либо другого клеточного стресса активируется синтез транскрипционного фактора, который индуцирует транскрипцию генов, кодирующих строение шаперонов. Очевидно, что эффективность регуляции во многом зависит от структуры транскрипционных факторов и внутриклеточных рецепторов, непосредственно взаимодействующих с молекулой ДНК. Установлено, что большинство ДНК-связывающих белков принадлежит к трём семействам в зависимости от структуры домена, непосредственно взаимодействующего с двойной спиралью ДНК. Эти белки включают структуры типа "спираль-поворот-спираль", "цинковые пальцы" и "лейциновой молнии". Как правило, эти структуры - небольшие фрагменты молекул белков, а сайт-специфическое связывание происходит за счёт взаимодействия между радикалами аминокислот этих участков и азотистыми основаниями молекулы ДНК.
Посттранскрипционная регуляция.В организме животных существенное значение в обеспечении разнообразия белков играет посттранскрипционный процессинг РНК. Основные способы такой регуляции - альтернативный сплайсинг и изменение стабильности РНК.
Альтернативный сплайсинг.Установлено, что многие эукариотические гены, будучи транскрибированы, образуют несколько вариантов зрелой мРНК в ходе процессинга (или созревания) первичного транскрипта, имеющего полиэкзонное строение. Наиболее часто промотор сохраняется на одном из концов транскрипта, а в ходе сплайсинга происходит "вырезание" одного или нескольких экзонов. В других случаях в зрелой мРНК сохраняется часть интрона и включается в состав экзона с 5' или 3'-конца. Сплайсинг может влиять на выбор промотора или участка полиаденилирования. С помощью альтернативного сплайсинга в процессе синтеза антител образуются мембраносвязанные и секреторные формы антител. Так, первоначально В-лимфоциты продуцируют транскрипты, полиаденилированные после второго стоп-кодона, а интрон, в котором имеется первый стоп-кодон, удаляется. В результате синтезируются IgM, связанные с клеточной мембраной, так как мРНК таких клеток содержит на 3'-конце экзон, кодирующий участок полипептидной цепи, состоящий из гидрофобных аминокислот. С помощью этого участка происходит "заякоривание" IgM в мембране. Когда В-лимфоциты превращаются в плазматические клетки, то в езультате альтернативного сплайсинга образуется мРНК, в которой сохраняется интрон, содержащий первый стоп-кодон. Поэтому происходит более раннее полиаденилирование и исчезает экзон, кодирующий гидрофобный участок молекулы. Синтезируются укороченные молекулы антител, секретируемые в кровь.
"Редактирование" РНК.Описан ряд случаев, когда первичная структура мРНК изменяется ("редактируется") после транскрипции. Последовательность нуклеотидов в таких генах одинакова, а транскрибируемая в разных тканях мРНК различается в результате появления в молекуле замен, вставок или выпадений нуклеотидов. Пример "редактирования" РНК - образование апопротеина В (апо-В) в клетках печени и тонкого кишечника. Апо-В - основной компонент липопротеинов, участвующих в транспорте триацилглицеринов из этих тканей в кровь. Хотя апопротеин В кодируется одним и тем же геном, вариант белка, образующийся в печени, называют апо-В-100, и он содержит 4563 аминокислотных остатка, тогда как белок, синтезированный в клетках кишечника, состоит из 2152 аминокислот. В гене, кодирующем этот белок, последовательность нуклеотидов в триплете 2153 - САА и шифрует включение в полипептидную цепь остатка глутамина. В клетках кишечника в первичном транскрипте гена азотистое основание - цитозин (С) ко-дона 2153 дезаминируется и превращается в урацил (U). Возникает стоп-кодон - UAA, прекращающий трансляцию мРНК в середине молекулы и приводящий к синтезу укороченного белка. В результате образуется белок (В-48), длина которого составляет 48% от длины белка синтезируемого печенью.
Изменение стабильности мРНК.Для того, чтобы участвовать в синтезе белка, мРНК должна выйти из ядра в цитоплазму через ядерные поры. Установлено, что в ядре клеток обычно синтезируется больший набор гетерогенных РНК, чем тот, что выходит в цитоплазму. Многие продукты транскрипции подвергаются расщеплению нуклеазами, а те мРНК, что, транспортируются из ядра в цитоплазму, защищаются от гидролитического разрушения, образуя комплексы с белками. Время жизни эукариотических мРНК значительно больше (t1/2 составляет от нескольких часов до нескольких дней), чем t1/2мРНК прокариотов, равное нескольким минутам. Очевидно, что стабильность молекул мРНК - фактор, изменение которого влияет на уровень трансляции. Стабилизация мРНК при фиксированной скорости транскрипции приводит к накоплению и увеличению количества образующегося белкового продукта. Продолжительность жизни разных мРНК варьирует в достаточно широких пределах. Некоторые гены кодируют продукт с большой продолжительностью жизни. Так, в ходе транскрипции гена β-глобина образуется мРНК с t1/2, равной примерно 10 ч. Другие гены образуют мРНК с короткой продолжительностью жизни: мРНК, на которых синтезируются факторы роста, имеют t1/2 менее 1 ч. Показано, что поли(А)-фрагмент на 3'-конце мРНК увеличивает продолжительность жизни молекул. Чем длиннее поли(А)-фрагмент, тем больше время жизни мРНК. Описано много примеров регуляции количества синтезирующихся белков за счёт изменения продолжительности функционирования мРНК. Так, стабильность мРНК-матриц для синтеза молекул гистонов сильно зависит от фазы клеточного цикла. В S-фазе гистоны постоянно синтезируются и используются для укладки вновь образованной ДНК в нуклеосомы. Гистоновая мРНК в этот период стабильна в течение нескольких часов. После S-периода, когда ДНК уже не синтезируется, в клетках образуется небольшое количество гистонов, так как они не требуются для формирования нуклеосом. В этот период t1/2 для гистоновой мРНК составляет 10-15 мин.