Некодирующий вариант

Что такое некодирующая ДНК и почему важно её изучать, рассказывает Александра Филатова, кандидат биологических наук, заведующая лабораторией некодирующих вариантов генома Медико-генетического научного центра им. академика Н.П. Бочкова.

Фото: Tom Purcell, flickr.com, CC BY-NC 2.0

— Александра, что такое некодирующие варианты генома?

— Начать надо немного издалека. В нашем медико-генетическом центре мы занимаемся диагностикой и изучением наследственных заболеваний, с которыми к нам обращаются пациенты. После клинического обследования врачи направляют их на ДНК-диагностику, задача которой — выявить генетическую причину заболевания. Причина развития наследственных заболеваний — различные изменения в ДНК. Раньше их называли мутациями, но сейчас генетики используют термин «генетические варианты». Однако в ходе ДНК-диагностики у пациентов с наследственной патологией нередко такие изменения либо вообще не удаётся обнаружить, либо находят варианты, связь которых с заболеванием остаётся неясной.

Тогда мы берём в работу такие варианты неясной значимости и пытаемся понять, действительно ли они могут быть причиной заболевания. Это направление в генетике называется функциональным анализом. У нас в центре есть целый отдел, который занимается такими исследованиями. Варианты, которые мы изучаем, могут находиться в различных участках генов. Самый хорошо изученный и понятный случай — когда изменения возникают в кодирующей части гена, то есть в той, которая одержат информацию о структуре белка. В результате меняется структура белка, что и приводит к развитию заболевания.

— Таких кодирующих участков в генах очень мало?

— Гены бывают разные. Но если говорить об обычном белок-кодирующем гене, то кодирующая часть — это только его фрагмент, а вокруг неё находятся некодирующие участки.

— Некодирующих больше, чем кодирующих?

— Если смотреть на весь геном человека, то да. На последовательности, кодирующие белки, приходится всего около 1–2 % генома. Всё остальное — это некодирующие участки.

— Некодирующие участки генома могут стать причиной заболевания?

— Могут, потому что выполняют очень важную регуляторную функцию и во многом определяют, как именно работает ген — то есть когда, где и на каком уровне он будет активен. Можно представить ситуацию: есть ген, с которого синтезируется определённый белок. Если в самом белке возникает нарушение, он перестаёт выполнять свою функцию, что приводит к развитию наследственного заболевания. Но возможен и другой вариант: сам белок остаётся нормальным, а изменение происходит в другой части гена, которая белок не кодирует, но регулирует его работу. В результате ген просто «не включается», и белок не образуется. Итог тот же: белок не выполняет свою функцию, и развивается заболевание.

— Правильно ил я поняла, что некодирующие участки обслуживают кодирующие? Это такая инженерная служба?

— В каком-то смысле, да. Хотя, если быть точнее, это взаимосвязанная система. Геном у нас одинаков во всех клетках организма, но клетки при этом очень разные: нейроны, мышечные клетки, клетки печени и ещё тысячи других типов, и все они выполняют разные функции. И всё это разнообразие определяется как раз тем, какие гены и в каком объёме работают в конкретной клетке.

— Это происходит спонтанно или благодаря какой-то программе?

— Эта программа закладывается в процессе эмбрионального развития. Можно сказать, что «программа» реализуется через то, какие гены в клетке включаются и выключаются. А некодирующие регуляторные области как раз управляют этим процессом: они задают, какие гены в данный момент должны работать. В одних клетках включается один наборы генов — и клетка становится, например, мышечной. В других  активируются другие гены, и формируются, например, нервные клетки. Поэтому, если нарушается работа какого-то гена, это может привести к развитию заболевания.

— Чем конкретно вы занимаетесь в своей лаборатории?

— Наша лаборатория молодая, и наш основной интерес — это разные типы некодирующих вариантов. У них могут быть разные механизмы, через которые они приводят к развитию заболеваний — это мы и изучаем. Изначально мы начинали с изучения вариантов в 5’- нетранслируемых областях гена — это участок, который находится перед кодирующей последовательностью. В этой области расположены разные регуляторные элементы, которые управляют трансляцией, то есть процессом синтеза белка на основе мРНК. Один из таких регуляторных элементов — это малые открытые рамки считывания, upstream ORF. Так называются короткие участки перед основной кодирующей последовательностью, которые тоже могут транслироваться. Если в них возникнет определённое генетическое изменение, то может измениться процесс трансляции: рибосома начинает «считывать» эти участки, и в результате нарушается трансляция основного белка, количество нормального белка снижается, и это может приводить к заболеваниям. Например, мы показали такой механизм для гена PAX6 — это ген, нарушение функции которого приводит к врождённой аниридии, то есть отсутствию радужной оболочки глаза.


Александра Филатова, кандидат биологических наук, заведующая лабораторией некодирующих вариантов генома Медико-генетического научного центра им. академика Н.П. Бочкова. Фото Наталии Лесковой.

— Человек при этом что-то видит?

— Да, в большинстве случаев зрение есть, но оно значительно снижено уже с рождения. Аниридия — это не просто отсутствие радужки, а комплексное заболевание глаза, при котором страдают практически все его структуры. Может быть полное отсутствие радужки или её недоразвитие (дисплазия). Со временем у части пациентов могут развиваться дополнительные осложнения, например, вторичная глаукома или помутнение роговицы, и это уже может приводить к дальнейшему ухудшению зрения вплоть до слепоты. Несколько лет назад у нас вышла работа, где мы впервые в мире показали, что в 5’-нетранслируемой области гена PAX6 присутствуют малые открытые рамки считывания. Мы выяснили, что генетические варианты в этих рамках могут нарушать нормальную работу гена, и он перестаёт вырабатывать нужный белок. А так как PAX6 — ключевой ген развития глаза, такое нарушение приводит к развитию аниридии.

— Насколько сложно выявлять такие варианты?

— Их сложно выявлять и интерпретировать при проведении ДНК-диагностики. По сути, в рутинной клинической практике их до сих пор практически не анализируют. Мы первыми показали, что нарушение этих регуляторных элементов в гене PAX6 приводит к развитию заболевания. После этого мы решили проанализировать и другие гены и обнаружили, что такие элементы встречаются довольно часто, примерно в половине генов человека. В ряде случаев изменения в них также могут приводить к развитию других наследственных заболеваний.

— Можно ли найти эти генетические нарушения у человека, который только что родился?

— Конечно. Человек получает свой геном уже при оплодотворении и, если провести ДНК-диагностику сразу после рождения, мы можем увидеть, какие генетические варианты у него есть. Но чтобы понять, к чему эти варианты могут приводить, нужны знания о механизмах регуляции работы генов. В случае малых открытых рамок считывания у нас есть специальная биоинформатическая программа, которая позволяет проанализировать данные пациента и проверить, попадают ли выявленные варианты в такие регуляторные области.

— Что с этой информацией можно сделать?

— Если у ребёнка уже есть клинические проявления, мы можем быстрее понять их генетическую причину и поставить точный диагноз. А это даёт врачу гораздо лучшее понимание прогноза заболевания. Даже при одном и том же диагнозе разные генетические варианты могут приводить к разному течению болезни. Кроме того, это важная информация для семьи. Если известно конкретное генетическое изменение, которое привело к заболеванию, появляется возможность для планирования будущих беременностей, в том числе с использованием предимплантационной генетической диагностики. И, наконец, в перспективе — это основа для развития терапии наследственных заболеваний, направленных на молекулярные механизмы развития болезни. Самый известный такой пример — «Спинраза», препарат, который влияет на сплайсинг и используется для лечения спинальной мышечной атрофии. Кстати, варианты сплайсинга тоже относятся к некодирующим изменениям, и мы их также изучаем.

— Как вы думаете, удастся ли когда-нибудь расшифровать все некодирующие варианты генома?

— Это очень сложная задача. Если говорить о ближайшей перспективе, я такой возможности не вижу. Всё зависит от того, насколько хорошо мы понимаем механизмы регуляции работы генов. Когда удаётся разобраться в каком-то одном типе регуляции, становится проще искать варианты именно этого класса. Но при этом остаются другие механизмы, которые устроены иначе, и для них нужны уже другие подходы. А механизмов таких много. Это не одна задача, а целый набор разных задач, которые мы постепенно решаем по мере того, как изучаем регуляцию генов.

— Может ли тут помочь искусственный интеллект?

— В какой-то мере, конечно. Сейчас накапливается большое количество данных, на которых обучается искусственный интеллект. Появляются очень крупные модели, например, как AlphaGenome от Google, которые обучаются на огромных массивах данных и пытаются предсказывать, как генетические варианты будут влиять на регуляцию экспрессии генов. Мы тоже применяем эти подходы в работе, но пока видим, что с точки зрения клинической интерпретации это ещё очень далеко от рутинного применения. Сейчас это скорее инструмент для профессионалов, которые понимают, куда и как смотреть, как интерпретировать результаты и где у модели есть ограничения. На сегодняшний день даже при очень больших объёмах данных такие модели, по сути, находят то, чему их обучили. Если для какого-то типа эффектов у них есть достаточно данных, они могут это предсказывать довольно хорошо. Но есть такие типы эффектов, которые они либо не объясняют, либо объясняют нестабильно. Поэтому пока это не замена эксперту, а скорее вспомогательный инструмент, который нужно использовать со знанием дела.

— Почему нам так трудно даются генетические исследования?

— Я думаю, потому что это очень сложная, многослойная система. В ней взаимосвязано очень большое количество компонентов. Это не цепочка «одно вызвало другое, а то — третье и так далее», а скорее огромная сеть взаимодействий, где одно событие влияет на множество других, а те — на другое множество третьих. Это разветвлённые, объёмные сети, которые при этом ещё и замыкаются сами на себя через механизмы обратной связи. Поэтому их действительно сложно описывать и интерпретировать — мы до сих пор знаем далеко не все механизмы, которые в них работают.

Регуляция экспрессии генов, на мой взгляд, — одна из самых интересных областей современной биологии. Во многом значительная часть современной биологии так или иначе связана именно с тем, как регулируется работа генов. Это касается и развития организма, и дифференцировки клеток, и многих заболеваний. Например, микроРНК, за изучение которых была присуждена Нобелевская премия в 2024 году,— это один из важных механизмов такой регуляции. Мы уже знаем довольно много разных уровней и механизмов регуляции, но очевидно, что далеко не все.

Автор: Наталия Лескова


Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее