А не положить ли геном в банк?
Считается, что геном человека расшифровали в 2003 году. Считается – потому что сразу стало понятно, что сама по себе последовательность трёх миллиардов нуклеотидов человеческой ДНК мало говорит о том, как эта ДНК работает.
Но из одного, двух и даже десятка расшифрованных геномов отдельных индивидуумов нельзя выделить достоверной статистической информации, например, о том, что мутация в каком-нибудь гене повышает риск развития злокачественной опухоли. Это как если бы вы захотели провести социологическое исследование, опросив всего лишь пару своих знакомых. Какие-то данные вы, несомненно, получите, но вот отражать общую картину они вряд ли будут. Чтобы узнать общую закономерность и чтобы она была достоверной, нужно по максимуму увеличить число опрошенных. Тот же принцип работает и с генетической информацией: чтобы надёжно определить влияние мутации на работу гена, нужна большая статистическая выборка. Иными словами, чтобы понять, что представляет собой генетическая информация, нам нужны «прочитать» геномы как можно большего числа людей.
В области расшифровки генома за последнее десятилетие наблюдается заметный прогресс, в первую очередь в смысле доступности методов секвенирования. Если на первый геном ушло 10 лет плюс усилия сотен, если не тысяч, человек и миллион, а то и миллиард долларов, то сейчас технологии позволяют секвенировать геном отдельного человека за сумму порядка одной тысячи долларов, что сделало расшифровку генома доступной для обычных людей и послужило мощным толчком к развитию персонифицированной медицины. Собственно, тут мы подходим к вопросу о том, а для чего всё это надо, и что хочет от этого получить наука, а что – простые граждане?
Огромное число организаций по всему миру занимается генетическими исследованиями: и крупные национальные центры, и академические институты, и фармацевтические компании, и молодые стартапы – все вместе они генерируют огромный объём данных, который растёт в геометрической прогрессии. Сегодня речь идёт уже о величине порядка нескольких петабайт информации – сравнимый объём данных ежегодно генерирует Большой Адронный Коллайдер (петабайт = 1024 терабайт). Их нужно где-то хранить, к ним нужно организовать доступ, их нужно быстро обрабатывать. Научное сообщество давно осознало, что свободный доступ к такой информации будет полезен всем участникам, занимающимся генетикой. Так появились открытые базы данных, содержащие генетическую информацию о самых разных живых организмах: существует базы с генетической информацией мух дрозофил (FlyBase), паразитов (WormBase), крыс (Rat Genome Database) или, например, шпорцевых лягушек (XenBase). Результаты сравнения геномов различных организмов бывают порой весьма забавными: к примеру, выяснилось, что у человека и шпорцевой лягушки был общий предок, который жил порядка 360 миллионов лет назад. А как обстоят дела с генетическими данными самого человека?
Тут ситуация немного сложнее. С одной стороны, геном человека необходимо изучать, чтобы понять молекулярные, клеточные, физиологические механизмы внутри нас и, может быть, научиться ими управлять или хотя бы корректировать неполадки в них. Сюда относятся и исследования генетики старения, и исследования наследственных заболеваний, и анализ предрасположенности к раку, и многое другое. Для этого развиваются технические средства: разрабатываются и совершенствуются технологии секвенирования, создается инфраструктура для работы с геномными данными.
Многие IT-компании обратились в сторону Life Science – наук о живом. Например, компания IBM развивает проект IBM Watson Health – систему поддержки принятия решения в медицинской диагностике. Суть системы состоит в том, что суперкомпьютер, анализируя огромный массив неструктурированной информации – научные статьи, истории болезни, методики лечения и многое другое – может дать ответ на вопрос, чем болен пациент. По замыслу разработчиков это должно снизить вероятность постановки неправильно диагноза и, как следствие, неправильного лечения. Насколько успешно компьютер сможет заменить «доктора Хауса» – покажет время. Другой крупный производитель систем хранения и обработки информации, компания EMC активно занимается разработкой облачной инфраструктуры для работы с геномными данными, которая могла бы быть полезной для медицинских и научных организаций. Биоинформатика сейчас становится тем звеном, которое может объединить знания и возможности исследователей, врачей и инженеров во благо человечества.
Государства и крупные научные центры запускают проекты по созданию базы геномов тысяч и даже миллионов людей, выделяя на них солидное финансирование. Мы недавно писали про научный проект Московского университета «Ноев Ковчег» по созданию национального банка-депозитария живых систем, хотя Россия в целом пока сильно отстаёт от других стран в сфере генетических технологий. В Китае, к примеру, начался проект, целью которого станет расшифровка генома миллиона человек, миллиона животных и растений и миллиона микроорганизмов. Крейг Вентер, один из тех, кто первым расшифровал человеческий геном, анонсировал, что к 2020 году собирается секвенировать миллион геномов. В Германии планируют прочитать геномы 200 000 человек с последующим наблюдением за их здоровьем на протяжении 30 лет. Есть проекты по поиску связей между вероятностью возникновения сердечно-сосудистых заболеваний и особенностями ДНК, опирающиеся на наблюдения за тысячами людей в течение 20 лет и более.
Примеры можно приводить и далее, но всех их объединяет одно – масштабность исследований, их продолжительность и огромный массив информации, который будет генерироваться на всём протяжении экспериментов. Чтобы облегчить доступность и обмен информацией, создаются различные объединения, цель которых в разработке единых стандартов и методик. Разрозненные генетические банки данных объединяются в национальные и межнациональные структуры – так же, как в своё время стандартизировались протоколы обмена информацией по сети. Но всё это техническая сторона вопроса, которая, без сомнения, будет развиваться и возможности которой мы, может быть, еще даже не представляем. А что с другой стороны? Как генетические данные будут менять жизнь людей?
Тут есть целый ряд проблем, для которых пока нет однозначных решений, и касаются они даже не тех возможностей, которые может дать нам генетика, а того, как мы сможем воспринять новые факты о нас самих. Например, уже сейчас существует ряд генетических тестов, позволяющих установить мутацию в том или ином гене, которая связана с повышенной вероятностью возникновения определенных онкологических заболеваний. Однако её наличие в геноме вовсе не означает, что вы непременно заболеете, – мутация лишь повышает вероятность, что это произойдёт. Такие выводы обычно основываются на том, что у исследованной ранее группы людей выявлена зависимость между мутацией и риском болезни. Насколько точны подобные оценки, можно установить, только исследовав очень большую выборку пациентов, одновременно исключив множество других несущественных факторов. Как раз на накопление подобной информации и направлены «миллионные» проекты по расшифровке генома, а также проекты длительностью несколько десятков лет. Накапливая всё больше информации, мы сможем лучше узнать, как мы устроены.
Как бы то ни было, сейчас мы относимся к своему будущему как к «чёрному ящику». Готово ли человечество к тем знаниям, которые мы получим, посветив в него фонариком? Как изменится сознание человека, если он с самого детства будет знать, к примеру, что вероятность развития у него рака мозга в несколько десятков раз выше, чем среднестатистическая? Кому могут быть доступны такие данные? Могут ли родители узнать, что светит в будущем их детям ещё до их рождения? Сейчас мы еще не знаем ни границ наших возможностей, ни сколько времени понадобится науке для того, чтобы от стадии получения знания перейти к его использованию.
И здесь словосочетание «генетический банк» приобретает дополнительный смысл. Это не только базы данных, содержащие расшифрованные геномы, но и своего рода вклад нынешнего поколения в развитие биотехнологий, воспользоваться которыми смогут, скорее всего, только наши потомки, долгосрочный вклад, который потом вернётся с большими процентами в виде бесценного знания. При одном условии, что банк не «лопнет», а «вкладами» не воспользуются в преступных и неэтичных целях – но это зона ответственности не одной лишь науки.