В 2003 году геном человека был расшифрован полностью. Это означает, что учёные теперь знают последовательность более трёх миллиардов нуклеотидов в молекуле ДНК человека. Опубликованы данные по секвенированию генома дрозофилы, нематоды, бактерии E.coli, мыши, начались работы по расшифровке генома шимпанзе. Казалось бы, зная химическую структуру ДНК, мы сможем ответить на все вопросы о том, как устроены гены. Но это далеко не так. Молекула ДНК действительно состоит из определённых участков — генов, отвечающих за синтез белковых молекул. Но последовательность генов — это ещё не геном. Например, только 25% генома человека состоит из «настоящих» генов. Две трети генома составляют регуляторные участки, «бессмысленные» последовательности, гены могут перекрываться, один ген зачастую отвечает за синтез сразу нескольких белков и т.д. В результате вместо предсказанных в 90-е годы прошлого века 100 тысяч человеческих генов в 2003 году учёные определили всего лишь около 20 тысяч смысловых генетических участков. Причём далеко не всегда понятно, где заканчивается один ген и начинается другой, как работают эти гены и за синтез каких белков отвечают. Поэтому после расшифровки генома перед молекулярными биологами открылась бездна непознанного. Теперь учёным предстоит искать смысл в «бессмысленных» участках ДНК, идентифицировать новые гены, изучать механизм регуляции уже известных генов и определять их функции.
Каждая клеточка организма живого существа содержит одну и ту же ДНК, одни и те же гены. Тем не менее белковый состав клетки, к примеру, хряща заведомо отличается от белков клеток печени или головного мозга. В чём же дело? Да в том, что в клетке синтезируются не все белки, закодированные в структуре ДНК, а только необходимые. Упрощённо, ген белка коллагена активирован (или, как говорят, экспрессирован) в соединительной ткани, но «спит» в печени; ген адреналина вовсю «работает» в надпочечниках, но «отдыхает» в клетках головного мозга и т.д. Изучением функции генов занимается функциональная геномика, которая получила огромный импульс к развитию именно после расшифровки генома.
На современной стадии развития функциональной геномики стало возможным определять, какие гены в разных участках организма экспрессированы — «работают», а какие «спят». И не просто определять, а получать трёхмерные изображения распределения активности генов во всех органах и тканях — создавать так называемые атласы экспрессии генов. В качестве модели учёные используют эмбрионы лабораторной мыши, поскольку геном мыши, секвенированный в 2004 году, состоит из практически такого же числа генов, как и геном человека. Физиология мышей сходна с физиологией приматов, на мышах можно моделировать эмбриональное развитие и генетические болезни человека.
В 2005 году профессор Грегор Эйхель разработал специальную автоматизированную технологию создания генетических атласов, которую назвал «genepaint» (англ. — рисовать ген). Сейчас профессор Эйхель — директор департамента функциональной геномики Института биофизической химии Макса Планка в Гёттингене (Германия), где расположен координационный центр теперь уже общеевропейского проекта атласа экспрессии генов. В международном постгеномном проекте Eurexpress помимо гёттингенского института участвуют несколько научных центров — в Берлине, Неаполе, Женеве, Страсбурге. Ещё два центра — в Эдинбурге и Цюрихе — формируют базу данных генетического атласа.
Цикл развития мышиного зародыша — 19 дней. Для генетического анализа берут 14,5- и 17-дневные зародыши мыши. Их замораживают, фиксируют в парафине. Затем из полученных образцов готовят тончайшие срезы толщиной не более 20 мкм, которые помещают на обычное препаративное стекло для исследования под микроскопом. Как же удаётся получить изображение активности того или иного гена? Для этого в лабораторных условиях синтезируют пробу РНК одного из 20 тысяч мышиных генов, благо геном мыши расшифрован полностью, и обрабатывают ею образец ткани зародыша. Если в данном образце исследуемый ген активен — в ткани присутствуют молекулы мРНК, комплиментарные пробе РНК. В результате их взаимодействия молекула РНК пробы прочно «сплетается» с мРНК ткани — происходит гибридизация. Проба РНК помечена специальными молекулярными маркерами, которые при обработке определёнными химическими агентами дают цветную реакцию, поэтому в месте экспрессии гена ткань окрашивается в синий цвет.
Срез фотографируют в обычном световом микроскопе. Однако срезы слишком велики для того, чтобы сфотографировать их полностью, поэтому участки образца фотографируются последовательно. Все полученные снимки собираются в мозаичное изображение, которое после обработки сохраняется в формате tiff. Цифровая фотография окрашенного среза вместе с метаданными — условиями реакции гибридизации, свойствами среза эмбриона, структурой пробы РНК — поступает в базу данных Eurexpress и становится доступной для всего научного сообщества в Интернете.
Процедура обработки и фотографирования среза полностью роботизирована. В Институте биофизической химии Макса Планка получают данные о локализации 60 генов в неделю, в пяти других институтах — в два раза меньше. С января 2005-го по июль 2008 года осканировано 15 тысяч генов — 3/4 всего генома мыши.
В компьютерной базе Eurexpress хранится более 250 тысяч изображений высокого разрешения. Сейчас объём базы данных составляет более 20 терабайт, и каждый месяц база прирастает ещё одним терабайтом. Размер каждого изображения одного среза может превышать 100 МБ. Для того чтобы просматривать такие изображения в Интернете, их сохраняют на сервере в специальном формате Zoom Image Server. Программа позволяет динамически загружать интересующие участки изображения, так что становится возможным увеличить любой участок среза до его максимального разрешения.
Цель проекта — получить атлас экспрессии всех 20 тысяч генов в мышином зародыше. С помощью такого генетического атласа можно будет определить, на каком этапе развития эмбриона и в каком месте активен тот или иной ген. Это очень важно для понимания физиологической функции гена и соответствующего ему белка. Также с помощью атласа можно будет сравнить активность разных генов, причём не только мышиных, но и человеческих, в норме и патологии. Новая база данных, безусловно, продвинет знания в функциональной геномике и внесёт вклад в идентификацию генов болезней человека.