В МГУ запустили «Ноев ковчег»
Масштабная электронная база данных предназначена для работы с самой разной биологической информацией – от рациона питания одноклеточных организмов до секвенированных геномов.
Недавно мы писали о том, что в Московском государственном институте полным ходом идут работы по созданию цифрового гербария. Однако цифровой гербарий – лишь часть огромной информационной системы под названием «Ноев ковчег», в которой содержатся данные об образцах из биологических коллекций университета и его партнеров, подключившихся к проекту.
Для каждого образца сотрудники МГУ создают подробные паспорта, содержащие разностороннюю информацию о каждом из «коллекционных» организмов. Важно не только само по себе присутствие образца, но и его подробное описание: что это за организм, кем, где и когда он был собран, чем примечателен и для чего его можно использовать в науке и практике.
По словам руководителя направления «Микроорганизмы и грибы» Алексея Соловченко, у информационной системы есть все, чтобы стать настоящей базой знаний о живых организмах. В «Ноевом ковчеге» (который создают в рамках гранта Российского научного фонда «Научные основы создания Национального банка-депозитария живых систем») можно сохранять не только описание самих организмов, но и все методики работы с ними: как их культивировать, изучать и сохранять долгое время. Это особенно важно для коллекций одноклеточных организмов, таких, как бактерии и микроводоросли.
«Основной принцип работы системы – адаптивная форма паспорта образца, которая изначально вмещает минимум информации, описывающей каждый образец независимо от типа биоматериала и коллекции: данные о том, где и каким образом был получен образец, а также информацию о живом организме, из которого взят материал. Остальная часть паспорта настраивается так, чтобы оптимально и полно отражать сведения, специфичные для разных живых существ и единиц хранения, от бактерий до животных», – сообщает научный координатор проекта «Ноев ковчег», ведущий научный сотрудник биологического факультета МГУ Петр Каменский.
Один из главных «плюсов» системы – возможность автоматически загружать сведения о хранящихся организмах из авторитетных международных баз данных, таких как Catalog of Life, NCBI GenBank и др. Таким образом, паспорт образца может содержать самую разнообразную информацию, вплоть до последовательности ДНК. Некоторые геномы были секвенированы специально в рамках проекта, для других же образцов нужен выход к внешним базам данных.
Пока что встроенный в систему геномный браузер находится в разработке, однако кроме него у системы в перспективе появятся и другие биоинформатические сервисы, с помощью которых пользователи депозитария смогут извлечь максимум пользы из хранящейся в нем информации.
Число оцифрованных образцов постоянно увеличивается за счет загрузки новых коллекций и добавления информации из уже имеющихся электронных баз. «Ноев ковчег» разрабатывали с таким расчетом, чтобы собрать в нем сведения по коллекциям не только из Московского университета, но и из других научных организаций – таким образом, впервые создан прототип системы, способной соединить воедино все российские биоколлекции.
«На данный момент в систему загружено около 510 тыс. образцов, 500 тыс. из которых – гербарные образцы, а около 10 тыс. – подробно охарактеризованные микроорганизмы. Для них, помимо микрофотографий, в систему загружены подробные описания, вплоть до предпочитаемого «меню» и «отпечатков пальцев» (фрагментов генома). К концу 2018 года мы планируем загрузить в информационную систему все образцы, которые есть в коллекциях МГУ», – продолжает Петр Каменский. – «Сейчас в системе находится 19 коллекций, процесс инвентаризации, оцифровки и загрузки данных продолжается.
Физически коллекции Депозитария МГУ располагаются в тех лабораториях, в которых с ними работают. Если взять биологический факультет, то там находится как минимум сто коллекций. Раньше владельцы коллекций друг про друга знали мало, и, соответственно, пользоваться коллекциями могли только те люди, которые непосредственно с ними работали. С появлением нашей информационной системы ситуация кардинально поменялась».
Создание столь масштабной электронной системы требует строгой упорядоченности образцов. Этого добились, снабдив каждый образец уникальным штрих-кодом: сфотографировав штрих-код обычным смартфоном, можно за доли секунды найти в базе данных всю доступную информацию о данном образце, загрузить его паспорт. Разработчики планируют создать удобный инструментарий для работы с информацией, содержащейся в системе, и сделать так, чтобы можно было оформлять онлайн-заявки для получения биологического материала. Актуальная версия системы доступна по адресу depo.msu.ru.
Биологические коллекции нужны не только и не столько для того, чтобы было что показывать студентам и прочей публике. В первую очередь, в них хранится материал для самых разнообразных исследований – коллекциями пользуются биологи самых разных специальностей, от ботаников и зоологов до генетиков и экологов. Кроме того, они служат сохранению биоразнообразия, если речь идет не о засушенных образцах, а о «живых» коллекциях, вроде хранилища семян или банка микроорганизмов. (Подробно о том, зачем нужны биобанки и как формировались биологические коллекции Московского государственного университета, можно узнать из статьи ректора МГУ В.А. Садовничего, опубликованной в декабрьском номере «Науки и жизни» за 2015 год.) Цифровые же технологии не только делают коллекцию более удобной и доступной, но и позволяют проводить научные исследования на качественно новом уровне. Новую базу данных уже активно используют в исследовательской работе – информацию, которую удалось получить с ее помощью, можно обнаружить в последних статьях, опубликованных участниками проекта в журналах PLOS ONE, Molecular Phylogenetics and Evolution и Photosynthesis Research.
В том, что «Ноев ковчег» ждет большое научное будущее, сомневаться не приходится – аналогов подобной информационной системы, позволяющей оперировать сведениями о биологических образцах самой разной природы, а также управлять хранилищами биоматериала, в мире не существует.