В Новосибирске разработают информационную систему для ЦЕРН
Специалисты Института ядерной физики им. Г. И. Будкера СО РАН разработают информационную систему,которая объединит все эксперименты Большого адронного коллайдера.
Эксперименты на Большом адронном коллайдере (БАК) порождают огромное количество экспериментальных данных. В год только в эксперименте ATLAS их записывают около 10 ПБ (1 петабайт = 1015 Байт), а всего в 2017 году ожидается около 50 ПБ исходных данных.
Это позволяет исследователям с одной стороны, набрать необходимую для получения надежных результатов статистику, а с другой – обнаружить и изучить чрезвычайно редкие события. Однако такое количество информации невозможно обработать ни в одном вычислительном центре, не говоря уж об отдельно взятом компьютере.
Для этой цели в ЦЕРН была создана специальная глобальная компьютерная система WLCG (World LHC Computing Grid), объединяющая более 170 вычислительных центров в 42 странах. Для обеспечения своей работы она требует соответствующее программное обеспечение. До настоящего времени каждый эксперимент БАК использовал собственную специализированную систему.
Ранее специалисты НИЯФ разработали информационную систему AGIS (ATLAS Grid Information System) для одного из крупных экспериментов БАК – ATLAS. Она получилась настолько удобной и функциональной, что руководство ЦЕРН приняло решение создать на ее основе расширенную версию, включающую остальные эксперименты БАК.
Грид-вычисления (от английского слова grid – сетка, решетка) представляют собой технологию, в которой для решения задачи, требующей значительных вычислительных ресурсов, в единую систему объединяются через интернет тысячи, а то и миллионы компьютеров по всему миру, как отдельных, так и объединенных в более мелкие группы-кластеры. Все они образуют своего рода гигантский виртуальный суперкомпьютер, способный справиться с самыми сложными задачами. В частности, ЦЕРН способен привлечь для решения своих задач до двух миллионов компьютеров.
Новая информационная система CRIC будет «знать», какой вычислительный узел в каком эксперименте используется, какие на нем доступны сервисы и объемы памяти для хранения данных. В соответствии с описанными в ней компьютерными моделями экспериментов она будет распределять и связывать доступные вычислительные ресурсы и ресурсы для хранения информации, формировать необходимую для работы структуру (топологию) сети, отслеживать, какие конфигурационные и экспериментальные данные где используются.
Она объединит всевозможные настройки высокоуровневых служб и сервисов распределенной грид-сети, опишет связи между различными компонентами программного обеспечения обработки данных и предоставит исследователям центральный информационный портал для управления информацией.
Вся грид-система БАК состоит из трех уровней. Нулевой уровень (Tier-0) образуют Центр данных ЦЕРН, расположенный в Женеве (Швейцария) и Исследовательский центр физики Вигнера в Будапеште (Венгрия).
Первый уровень (Tier-1) включает 13 крупных вычислительных центров, в том числе в Москве, с достаточной емкостью и с круглосуточной поддержкой грид-вычислений. Они несут ответственность за сохранение данных и результатов работы, крупномасштабную обработку и распределение данных до уровня 2.
В уровень 2 (Tier-2) входят, как правило, вычислительные центры научных институтов и университетов. В настоящее время их уже около 160 в разных концах земного шара, в том числе и 9 научных организаций из России (ИТЭФ, ОИЯИ, Курчатовский институт, ИФВЭ, Петербургский университет, ИЯИ РАН, ФИАН, НИИЯФ, НТЦ ЯФИ) . Они могут предоставлять доступ к данным отдельным исследователям, которых иногда неофициально называют третьим уровнем. Но к основной системе они уже отношения не имеют.
По материалам НИЯФ имени Г.И. Будкера СО РАН и ЦЕРН
.