Суперкомпьютеры 2023: новые чемпионы и старые аутсайдеры
Каждый год список лидеров суперкомьютерной отрасли обновляется, и 2023 год не стал исключением. Одновременно продолжается расслоение в списке пятисот самых мощных систем мира. О состоянии суперкомпьютерной отрасли мира и в России рассказал доктор физико-математических наук, член-корреспондент РАН Сергей Абрамов, главный научный сотрудник Института программных систем имени А. К. Айламазяна РАН во время Двенадцатого Национального Суперкомпьютерного Форума, состоявшегося в конце ноября – начале декабря 2023 года в Переславль-Залесском.
— За прошедший год в списке пятисот самых мощных суперкомпьютеров мира появились две новые системы, которые по производительности победили предыдущего лидера – японский суперкомпьютер Fugaku.
Второе место в рейтинге на ноябрь 2023 года занимает суперкомпьютер Aurora, расположенный в Аргоннской национальной лаборатории (Argonne National Laboratory) – национальном исследовательском центре Министерства энергетики США. Эта огромная установка базируется на процессорах и ускорителях компании Intel. Основные процессоры суперкомпьютер Aurora – это 21 248 процессоров Xeon CPU Max 9470 52C 2,4GHz, ускорители – 63 744 спецпроцессоров Intel Data Center GPU Max. Интересно, что разработчики не успели измерить реальную производительность на всём смонтированном объёме оборудования, из-за чего Aurora не смогла превзойти производительность системы Frontier.
Конечно, за полгода инженеры решат эту проблему, и установка Aurora покажет лидерскую производительность, близкую к 2 EFlops. И, скорее всего, в июне 2024 года она займет первое место в рейтинге, потеснив нынешнего лидера – суперкомпьютер Frontier в Национальной лаборатории (Oak Ridge National Laboratory, США). Если производитель вычислительных компонент в системе Aurora – компания Intel, то инфраструктурная часть (интерконнект, электропитание, охлаждение, компоновка) обеспечена компанией Hewlett Packard Enterprise – так же как и в системе Frontier.
Третье место в текущем рейтинге занимает система Eagle, созданная компанией Microsoft, и собранная из совершенно стандартных модулей, которые штатно используются компанией в её центрах обработки данных для организации облачного сервиса Microsoft Azure. Установка создана всего за полгода, что в четыре раза быстрее средней продолжительности создания систем уровня Top1, то есть это своеобразный «временной» рекорд. Eagle базируется на следующих процессорных решениях: основные процессоры – это 3 600 процессоров Xeon Platinum 8480C 48C 2GHz (48 ядер) компании Intel; ускорители представляют собой 14 400 спецпроцессоров NVIDIA H100. В системе используется стандартная инфраструктура облачных сервисов Microsoft Azure, в том числе Интерконнект Infiniband (NVIDIA Infiniband NDR).
Таким образом, тройка лидеров иллюстрирует всё многообразие технологических подходов к созданию систем эксамасштабного уровня, то есть с производительностью более 1018 Flops.
В рейтинге Top500 сохраняется тенденция жёсткого расслоения систем. Девяносто самых мощных суперкомпьютеров рейтинга обеспечивают 80% суммарной производительности всего списка. Производительность первой системы в 500 раз больше производительности последней. И этот разрыв растёт из года в год. Кризис, с которым столкнулась суперкомпьютерная отрасль мира в 2016–2017 годах, сейчас преодолён: сегодня можно сказать, что производительность высших систем будет вырастать в 1000 раз за 17–18 лет против 23–24 лет в проблемные годы. Прогноз для младших систем в списке Top500 не столь радужен: рост их производительности в 1000 раз будет происходить за 27–28 лет. То есть, как и прежде, «сильные становятся сильнее, а слабые – слабее».
Россия за 2023 год увеличила отставание в уровне своей вычислительной мощности по отношению к ведущим странам (США, Евросоюз, Китай и Япония) ровно на год. Сегодня разрыв по этому показателю от США составляет 11,5 лет. Если это расшифровать, то такую вычислительную мощность, как сейчас в России, США имели 11,5 лет назад. Технологическое отставание (то есть готовность создавать и владеть системами уровня Top1, Top5, Top10) также усилилось – от технологий Top1 мы отстаём на 11 лет. Напомним, что в 2012 году технологическое отставание от Top1 было всего 2,5 года.
В мировом пироге производительности года наша страна сильно упрочила свою позицию в 2021 году, когда компании Яндекс, Сбер и МТС купили шесть достаточно мощных суперкомпьютерных установок для своих корпоративных нужд. В результате Россия тогда имела 2,48% суммарной производительности всех суперкомпьютеров мира. Сейчас же этот показатель составляет 1,06%. Формально индекс цифровизации России упал за прошедшие два года: сегодня он у нас в 4,6 раз хуже, чем у США, в 2,7 раз хуже, чем у Евросоюза, в пять раз хуже, чем у Японии, и 2,2 раза — по сравнению с миром.
В целом суперкомпьютерная отрасль в мире стремительно развивается. В передовых странах нащупаны основные направления решений технологических трудностей предыдущего десятилетия – и для аппаратных, и для программных средств суперкомпьютеров эксафлопсного масштаба. На сегодняшний день успех трёх систем в США (Frontier, Aurora, Eagle) и одной – в Японии (Fugaku) достигнут за счёт мощной государственной и межгосударственной поддержки, наличия нескольких альтернативных (конкурентных) подходов, консолидации передовых технологических решений по разным направлениям.
В России нет новых суперкомпьютерных разработок переднего края в последние десять лет. Создание отечественных супер-ЭВМ закончилось в 2014 году и лучшие из них относятся к петафлопсному классу. Но у России тем не менее есть возможность и ресурсы для преодоления кризиса в суперкомпьютерной отрасли – это, в том числе, разработки, которые всё еще находятся на переднем крае технологий, необходимых для создания эксафлопсных систем. Это технологии охлаждения, интерконнекта, процессоров, ускорителей, программного обеспечения, математические методы и модели. Более того, в нашей стране существуют проекты, реализация которых поможет создать системы, «превышающие эксамасштаб». Один из примеров – идея создания универсальной цифровой фотонной вычислительной машины (ЦФВМ), выдвинутая Сергеем Степаненко (ФГУП «РФЯЦ-ВНИИЭФ). Создание ЦФВМ может быть выполнено силами отечественных предприятий и позволит занять лидирующие позиции в мире в области суперкомпьютеров. Есть и другие перспективные проекты, способные привести к практическим решениям экса- и зета-масштабного класса.
По информации Института программных систем имени А. К. Айламазяна РАН