№12 декабрь 2024

Портал функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций.

Суперкомпьютеры 2020: рекорды, разочарования и непреодолимые барьеры

Татьяна Зимина

В конце ноября 2020 года в Институте программных систем им. А. К. Айламазяна РАН (ИПС РАН, Переславль-Залесский) состоялся очередной, Девятый национальный суперкомпьютерный форум (НСКФ-2020). В этот раз из-за пандемии форум прошёл в несколько необычной форме, тем не менее в его работе приняли участие 146 специалистов из 83 организаций. Традиционную лекцию о развитии суперкомпьютерной отрасли в мире и России прочёл член-корреспондент РАН Сергей Михайлович Абрамов, директор ИПС РАН.

Суперкомпьютеры России в TОР 500 — изменение по годам.
Индекс цифровизации, ноябрь 2020 года.
Отставание России (в годах) от уровней технологий классов ТОР 1, ТОР 5 и ТОР 10 на ноябрь 2020 года.

Он рассказал, что США, страны Евросоюза, Китай и другие государства в 2020 году наращивали суперкомпьютерную вычислительную мощность, но особенно большой рывок совершила Япония, построившая самую мощную в мире установку. Суперкомпьютер Fugaku в Центре вычислительных наук RIKEN в Кобе превзошёл по производительности (442 петафлопс*) прошлогоднего лидера списка ТOP 500 — суперкомпьютер Summit Окриджской национальной лаборатории (США) — в 2,8 раза. С. М. Абрамов такой скачок в производительности назвал беспрецедентным. Подобный успех стал возможным благодаря созданию достаточно энергоэффективной системы, включающей собственные процессор и интерконнект**. В числе прочего в Fugaku для снижения энергопотребления использовано погружное охлаждение, предполагающее заполнение базового шасси машины с установленными на нём вычислительными модулями непроводящей жидкостью. Отметим, что такое погружное охлаждение впервые разработали в ИПС РАН совместно с компанией ИММЕРС (см. «Наука и жизнь» № 1, 2015 г.).

В целом же скорость развития суперкомпьютерной отрасли в мире уменьшилась. И произошло это уже примерно десять лет назад. С 1997 по 2010 годы мощность суперкомпьютеров во всём мире росла по экспоненте и увеличилась в 1000 раз. Но потом наращивание производительности замедлилось, что связано с техническими проблемами, которые пока не преодолены. Прежде всего, это высокое энергопотребление. Требуются новые технологии создания микросхем, новые сетевые решения (интерконнект). Но на пути уменьшения технологических размеров практически достигнут предел, ниже которого возникают квантовые эффекты. «Когда мы уменьшаем количество миллиметров, всё становится очень сложно», — сказал Сергей Михайлович. Он также отметил нужду в новых математических методах, новых математических моделях, новых языках и системах программирования. Как будут устроены вычислители, когда мы достигнем предела технологических форм? Как двигаться дальше? Как сохранить возможности развития вычислительной мощности? Ответов пока на эти вопросы нет.

Как и в прошлые годы, директор ИПС РАН остановился на понятии «суперкомпьютер». Сегодня в мире работает много мощных, высокопроизводительных машин, и их нередко называют суперкомпьютерами. Когда-то было много споров вокруг того, какие машины подпадают под это понятие. Предлагали оценивать их по весу, по абсолютной производительности, по числу вычислительных ядер и даже по стоимости. Но споры давно утихли, и было принято, что суперкомпьютерами называются системы, которые значительно превосходят по своим параметрам большинство существующих в мире компьютеров. Если конкретно — это первые 500 машин.

И, к сожалению, в этом списке TOP 500 к ноябрю 2020 года остались лишь две российские системы — Christofari компании SberCloud (40-е место) и Ломоносов-2 (МГУ им. М. В. Ломоносова, 158-е место). Год назад их было три, но одна из них — машина, работающая в Росгидромете, выбыла из рейтинга самых мощных суперкомпьютеров мира. Как сказал Сергей Абрамов, последние 10 лет положение России в мировой суперкомпьютерной отрасли неуклонно ухудшается.

С. М. Абрамов подсчитал отставание России от лидеров по доступной суперкомпьютерной мощности. От США мы отстали на 12,5 года (год назад это отставание было 7—8 лет), от Японии и Евросоюза — на 10 лет, от Китая — на 9,5 года. Хотя совсем недавно, в 2010 году, наша страна отставала от США всего на 5,5 года. «Конечно, правильнее говорить не об отставании, а о задержке в развитии, — пояснил докладчик. — Если предположить, что США остановятся в своём суперкомпьютерном развитии на ближайшие 12,5 года, а мы в это время будем развивать отрасль с той же скоростью, что и США в предыдущие годы, то мы их догоним как раз за эти 12,5 года. Но останавливаться никто не будет. И если предположить, что США продолжат своё развитие в течение следующих 12,5 года, а Россия начнёт двигаться вперёд с удвоенной (по сравнению с США) скоростью, тогда мы могли бы сравняться с ними. Но ни первый, ни второй сценарий не представляются реальными».

Директор ИПС РАН подчеркнул, что в 2010 году доля России в общей суперкомпьютерной мировой мощности была 2,51%. А в начале 2020 года — 0,63%, и за последний год мы потеряли больше трети этой доли — сегодня она составляет всего 0,38%. «Если мы продолжим идти этим путём, то через два года у России не будет ничего достойного в списке TOP 500», — сказал он.

С. М. Абрамов остановился на ещё одном важном показателе, отражающем уровень развития суперкомпьютерной отрасли. Это индекс цифровизации, или количество счёта на единицу продукции, которое вычисляется как отношение суммарной доли вычислительной мощности к доле ВВП. По его данным, Россия кратно уступает лидерам и по этой позиции: Японии — в 20 раз, Китаю — в 7 раз, США — в 5 раз, Евросоюзу — в 4 раза. Хотя десять лет назад мы имели индекс цифровизации лучше, чем в Евросоюзе. Что же это означает? «Переход к цифровым технологиям, — пояснил докладчик, — обусловлен только одним пониманием: если ты хочешь создать какую-то новую продукцию, которая будет превосходить конкурентов, то ты должен считать». В качестве примера он привёл создание новых материалов: «Новые методы конструирования материалов — это цифровое конструирование. Почему? Потому что современные материалы невозможно получить иначе, так как мы начали работать на наноуровне, а там нельзя построить эксперимент. Что-нибудь сделать на наноуровне «руками» не получается, так как при этом мы вмешиваемся в сами процессы. Поэтому все наноматериалы создают только вычислениями. Это было известно уже в 2000 году».

Итак, суперкомпьютерная отрасль в России переживает не самые простые времена. И тут естественно встаёт вопрос о кадрах. Директор Института программных систем жёстко стоит на позиции, что нельзя учить студентов современным информационным технологиям. По его убеждению, это путь в никуда и потеря наследия. «Студентов надо учить перспективным информационным технологиям, которых нет, которые появятся. Студенты должны получить классическое образование, нормальные фундаментальные знания в тех науках, которые нужны и которые неизменны. А вот дальше они должны участвовать в процессе создания тех технологий, которых пока нет. Создавать новые кадры для суперкомпьютерной отрасли можно, нужно, потребность гигантская, но это можно делать, когда есть проекты по созданию передовых решений суперкомпьютерных технологий» — уверен Сергей Михайлович Абрамов.

Он привёл два успешных примера участия студентов в разработке новых технологий. Один относится к 1998 году — это разработка Т-системы (системы автоматической динамической распараллеленной программы), которая стала основой союзной программы Россия-Беларусь. Другой пример — две студенческие работы 2014 года по погружной системе охлаждения. «Два бакалавра создают установку по госконтракту, которая потом устанавливается в МИФИ. То есть вычислительный кластер с погружным охлаждением в МИФИ — результат двух бакалаврских работ, — рассказывает С. М. Абрамов. — Сейчас уже более 100 вычислительных установок в России поставлено с технологией погружного охлаждения. А в октябре 2020 года в Институте программных систем РАН государственные приёмочные испытания прошли системы с жидкостным охлаждением и кипением — это следующий шаг даже по отношению к погружной технологии». (См. «Наука и жизнь» № 2, 2017 г.).

«Мы должны развернуть широкие работы по разработке отечественных процессоров, отечественных решений в области энергетики, охлаждения, программного обеспечения, новых моделей, и отправлять студентов, аспирантов, магистрантов на круглогодичную практику на три года… Но сначала нужно создать эти проекты, — где будут разрабатываться самые передовые решения», — таково мнение директора ИПС РАН.

Возможно, они появятся в рамках национального проекта «Цифровая экономика». Но, как считает С. М. Абрамов, цифровую экономику не создать без суперкомпьютерной киберинфраструктуры — иерархической системы из мощных национальных суперкомпьютерных центров. Сейчас в России суперкомпьютерная киберинфраструктура отсутствует. Ведь у нас всего две машины — Christofari и Ломоносов-2, которые между собой даже не связаны. Хотя ещё в 2010 году была «нормальная, внятная», как сказал оратор, киберинфраструктура, содержавшая в себе четыре слоя: машины высшего уровня (самые мощные ТОР 1—20), высокого (ТОР 21—100), среднего (ТОР 101—250) и начального (ТОР 251—500) (см. «Наука и жизнь» № 1, 2019 г.).

В это же время США, ЕС, Китай и Япония построили у себя очень эффективные суперкомпьютерные киберинфраструктуры. Причём верхний национальный уровень — это машины, которые созданы за государственные деньги и стоят на полном государственном обеспечении — от расходов на электричество до зарплаты персонала. Со своими задачами в эти национальные суперкомпьютерные центры приходят част-ные компании (например, автомобилестроители, авиастроители и т. д.), где задачи решаются опять же за государственный счёт. «Высшие суперкомпьютерные мощности в этих странах — это общественное благо для всей экономики», — подчеркнул С. М. Абрамов.

Директор Института программных систем им. А. К. Айламазяна Российской академии наук убеждён, что нам надо заново создавать национальную суперкомпьютерную инфраструктуру, и тогда мы сможем построить цифровую экономику, основанную на знаниях.

Таблицы и рисунки предоставлены ИПС РАН.

***

Самый мощный суперкомпьютер в России — система Christofari дочерней компании Сбербанка SberCloud. Создан в 2019 году на основе оборудования корпораций Nvidia и Tesla V100. Эффективная производительность — порядка 6,7 петафлопс. Используется компанией-хозяином для решения внутренних задач и обучения нейросетей. На нём же производят научные и коммерческие расчёты. Своё название суперкомпьютер получил в честь обладателя первой сберкнижки в 1841 году и по совместительству тайного советника управляющего ссудной казной Николая Антоновича Кристофари.

Суперкомпьютер Ломоносов-2, размещённый в вычислительном центре МГУ, разработан в 2014 году. Для создания суперкомпьютера использованы технологические разработки A-Class российской компании «Т-Платформы», оборудование Nvidia. Эффективная производительность 2,48 петафлопс.

Суперкомпьютерная система Cray/T-Platforms на базе суперкомпьютера XC40-LC, установленная в ФГБУ «ГВЦ Росгидромета», выбыла из списка TOP 500 в 2020 году. Она включает 976 вычислительных узлов с двумя процессорами Intel Xeon E5-2697v4 и 128 Гб оперативной памяти на узел с общей производительностью 1293 терафлопс.

***

Суперкомпьютер Fugaku оснащён 48-ядерным процессором A64FX SoC от Fujitsu, таким образом, японская разработка стала первой в истории системой № 1 в списке ТOP 500, оснащённой процессорами ARM. При одинарной или более низкой точности, которая часто используется для задач машинного обучения и искусственного интеллекта, пиковая производительность Fugaku составляет более 1000 петафлопс (1 экзафлопс).

Комментарии к статье

* Флопс (FLOPS — FLoating-point Operations Per Second) — число операций с плавающей запятой в секунду; петафлопс — 1015 операций в секунду.

** Интерконнект — высокоскоростная сеть, связывающая в суперкомпьютере отдельные машины.

Другие статьи из рубрики «Вести из институтов»

Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее