Суперкомпьютеры: обзор рынка, способы проектирования и применения
Краткий обзор рынка
Распространение систем моделирования, переход к новому уровню фундаментальных и прикладных исследований и растущая популярность искусственного интеллекта в области обработки изображений, языка, текста и звука подогревают интерес к практическому использованию решений для высокопроизводительных вычислений (High Performance Computing, HPC).
Суперкомпьютеры позволяют:
- Моделировать сложные физические процессы и расчеты климатических изменений;
- Проводить расчеты при разработке сложных инженерных конструкций;
- Внедрять и увеличивать производительность виртуальных помощников;
- Создавать цифровых двойников технологических процессов для исключения многочисленных натурных испытаний;
- Обучать предиктивные системы в финансах, здравоохранении, транспорте, промышленности и логистике.
Ранее суперкомпьютеры поставлялись в Россию в виде готовых модульных решений известных зарубежных производителей: NVIDIA, Huawei, HPE, Dell, Lenovo и другими.

Алексей Зотов
В 2022–2023 гг. произошли изменения, которые определили новые векторы развития существующих и построения новых суперкомпьютеров в России. Сегодня в построении HPC приоритетно используются доступные российские и азиатские технические решения. Для создания систем управления и хранения данных в кластерах применяется российское ПО или ПО с открытым исходным кодом.
Уход западных центров компетенций придал импульс развитию рынка. Запускается программа государственного финансирования HPC-кластеров, которая ориентирована как на модернизацию уже существующих, так и создание новых вычислительных центров. Исполняется «Национальная стратегия развития искусственного интеллекта на период до 2030 года».
Новые инициативы требуют повышения доступности вычислительной инфраструктуры. Это напрямую сказывается на развитии технологий, которые обеспечивают математические расчеты, прогнозирование погодно-климатических условий, синтез новых материалов, инженерных симуляций. Актуальным становится вопрос создания экосистемы программных сервисов, обеспечивающих функционирование HPC.
Развитие имеющегося HPC сопряжено с вопросами аппаратно-программной совместимости. Затруднен доступ к обновлениям и патчам. Повышение версий используемых файловых систем и обновление микрокодов зачастую недоступно.

Алексей Зотов
Поэтому предпочтительным становится вариант построения нового суперкомпьютера.
Проектирование суперкомпьютера
- Уровень аппаратного обеспечения
Вычислительные узлы (с использованием как CPU, так и GPU), высокоскоростной интерконнект и узлы хранения данных. - Уровень программного обеспечения
Операционная система (ОС), служба планирования очередей и управления кластером, параллельная файловая система. - Инженерная инфраструктура
Электропитание, охлаждение, пожаротушение. - Сервисное обслуживание
Уровень SLA, необходимый для обеспечения непрерывности и доступности сервисов и суперкомпьютера.
Важным моментом является сайзинг вычислительной инфраструктуры, включая подбор оптимальных конфигураций узлов (управления, хранения, вычислительных), интерконнекта и прикладного ПО. Используемое ПО включает как российские, так и Open Source решения.
Вычислительная инфраструктура HPC (серверы и системы хранения данных) может включать реестровое оборудование и другие доступные решения российских и зарубежных производителей (см. разделы Серверное оборудование и Системы хранения данных).
Интерконнект связывает вычислительные узлы HPC в единую систему. Причем сетевые технологии, используемые в интерконнекте, чаще всего отличаются от сетевых технологий, используемых в привычных локальных вычислительных сетях. HPC-кластер требует более высокой пропускной способности, минимальных задержек и максимально высокого темпа выдачи сообщений.

Алексей Зотов
Операционные системы для организации систем управления и хранения данных HPC выбираются из семейства Linux. При выборе ОС для вычислительных узлов важно учитывать совместимость с планируемым прикладным расчётным ПО.
Помимо задач создания и расширения вычислительных мощностей необходимо прорабатывать и реализовывать возможность интеграции искусственного интеллекта как неотъемлемой части инфраструктуры. ИИ становится драйвером изменений практически во всех отраслях экономики.
Примеры применения ИИ в различных отраслях
- Медицина
ИИ помогает диагностировать заболевания на основе анализа изображений и данных пациентов, ускоряет разработку лекарств и повышает качество удалённых консультаций. - Образование
ИИ адаптирует учебные материалы под каждого студента и анализирует его успеваемость, помогая педагогам эффективно справляться с трудностями в обучении. - Машиностроение
ИИ оптимизирует конструкции, управляет роботизированными системами и предсказывает поломки оборудования. - Финансовый сектор
ИИ анализирует поведение клиентов, выявляет подозрительные транзакции и персонализирует предложения. - Нефтегазовая отрасль
ИИ позволяет более точно определять местоположение месторождений и оптимизировать бурение.
Сегодня залогом эффективного внедрения ИИ становятся конкурентные отечественные решения и разработки. Например, суперкомпьютеры в виде программно-аппаратных комплексов для машинного обучения могут использоваться для генеративного интеллекта, необходимого для создания контента и анализа данных.
В зависимости от объема решаемых задач такие комплексы могут включать и зарубежные видеоускорители, такие как NVIDIA A100/H100/H200.

Алексей Зотов
Важно учитывать, что развитие ИИ порождает новые риски, требующие пристального внимания:
- Генерация ложной информации
Распространение дезинформации и фейковых новостей с использованием ИИ; - Предвзятость алгоритмов
Уязвимости в алгоритмах, которые могут привести к некорректным выводам на этапе обучения моделей; - Киберугрозы
Использование алгоритмов злоумышленниками для поиска слабых мест в системах и проведения целенаправленных атак.

Алексей Зотов
Мнение партнера

Комментарии 0