Прорыв в научных исследованиях с использованием новых суперкомпьютерных решений компаний РСК и Intel

После недавнего представления группой компаний РСК своего высокоплотного и энергоэффективного решения «РСК Торнадо» для высокопроизводительных вычислений на основе новых процессоров Intel Xeon Scalable 3-го поколения и модулей энергонезависимой памяти Intel Optane серии 200, целый ряд заказчиков компании получил возможность протестировать новую платформу для решения своих задач. Среди них Объединенный институт ядерных исследований (ОИЯИ), Сибирский суперкомпьютерный центр (ССКЦ) СО РАН на базе Института вычислительной математики и математической геофизики (ИВМиМГ) и Физико-технический институт имени А.Ф. Иоффе РАН (ФТИ им. А.Ф. Иоффе).

Удвоение скорости распределенных вычислений и обработки больших данных в области физики высоких энергий

Исследователи из ОИЯИ провели вычисления в области физики высоких энергий с использованием GRID-технологий, а именно оценили скорость обработки больших данных, получаемых на Большом адронном коллайдере (CERN), а также скорость генерации и реконструкции модельных данных планируемых экспериментов по исследованию кварк-глюонной плазмы на создаваемом в ОИЯИ ускорительном комплексе NICA. В результате проведенного тестирования выяснилось, что скорость обработки данных с помощью нового решения «РСК Торнадо» на базе процессоров Intel Xeon Scalable 3-го поколения и модулей энергонезависимой памяти Intel Optane серии 200 в 1,93 раза выше, чем при выполнении аналогичных расчетов на предыдущем, 2-м поколении процессоров Intel Xeon Scalable.

В ходе моделирования тепловых процессов в импульсной криогенной решетке был зафиксирован 2-х кратный рост скорости вычислений в сравнении с предыдущим поколением процессоров. При выполнении же квантовых вычислений на симуляторе QuEST было получено ускорение в 33% на 32 кубитах.

16-ти кратное ускорение моделирования процессов образования звезд

Сотрудники ИВМиМГ СО РАН в ходе моделирования процессов образования звезд при параллельной реализации и использовании нового кода для решения уравнения Пуассона смогли достичь коэффициента ускорения в 1,52 раза при выполнении расчетов с помощью решения «РСК Торнадо» на базе процессоров Intel Xeon Platinum 8368Q по сравнению с процессорами Intel Xeon Platinum 8268 предыдущего поколения. А при использовании автовекторизации с помощью набора инструкций AVX512 и открытого стандарта Intel oneAPI на процессорах Intel Xeon Platinum 8368Q был зафиксирован рост производительности в 16,1 раза по сравнению с использованием аналогичных процессорных ядер без автовекторизации.

Моделирование астрофизических объектов с экстремальным энерговыделением

В ходе расчета взаимодействия вращательного разрыва с ускоренными частицами в солнечном ветре, проведенного исследователями ФТИ им. А.Ф. Иоффе, было продемонстрировано ускорение на 76% по сравнению с предыдущим поколением процессоров.

«РСК Торнадо» на базе процессоров Intel Xeon Scalable 3-го поколения и энергонезависимой памяти Intel Optane серии 200

Новое поколение решения «РСК Торнадо» предназначено для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно-определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем, так и для эффективного хранения и обработки данных, а также для создания систем искусственного интеллекта (Artificial Intelligence, AI), систем машинного и глубокого обучения (Machine Learning, Deep Learning - ML/DL).

Решение «РСК Торнадо» на основе процессоров Intel Xeon Scalable 3-го поколения обеспечивает наивысшую вычислительную плотность для архитектуры x86 в индустрии с показателем 967,45 Тфлопс на стойку (+37% по сравнению с предыдущим поколением), распределенную память RSC Storage on-Demand емкостью 2,45 ПБ на шкаф (+36% по сравнению с предыдущим поколением) с пропускной способностью ввода/вывода на уровне 3,67 Тб/сек (в 2 раза больше по сравнению с предыдущим поколением) и лидирующий показатель энергоэффективности со 100% жидкостным охлаждением в режиме «горячая вода» всех электронных компонент. При этом пользователи получают линейную масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. Также предоставляются дополнительные возможности для оптимизации стоимости конечных решений за счет поддержки открытых стандартов и новых серверных продуктов Intel.

Решение «РСК Торнадо» на основе старших моделей процессоров Intel Xeon Scalable 3-го поколения (до 40 ядер, TDP 270 Вт), модулей энергонезависимой памяти Intel Optane серии 200, твердотельных накопителей Intel SSD и высокоскоростной коммуникационной сети со скоростью передачи данных 200 Гбит/сек обладает передовыми показателями компактности и вычислительной плотности (до 153 узлов в одном стандартном шкафу высотой 42U), а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя до +65 °С на входе в вычислительные узлы и коммутаторы. Работа в режиме «горячая вода» для данного решения позволяет применить круглогодичный режим free cooling (24x365), используя только сухие градирни, работающие при температуре окружающего воздуха до +50 °С, что, в свою очередь, позволяет полностью избавиться от чиллеров. В результате среднегодовой показатель PUE системы, отражающий уровень эффективности использования электроэнергии, составляет менее чем 1,04, что является выдающимся результатом для HPC-индустрии.  

Решения RSC Storage on-Demand поддерживают файловые системы NFS/Lustre/DAOS для организации памяти в одном шкафу. Новая распределенная объектная система хранения с открытым кодом DAOS (Distributed Asynchronous Object Storage) корпорации Intel позволяет обеспечить высочайший уровень скорости работы с данными различных типов. Такое решение ориентировано на применение в области «искусственного интеллекта» (машинного и глубокого обучения). Теперь стало возможным построение не только многослойных систем хранения данных на базе файловой операционной системы Lustre в архитектуре Composable Disaggregated Infrastructure и гибкое управление пулами дисков с интерфейсом NVMe, но и включение в такие слои высокопроизводительных компонент на основе DAOS. Специалисты РСК перенесли свой опыт в построении компонуемых дезагрегированных решений и на управление DAOS, а именно предложили использование для этого программной платформы оркестрации «РСК БазИС» с новым и более удобным пользовательским интерфейсом.

Процессоры Intel Xeon Scalable 3-го поколения

Оптимизированные для решения HPC-задач, а также для применения в облачных платформах, системах искусственного интеллекта, корпоративных и сетевых приложениях, сферах безопасности и Интернета вещей, процессоры Intel Xeon Scalable 3-го поколения производятся по 10-нанометровой технологии Intel, содержат до 40 мощных ядер с широким диапазоном частот, различные наборы функций и уровней энергопотребления. Среди новых реализованных возможностей – поддержка интерфейса PCI Express 4.0 (PCIe-Gen4), увеличенная пропускная способность и емкость памяти до 6 ТБ на процессор/разъем c Intel Optane серии 200 и дополнительные инструкции Intel AVX-512.

Новый серверный процессор Intel – единственный продукт, оптимизированный для работы в ЦОД со встроенным ускорением функций искусственного интеллекта (ИИ), широким набором средств обработки научных и исследовательских данных, а также с широкой экосистемой интеллектуальных решений. Эта платформа включает расширения Intel SGX (Intel Software Guard Extentions), которые защищают данные и код приложений в реальном времени от уровня периферийных вычислений до ЦОД и многопользовательских общедоступных облачных платформ, обеспечивая улучшенное взаимодействие благодаря использованию данных с общим доступом и не ограничивая при этом конфиденциальность. Процессоры Intel Xeon Scalable 3-го поколения позволяют получить 50-60% прирост производительности для ключевых HPC-приложений в области наук о жизни, финансовых услуг и при решении промышленных задач.

Модули памяти Intel Optane серии 200

Платформа на базе процессоров Intel Xeon Scalable 3-го поколения поддерживает новейшие модули энергонезависимой памяти Intel Optane серии 200, обеспечивающие до 6 ТБ общей памяти на разъем, 32% рост пропускной способности по сравнению с предыдущим поколением. Энергонезависимая память Intel Optane – это новая категория устройств, находящихся между оперативной памятью и системой хранения данных. Эти устройства позволяют увеличивать емкость памяти за пределы размеров оперативной памяти (DRAM) как новый уровень энергонезависимой памяти, обеспечивающий высокую производительность и низкую латентность для ускорения обработки данных. Intel Optane серии 200 – это новое поколение модулей энергонезависимой памяти, которая помогает пользователям улучшить работу с большими наборами данных. Intel Optane серии 200 поддерживает новую функцию Enhanced Asynchronous DRAM Refresh (eADR), которая позволяет сохранять, в случае пропадания питания электропитания, изменчивые данные, находящиеся в кэшах DRAM и процессора, тем самым предотвращая потерю данных и исключая применение дорогих модулей аккумуляторной памяти.

https://rscgroup.ru/news/rsc-3rd-gen-intel-xeon-scalable-research-results-may2013/