Раньше мы сказал о самом мощном японском суперкомпьютере для исследований в области ядерной физики.
Сейчас в Японии создают экзафлопсный суперкомпьютер Post-K — японцы будут одними из первых, кто запустит машину с такой вычислительной мощностью.
Ввод в эксплуатацию запланирован на 2021 год. На прошлой неделе компания Fujitsu рассказала о технических характеристиках чипа A64FX, который ляжет в основу новой «машины».
Расскажем подробнее о чипе и его возможностях.
/ Фото Тосихиро Мацуи СС / Японский суперкомпьютер К компьютер
Технические характеристики A64FX
Ожидается, что вычислительная мощность Post-K увеличится почти в десять раз.превысит производительность самого мощного из существующих суперкомпьютеров Саммит IBM ( по данным на июнь 2018 года ).
Такой производительностью суперкомпьютер обязан чипу A64FX, основанному на архитектуре Arm. Этот чип состоит из из 48 ядер для вычислительных операций и четырех ядер для управления ими.
Все они поровну разделены на четыре группы — Core Memory Groups (CMG).
Каждая группа имеет кэш-память второго уровня объемом 8 МБ.
Он сопряжен с контроллером памяти и интерфейсом NoC (« сеть на чипе ").
NoC соединяет различные CMG с контроллерами PCIe и Tofu. Последний отвечает за связь процессора с остальной частью системы.
Контроллер Tofu имеет десять портов с пропускной способностью 12,5 ГБ/с.
Схема чипа выглядит так:
Общий объем памяти НБМ2 процессор имеет 32 гигабайта, а его пропускная способность составляет 1024 ГБ/с.
Fujitsu сообщает, что производительность процессора при операциях с плавающей запятой достигает 2,7 терафлопс для 64-битных операций, 5,4 терафлопс для 32-битных операций и 10,8 терафлопс для 16-битных операций.
За созданием Пост-К следит редакция ресурса Top500, которая составляет список самых мощных вычислительных систем.
По их оценкам, в суперкомпьютере используется более 370 тысяч процессоров A64FX для достижения производительности в один эксафлоп.
Устройство будет первым, в котором будет использоваться технология векторного расширения под названием Scalable Vector Extension (SVE).
Она отличается от других SIMD-архитектуры потому что это не так пределы длину векторных регистров и определяет допустимый диапазон для них.
SVE поддерживает векторы длиной от 128 до 2048 бит. Таким образом, любую программу можно запускать на других процессорах, поддерживающих SVE, без необходимости перекомпиляции.
С помощью SVE (поскольку это функция SIMD) процессор может одновременно выполнять вычисления над несколькими наборами данных.
Вот пример одной такой инструкции для функции NEON, которая использовалась для векторных вычислений в других архитектурах процессоров Arm:
Он складывает четыре 32-битных целых числа из 128-битного регистра q2 с соответствующими числами в 128-битном регистре q3 и записывает полученный массив в q1. Эквивалент этой операции в C выглядит так:vadd.i32 q1, q2, q3
for(i = 0; i < 4; i++) a[i] = b[i] + c[i];
Кроме того, SVE поддерживает функцию автовекторизации.
Автоматический векторизатор анализирует циклы в коде и, если возможно, использует векторные регистры для их выполнения самостоятельно.
Это повышает производительность кода.
Например, функция в C: void vectorize_this(unsigned int *a, unsigned int *b, unsigned int *c)
{
unsigned int i;
for(i = 0; i < SIZE; i++)
{
a[i] = b[i] + c[i];
}
}
Он будет скомпилирован следующим образом (для 32-битного процессора Arm): 104cc: ldr.w r3, [r4, #4]!
104d0: ldr.w r1, [r2, #4]!
104d4: cmp r4, r5
104d6: add r3, r1
104d8: str.w r3, [r0, #4]!
104dc: bne.n 104cc <vectorize_this+0xc>
Если вы используете автовекторизацию, это будет выглядеть так: 10780: vld1.64 {d18-d19}, [r5 :64]
10784: adds r6, #1
10786: cmp r6, r7
10788: add.w r5, r5, #16
1078c: vld1.32 {d16-d17}, [r4]
10790: vadd.i32 q8, q8, q9
10794: add.w r4, r4, #16
10798: vst1.32 {d16-d17}, [r3]
1079c: add.w r3, r3, #16
107a0: bcc.n 10780 <vectorize_this+0x70>
Здесь SIMD-регистры q8 и q9 загружаются данными из массивов, на которые указывают r5 и r4. Затем инструкция vadd добавляет одновременно четыре 32-битных целочисленных значения.
Это увеличивает объем кода, но на каждой итерации цикла обрабатывается гораздо больше данных.
Кто еще строит экзафлопсные суперкомпьютеры?
Создание экзафлопсных суперкомпьютеров не ограничивается Японией.Например, работа также ведется в Китае и США.
В Китае создают «Тяньхэ-3».
Его прототип уже тестируется в Национальном суперкомпьютерном центре в Тяньцзине.
Окончательную версию компьютера планируется завершить в 2020 году.
/ Фото О01326 СС / Суперкомпьютер Тяньхэ-2 - предшественник Тяньхэ-3
В центре Тяньхэ-3 ложь Китайские процессоры Phytium. Устройство содержит 64 ядра, имеет производительность 512 гигафлопс и пропускная способность памяти 204,8 ГБ/с.
Для машины из серии также был создан рабочий прототип.
Санвей .
Он тестируется в Национальном суперкомпьютерном центре в Цзинане.
По словам разработчиков, сейчас на компьютере работает около 35 приложений — это биомедицинские симуляторы, приложения для обработки больших данных и программы для изучения изменения климата.
Ожидается, что работы над компьютером будут завершены в первой половине 2021 года.
Что касается США, американцы планирую создать ваш экзафлопсный компьютер к 2021 году.
Проект называется Aurora A21, и над ним работают Аргоннская национальная лаборатория Министерства энергетики США , а также Intel и Cray. В этом году исследователи уже забрали десять проектов программы Aurora Early Science Programme, участники которой первыми будут использовать новую высокопроизводительную систему.
Среди них были программы по созданию карты нейроны головного мозга, исследование темной материи и разработка симулятора ускорителя частиц.
Компьютеры Xascale позволят строить сложные модели для исследований, поэтому многие научные проекты ожидают создания таких машин.
Одним из самых амбициозных является проект Human Brain Project (HBP), целью которого является создание полной модели человеческого мозга и исследование нейроморфных вычислений.
Как Они говорят Ученые из HBP, новые экзафлопсные системы будут использоваться с самых первых дней их существования.
Что мы делаем в ИТ-ГРАД: • IaaS • PCI DSS-хостинг • Облако ФЗ-152
Материалы из нашего блога о корпоративном IaaS: Бессерверные вычисления в облаке – современный тренд или необходимость? Как разместить 100% своей инфраструктуры в облаке IaaS-провайдера и не пожалеть об этом Облачные технологии в финансовом секторе: опыт российских компаний Теги: #arm #Высокая производительность #Суперкомпьютеры #fujitsu #it-grad
-
Человеческий Фактор
19 Oct, 24 -
Тв-Лампа?
19 Oct, 24 -
Django Meetup — 1 Марта В Москве
19 Oct, 24