арм сервера что это

Наступает эпоха ARM-серверов?

Материнcкая плата SynQuacer E-Series для 24-ядерного ARM-сервера на процессоре ARM Cortex A53 с 32 ГБ оперативной памяти, декабрь 2018 года

Много лет процессоры ARM с сокращённым набором команд (RISC) доминируют на рынке мобильных устройств. Но им так и не удалось пробиться в дата-центры, где по-прежнему властвуют Intel и AMD с набором инструкций x86. Периодически появляются отдельные экзотические решения, такие как 24-ядерный ARM-сервер на платформе Banana Pi, но серьёзных предложений пока нет. Точнее, не было до этой недели.

На этой неделе AWS запустила в облаке собственные 64-ядерные ARM-процессоры Graviton2 — это система-на-кристалле с ядром ARM Neoverse N1. Компания утверждает, что Graviton2 намного быстрее, чем ARM-процессоры предыдущего поколения в инстансах EC2 A1, а вот и первые независимые тесты.

Инфраструктурный бизнес — это сравнение цифр. По сути, клиентам дата-центра или облачного сервиса не важно, какая архитектура у процессоров. Их волнует соотношение цены и производительности. Если работа на ARM дешевле, чем на x86, то их и выберут.

Однако потрясающая энергоэффективность процессоров ARM заставляет снова и снова присматриваться к ним. Например, SocioNext SC2A11 потребляет всего 5 Вт. А ведь на электроэнергию приходится почти 20% затрат дата-центра. Если эти чипы покажут пристойную производительность, тогда у x86 не останется шансов.

Первое пришествие ARM: инстансы EC2 A1

В конце 2018 года AWS представила инстансы EC2 А1 на собственных ARM-процессорах. Определённо, это было сигналом для индустрии о потенциальных изменениях на рынке, но результаты бенчмарков оказались неутешительными.

В таблице ниже показаны результаты стресс-тестирования инстансов EC2 A1 (ARM) и EC2 M5d.metal (x86). Для тестирования использовалась утилита stress-ng :

Как видим, A1 проявили себя хуже во всех тестах, кроме кэша. По большинству других показателей ARM уступали очень сильно. Эта разница в производительности больше, чем разница в цене 46% между А1 и M5. Другими словами, инстансы на процессорах x86 по-прежнему оставались выгоднее по соотношению цена/производительность:

Test EC2 A1 EC2 M5d.metal Разница
cache 1280 311 311,58%
icache 18209 34368 -47,02%
matrix 77932 252190 -69,10%
cpu 9336 24077 -61,22%
memcpy 21085 111877 -81,15%
qsort 522 728 -28,30%
dentry 1389634 2770985 -49.85%
timer 4970125 15367075 -67,66%

Конечно, микробенчмарки не всегда показывают объективную картину. Важна разница в реальной производительности приложения. Но и здесь картина оказалась не лучше. Коллеги из Scylla сравнили инстансы a1.metal и m5.4xlarge с одинаковым количеством процессоров. В стандартном тесте на чтение базы данных NoSQL в конфигурации с одним узлом первая показала 102 000 операций чтения в секунду, а вторая 610 000. В обоих случаях все доступные процессоры используются на 100%. Это соответствует снижению производительности примерно в шесть раз, что не компенсируется более низкой ценой.

Кроме того, инстансы A1 работают только на EBS без поддержки быстрых устройств NVMe, как в других инстансах.

В общем, A1 стал шагом в новом направлении, но не оправдал надежд на ARM.

Второе пришествие ARM: инстансы EC2 M6

Всё изменилось на этой неделе, когда AWS представила новый класс ARM-серверов, а также ряд инстансов на новых процессорах Graviton2, в том числе M6g и M6gd.

Сравнение этих инстансов показывает уже совершенно другую картину. В некоторых тестах ARM проявляет себя лучше, а иногда намного лучше, чем x86.

Вот результаты выполнения той же команды стресс-тестирования:

Test EC2 M6g EC2 M5d.metal Разница
cache 218 311 -29,90%
icache 45887 34368 33,52%
matrix 453982 252190 80,02%
cpu 14694 24077 -38,97%
memcpy 134711 111877 20,53%
qsort 943 728 29,53%
dentry 3088242 2770985 11,45%
timer 55515663 15367075 261,26%

Это уже совершенно другое дело: M6g в пять раз быстрее A1 при выполнении операций чтения из базы данных Scylla NoSQL, а в новых инстансах M6gd работают быстрые накопители NVMe.

Наступление ARM по всем фронтам

Стартап основали три ведущих инженера, которые занимались созданием процессоров в Apple и Google. Они обещают разработать процессоры для дата-центров, которые составят конкуренцию Intel и AMD.

По имеющейся информации, Nuvia спроектировала с нуля процессорное ядро, которое может быть построено «поверх» архитектуры ARM, но без получения лицензии ARM.

Всё это указывает на то, что ARM-процессоры готовы покорить серверный рынок. В конце концов, мы живём в эпоху пост-ПК. Годовые поставки x86 упали почти на 10% с пикового 2011 года, в то время как чипы RISC взлетели до 20 миллиардов. Сегодня 99% 32- и 64-разрядных процессоров в мире — это RISC.

Лауреаты премии Тьюринга Джон Хеннесси и Дэвид Паттерсон в феврале 2019 года опубликовали статью «Новый золотой век для компьютерной архитектуры». Вот что они пишут:

Рынок урегулировал спор RISC и CISC. Хотя CISC выиграл более поздние этапы эпохи ПК, но RISC выигрывает сейчас, когда наступила эпоха пост-ПК. Новых ISA на CISC не создавалось в течение десятилетий. К нашему удивлению, общее мнение по лучшим принципам ISA для процессоров общего назначения сегодня по-прежнему склоняется в пользу RISC, спустя 35 лет после его изобретения… В экосистемах с открытым исходным кодом искусно разработанные чипы убедительно продемонстрируют достижения и тем самым ускорят коммерческое внедрение. Философией процессоров общего назначения в этих чипах, скорее всего, будет RISC, который выдержал испытание временем. Ожидайте таких же стремительных инноваций, как и во время прошлого золотого века, но на этот раз с точки зрения стоимости, энергии и безопасности, а не только производительности.

Источник

Как сделать кластерный сервер на ARM процессоре и тестирование VPS на AWS Graviton2

В предыдущей публикации рассматривались преимущества использование ARM серверов для хостинг провайдеров. В этом посте рассмотрим практические варианты создания кластерного сервера на ARM процессоре и протестируем инстанс Amazon EC2 T4g работающий на процессоре ARM AWS Graviton2, посмотрим на что он способен.

Создание серверного кластера на Raspberry/Banana/Orange Pi

На данный момент существует множество различных вариантов сборки кластера на базе различных одноплатных компьютеров. Можно собрать самостоятельно или купить готовую коробку (CASE) для наполнения модулями CoM Raspberry Pi.


Кластер на Raspberry/Banana/Orange Pi

Для личных и исследовательских целей подобные кластеры имеют право на жизнь. Но для массового рынка такой подход не приемлем по следующим причинам:

Компьютер на модуле (CoM)

Компьютер на модуле (CoM) – это плата, которая объединяет в себе основные элементы системы обработки данных и позволяет подключить их к несущей плате с помощью разъёмов или пайки. На такой плате размещается основной процессор, оперативная память, дополнительные модули чипы. Плата обычно содержит периферийные функции, а несущая плата позволяет реализовать специфические функции устройства, например, соединение с внешними устройствами посредством различных интерфейсов.


Компьютер на модуле (CoM)

Удобство использование CoM заключается в возможности создания своего дизайна для несущей платы. Разработка несущей платы существенно проще чем модуля CoM. На несущей плате можно развести модуль питания и коммутатор Ethernet, тем самым уменьшив габариты системы и отказаться от лишних проводов.


Подключение модуля CoM к несущей плате

Стартап miniNodes разрабатывает недорогие ARM сервера, предназначенные для небольших облачных сервисов, веб-сайтов и приложений Интернета вещей. Они разработали микро-сервер состоящий из несущей платы и 5 модулей Raspberry Pi 3 CoM. Несущая плата Carrier Board содержит встроенный гигабитный коммутатор, который обеспечивает подключение ко всем 5 модулям. С противоположной стороны платы размещен модуль питания для обеспечивания питание CoM. Каждый из вычислительных модулей также имеет отдельный переключатель включения/выключения питания. Модули Raspberry Pi CM3 + поставляются с 8 ГБ, 16 ГБ или 32 ГБ eMMC на борту, поэтому нет необходимости использовать SD-карты, как на обычных платах Raspberry Pi. Таким образом, при полной загрузке есть 5 узлов, состоящих из 4 ядер, 1 ГБ ОЗУ и до 32 ГБ eMMC каждый, всего 20 ядер, 5 ГБ ОЗУ и до 160 ГБ хранилища.

Читайте также:  аудио русский ad что это


5 Node Raspberry Pi 3 CoM Carrier Board

Такой подход построения микро-серверов на базе Raspberry Pi безусловно хорош, но вряд ли будет серьезно воспринят бизнесом. Любой бизнес в первую очередь интересует длительность поддержки купленной системы, поэтому решения стартапов не вариант для бизнеса. Дополнительно, закрытость процессоров Broadcom для Raspberry Pi не добавляет популярности в этом сегменте рынка.

Блейд-сервер от Firefly на процессорах Rockchip

Среди доступных решений выделяются процессоры компании Rockchip. По сравнению с процессорами от других производителей, для процессоров Rockchip доступно больше драйверов под Linux и есть даташиты в публичном доступе. Компания Firefly разрабатывает модули CoM на процессорах Rockchip и комплектует из них блейд-серверы. В каталоге компании доступно 9 различных по производительности модулей CoM, которые можно использовать для комплектации сервера. Модули для подключения имеют стандартный интерфейс SODIMM.


Модули COM от компании Firefly

Компания разработала сервер Cluster Server R1 в 1U форм-факторе который может содержать до 11 модулей CoM.


Сервер Cluster Server R1

Сервер предназначен для запуска приложений на Linux, облачных игр, виртуальных рабочих столов, тестирования мобильных приложений (до 110 виртуальных телефонов на Android). Возможен запуск ОС: Linux и Android.

Для комплектации доступны модули CoM:


Лицевая панель сервера Cluster Server R1

Для управления узлами используется BMC (Baseboard Management Controller) с помощью которой можно управлять узлами: включать/выключать, удаленный доступ, мониторинг состояния, управление аппаратной конфигурацией.

В начале этого года была представлена вторая версия кластерного сервера — Cluster Server R2. Cluster Server R2 поставляется в 2U форм-факторе и содержит:

Кластерный север так же работает под управлением ОС: Android, Ubuntu или некоторых других дистрибутивов Linux. Варианты использования сервера: «облачный телефон», виртуальный рабочий стол, облачные игры, облачное хранилище, блокчейн, декодирование многоканального видео, и т. Д. Наличие AI (NPU-нейронный процессор) делает кластер похожим на Solidrun Janux GS31 Edge AI. Сервер, предназначенный для вывода в режиме реальном времени нескольких видеопотоков для мониторинга умных городов и инфраструктуры, интеллектуального корпоративного/промышленного видеонаблюдения, обнаружения, распознавания и классификации объектов, интеллектуального визуального анализа и т. д.

Что можно запустить на ARM процессоре?

Запуск приложений с помощью Docker и Kubernetes давно стал де-факто стандартом для Linux. Поэтому рассмотрим какие наиболее популярные контейнеры можно запустить под ARM:

Тестирование VPS на AWS Graviton2

Amazon для тестирования предоставляет инстансы на базе процессора ARM AWS Graviton2. Это отличная возможность бесплатно протестировать ПО на совместимость с ARM архитектурой и просто получить опыт работы, эксплуатации системы на ARM процессоре. Бесплатно предоставляется инстанс t4g.micro до 30 июня 2021 года в режиме 24×7. Для тестирования достаточно зарегистрироваться и развернуть инстанс на Ubuntu Server 20.04 LTS.
Конфигурация инстанса t4g.micro:

Команда lscpu выдает следующую информацию:

“Железо”:

Тест CPU

Тестируем процессор sysbench’ем:

Тест ОЗУ:

Тест диска

Посмотрим что покажет dd. Скорость до полноценного SSD недотягивает, но уже полноценный SATA:

Сравнение стоимости инстанса t4g.micro с VPS на x86

Воспользуемся калькулятором calculator.aws и рассчитаем на сколько ARM дешевле x86 VPS на AWS. Расчет будем производить для площадки Europe (Frankfurt) eu-central-1. Ближайшей аналог x86 по характеристикам это инстанс t2.micro.

1000 р. (по курсу 1$ = 75 р.);

В итоге VPS инстанс t4g.micro (ARM) с объемом трафика в 150 Гб в месяц будет стоить — 1 400 р./месяц.

Если для сравнения взять VPS от VDSina.ru за 330 р./месяц (1 ядро, 30 ГБ NVMe, 32 ТБ трафика), то для конкурентного преимущества серверам на ARM еще расти и расти.

Вывод: Отсутствие нативного ПО под ARM архитектуру еще долго будет останавливающим фактором массового перехода. Но так или иначе частичный переход на ARM сервера это уже тренд. Основными двигателями перехода выступают три мощных фактора. Первый фактор — независимость от основных поставщиков процессоров x86. Можно выбрать решение максимально подходящее под себя. Второй фактор — возможность максимальной «оптимизации под себя», исключение всего лишнего и добавление специализированных блоков, таких как NPU, FPGA, и т.д. Третий фактор — открытость и доступность Linux. Если сравнивать ARM сервера для массового потребительского сектора, то в этом сегменте еще очень долго будет господствовать x86 архитектура. Скорее всего мы увидим создание нового сегмент рынка для специальных задач ориентированных на преимущества ARM архитектуры, например сервера с FPGA модулями или NPU.

На правах рекламы

Наша компания предлагает в аренду серверы с современными процессорами от Intel и AMD под самые разнообразные задачи. Эпичные серверы — это VDS с AMD EPYC, частота ядра CPU до 3.4 GHz. Максимальная конфигурация — 128 ядер CPU, 512 ГБ RAM, 4000 ГБ NVMe. Создайте свой собственный тариф самостоятельно в пару кликов!

Источник

ARM серверы подходят для облачного хостинга лучше чем x86? Проверим

Если вам нужна была высокая производительность, то вам нужно было выбирать процессор на x86 для своих решений. В последнее время, все больше и больше говорят о закате архитектуры x86 и переходе на ARM. В прошлом году компания Apple впервые представила Mac на процессорах ARM. Но подойдет ли процессор ARM для дата-центров, сможет ли ARM навсегда отправить x86 на скамью запасных?

Смена парадигмы

Когда массовые пользователи стали использовать смартфоны и планшеты, стало очевидно, что процессоры x86 от Intel, AMD и VIA просто не подходят для этих задач. Набор инструкций Intel по-прежнему не является популярным выбором для мобильных процессоров, хотя инженеры пытаются это изменить. В любом случае, когда дело доходит до рыночного сегмента, x86 не так эффективен, как другие архитектуры, а именно процессоры, основанные на 32-битных наборах команд ARMv7 и 64-битных ARMv8 от ARM.

За последнее десятилетие, и особенно за последние пять лет, процессоры ARM заняли доминирующее положение в мире смартфонов и планшетов. Процессоры ARM предлагают лучшую производительность на ватт, их дешевле проектировать, разводить на плате и развертывать. Крупные компании могут покупать дополнительные блоки (IP-ядра) для ARM процессора, такие как модемы, графические ускорители, и разрабатывать свои собственные на базе ARMv7 или ARMv8.

Это побудило некоторых разработчиков разрабатывать свои собственные кастомные ядра процессора ARM. Компании Qualcomm и Apple стали лидерами разработки System-on-Chip (SoC), разработка сложных и нестандартных ядер процессора сыграла решающую роль в их успехе. Однако кастомные ядра ARM использовались только для высокопроизводительных систем, в то же время остальной рынок использовал стандартные ядра ARM.

Одной из предпосылок успеха ARM была неудача Microsoft на рынке смартфонов и планшетов

Казалось бы связку Windows+Intel (Wintel) ничего не могло разорвать. ОС Windows с процессором Intel надежно доминировала на рабочих столах корпоративных и домашних столах пользователей. Microsoft долгое время развивала платформу Windows Mobile, основанной на Windows CE, предназначенной для встраиваемых систем от POS-терминалов до одноплатных компьютеров в промышленности. Windows CE работала только на RISC-архитектуре.

Когда на сцену вышел Android от Google, стало понятно что платформа Windows Mobile безнадежно устарела. Взамен дорогих смартфонов на Windows Mobile пришли более дешевые смартфоны на Android, вплоть до кустарных китайских, которые делались на коленке. Именно открытость платформы, развитые сервисы Google, низкая цена устройств, сделали процессоры ARM массовым продуктом.

Пытаясь прыгнуть в уходящий поезд, Microsoft анонсирует разработку новой платформы Windows Phone, взамен Windows Mobile. В 2015 году по данным IDC доля смартфонов Windows Mobile не превышала 2,2 процента. Разочарованными таким поворотом, Intel пытается выйти на рынок смартфонов с ОС Android. К этому времени ведущие производители смартфонов уже построили свой бизнес на использование ARM процессоров. Никто из производителей смартфонов не хотел связываться с Intel из-за больших рисков использование процессора x86 в смартфонах. На тот момент Google Play Store содержал программы только для ARM архитектуры. Энергопотребление смартфонов на Intel Atom было существенно выше, как и конечная цена для потребителя. По итогу было выпущено несколько смартфонов, но они не получили никакой особой популярности. К концу последнего десятилетия стало очевидно, что Microsoft и Intel уступили этот прибыльный рынок ARM, Google и Apple. К сожалению руководство компаний так и не смогло вовремя распознать потенциал смартфонов и планшетов.

Читайте также:  какие функции выполняют два ядра у некоторых простейших

Тем не менее, мобильная связь — не первый и не единственный сегмент рынка, который стал свидетелем провала Microsoft. Другой — рынок серверов. На первый взгляд, смартфоны и центры обработки данных не имеют много общего, но с технологической и деловой точки зрения они частично совпадают.

Независимо от того, разрабатываете ли вы смартфон или сервер, вам необходимо выделить сходные аспекты вашей аппаратной платформы, такие как энергоэффективность, низкое тепловыделение, соотношение производительность/цена и т. д. Самое главное, что вам действительно не нужен процессор на базе x86 для смартфонов и многих типов серверов. Благодаря неудачам Microsoft в этих сегментах рынка не доминирует Windows. Вместо этого используются операционные системы на основе Linux/Unix: Android, iOS и другие различные дистрибутивы.

Почему серверы ARM с самого начала казались хорошей идеей?

В настоящее время используется несколько миллиардов смартфонов и планшетов, работающих на процессорах ARM. Помимо использования в мобильных устройствах ARM процессоры используются в куче других устройств: маршрутизаторах, телевизионных приставках и смарт-телевизорах, умных часах, некоторых игровых устройствах, автомобильных информационно-развлекательных системах и т.д.

Не смотря на такую популярность, встретить ARM процессоры в других сегментах рынка сложно. Когда заходит разговор про сервера то обычно идет речь про x86 Xeon от Intel и AMD соответственно.

Так чем же ARM сервера лучше x86? ARM сервера дешевле обходятся. Этот тезис можно изложить по пунктам:


ARM сервера могут оказаться значительно дешевле, чем их аналоги на базе чипов Intel и AMD x86.

Использование устаревших x86 процессоров неэффективно с точки зрения энергозатрат. Потребляют и выделяют столько же энергии сколько и более производительные. Когда дело касается домашнего компьютера или офисного ПК тепловыделение не является большой проблемой. Но при проектирования центра-обработки данных прежде всего необходимо оценить TDP (thermal design power — конструктивные требования по теплоотводу, требования по теплоотводу). Потому что сервера с низким показателями TDP дешевле обходятся и проще обслуживать.

Сколько ядер достаточно для процессора?

Всего десять лет назад многоядерные процессоры x86 использовались в компьютерах и серверах, но теперь вы можете получить четырехъядерные процессоры Intel Atom (x86) в планшетах за сотню долларов.

До появления многоядерных процессоров была эпоха гонки частот. Для увеличение производительности повышали частоту работы процессора. Это приводило с существенному увеличению потребления электроэнергии и увеличению тепловыделения. В конечном итоге был достигнут потолок при котором дальнейшее повышение частоты работы процессора приводило к невозможности отведения тепла не выходя за стандартные разумные габариты систем. При большом тепловыделение можно перейти на жидкостное охлаждение или на охлаждение жидким азотом, но вряд ли такой подход может стать массовым.

Эпоха Гигагерц сменилась эпохой Многоядерности. Как оказалось, с технологической и финансовой точки зрения построение многоядерных систем лучше чем поднимать частоты работы процессора.

Намного проще распределить нагрузку на несколько меньших и более эффективных ядер процессора, чем разработать одно огромное ядро, способное работать на высоких частотах. Многоядерный подход обеспечивает превосходную эффективность и проще в дизайне микросхемы.


Многопоточность: серверные процессоры ARM могут состоять из большего количества физических ядер по сравнению с процессорами Intel x86.

С точки зрения наращивания количества ядер, ARM архитектура обладает гигантским потенциалом, возможно создание процессора ARM с 128 или 256 ядрами. x86 не обладает таким впечатляющим потенциалом. Это правда не означает что такие процессоры появятся у нас завтра, т.к. в данном случае ограничивающим фактором является пропускная шина данных.

Свой первый серверный процессор Qualcomm сделала с 24 ядрами ARMv8, и дала понять что в будущих моделях будет еще больше ядер. Qualcomm не единственная компания выпускающие процессоры ARM для серверов. Такие производители, как Broadcom, Calxeda, Cavium Networks и Huawei HiSilicon, также работают над серверными решениями на базе ARM. Nvidia и Samsung, два тяжеловеса в бизнесе SoC и GPU, также ведут разработку.

Что такое кастомные ядра ARM?

Рассмотрим различия не с точки зрения наборов инструкций x86 и ARM, а с точки зрения бизнеса. Наибольшая разница между Intel, AMD и ARM заключается в принципиально другой бизнес-модели. За годы развития, подход ARM к маркетингу и лицензированию своей технологии не изменился.

Рассмотрим технологический процесс изготовления процессоров Intel. Intel процессор разрабатывается с использованием наборов инструкций Intel. Далее, он производится на одной из фабрик Intel, упаковывается и поставляется с брендом Intel Inside. Это может показаться простым, но нужно не забывать о миллиардах затраченных на научно-исследовательские и опытно-конструкторские работы (НИОКР) на протяжении десятилетий.

А как насчет процессоров ARM? ARM — это не производитель микросхем, а компания занимающаяся разработкой и проектированием ARM ядер, поэтому вы нигде не увидите процессоры под этим брендом. ARM продает нечто гораздо более интересное: интеллектуальную собственность. Это означает, что клиенты ARM могут выбрать любой из множества различных планов лицензирования и начать создавать свои собственные процессоры. Большинство из них выбирают собственные разработки ARM (процессоры серии Cortex, графические процессоры серии Mali), поэтому они платят лицензионный сбор за каждое производимое ядро ​​CPU/GPU.

Однако не всегда клиенту необходимо лицензировать готовые процессоры; вместо этого он может лицензировать набор архитектуры и разработать собственное ядро ​​на основе набора инструкций ARM. Это то, что делает Apple. Они используют набор инструкций ARMv8 для создания больших и мощных 64-разрядных ядер процессора для своих устройств.

Спроектировать собственное ядро процессора непросто. Поэтому большинство компаний вместо этого используют стандартные ядра ARM Cortex (например 64-разрядное ядро ​​Cortex-A76 может использоваться в серверной среде).

Важно отметить, что чипы на базе ARM разрабатываются индивидуально, а ядра процессора, используемые в большинстве, — нет.

Подавляющее большинство процессоров ARM основываются на стандартных ядрах ARM (процессоры Cortex), а не на пользовательских ядра процессора. Производители конечного процессора могут выбрать любое из ряда ядер ARM, сторонних графических процессоров и других компонентов и адаптировать процессор в соответствии со своими потребностями без необходимости разрабатывать собственное ядро ARM. Это достаточно дешевый способ сделать архитектуру более гибкой, и он больше связан с политикой лицензирования ARM, чем с разработкой.

Также важно отметить, что такие будущие серверы ARM, основанные на 64-битной архитектуре ARM, обладают таким же набором периферийных устройств как и x86 процессоры. Уже многие процессоры ARM поддерживают различные интерфейсы такие как: PCIe, SATA, NVMe и т.д.

Процессоры ARM Neoverse для дата-центров

Компания ARM активно расширяет сегменты использования своих процессоров. Так желая потеснить лидерство Intel в сегменте высокопроизводительных систем, ARM разработала процессор ARM Neoverse предназначенный исключительно для дата-центров. В основе процессора лежит ядро Cortex-A76, частота работы до 3 ГГц (на практике до 2.6 ГГц). Дизайн процессора представлен двумя вариантами: Neoverse N1 и Neoverse E1. Ожидается что в 2021 году, фабрики выпускающие процессор Neoverse, перейдут производство с 7 нм на 5 нм.

Основой SoC на ядрах Neoverse N1 является Component Aggregation Layer (CAL). Он предназначен для работы в ячеистой топологии и содержит два интерфейса. Первый интерфейс обращен к сетевому уровню, состоящему из многочисленных пересечений XP (Crosspoint) ячеистой сети, которые представляют собой коммутаторы или роутеры. Второй интерфейс CAL обращен к кэшу System Level Cache. Mesh-сеть работает на 2/3 частоты ядер CPU и оптимизирована под минимальные задержки. Пропускная способность по сравнению с Cortex A72 была увеличена более чем в два раза.

Читайте также:  какие хосты хорошо растут на солнце

ARM на основе Neoverse N1 предлагает различные эталонные платформы. Дизайн N1 Edge ориентирован на сетевые и облачные решения, системы хранения данных. Здесь ARM использует до восьми ядер Neoverse N1. Дизайн N1 Hyperscale призван показать полный потенциал архитектуры. Здесь используются уже от 64 до 128 ядер N1 в ячеистой топологии 8×8. Объем System Level Cache составляет 64 или 128 Мбайт. Также доступны 128 линий PCI Express 4.0 и 8-канальный интерфейс памяти.


Материнская плата с ARM Neoverse N1 для проведения тестирования и оценки возможностей платформы.

Подобная SoC: блоки «CPU tiles» или плитки состоят из двух ядер N1 каждый. Восемь подобных плиток формируют «Super Tile». В итоге мы получаем строительные блоки дизайна N1 Hyperscale, в котором может насчитываться до 128 ядер. Mesh-сеть будет работать на частотах между 1,8 и 2,2 ГГц. Если данный уровень составляет 2/3 от частоты ядер, то в случае последних мы получим от 2,4 до 3,0 ГГц.


Построение ячеистой структуры ARM Neoverse N1.

Подобная SoC будет потреблять 105 Вт (в варианте с 64 ядрами). Впрочем, в зависимости от сценария, она может значительно обгонять процессоры Intel и AMD с 28 и 32 ядрами по производительности, так что эффективность должна быть выше.

Процессор Neoverse E1 прежде всего ориентирован на максимальную производительность, ARM поставила в приоритет обработку больших массивов данных. Мы получаем первый серверный процессор ARM с поддержкой SMT (Simultaneous Multi Threading).


Дизайн ARM Neoverse E1.

Система кэшей и блоков выборки была изменена с учетом выполнения нескольких потоков одновременно. Дизайн Neoverse E1 предусматривает до 16 ядер на SoC. Теоретически возможно и больше, но многие компоненты и кэш System Level Cache ориентированы на работу с кластером 2x 8 ядер. Подобный процессор работает с памятью DDR4-3200 по двухканальному интерфейсу. Энергопотребление всей SoC составляет меньше 15 Вт, причем самим ядрам требуется только 4 Вт — что еще раз показывает, что значительный вклад в бюджет энергопотребления вносят другие компоненты, подобные сетевым интерфейсам.

Neoverse E1 и Neoverse N1 показывает весьма серьезные амбиции ARM по завоеванию серверного рынка. ARM не собирается довольствоваться нишевым сегментом, компания планирует конкурировать с Intel и AMD. Та же Huawei за последние месяцы наглядно показала, что разработка собственных серверных процессоров на дизайне ARM является весьма перспективным направлением. ARM преобразовала дизайны Cortex в специализированные серверные платформы Neoverse E1 и Neoverse N1.

В следующие два года нас ждет интересная битва концепций. Но серверный рынок довольно инерционный, и на замену платформ может уйти несколько лет.

Отчет компании Forrester об эффективности перехода на ARM Neoverse

В середине прошлого года исследовательская и консультационная компания Forrester, по заказу ARM, представила отчет об оценки финансовой выгоды перехода на процессоры Neoverse. Чтобы лучше понять преимущества, затраты и риски, связанные с миграцией, Forrester провела интервью и опросила нескольких клиентов которые используют Neoverse, а также двух связанных поставщиков облачных услуг.


Переход на ARM сервера.


Сравнение финансовых затрат использование ARM и x86 серверов.

По итогу 3 лет владения ARM серверами, можно достичь 40% экономии финансовых средств, что весьма неплохо для мотивации перехода крупных ИТ компаний.

Процессоры ARM лучше подходят для специализированных корпоративных приложений

Что касается разработки корпоративных приложений, то вся оптимизация исполнения сводится к более лучшим алгоритмам. Например, если необходимо более быстро производить поиск текстовой информации, то применяются индексы, различные алгоритмы. Так или иначе в увеличение быстродействия есть определенный потолок, а новые алгоритмы достаточно сложно придумать. Все это верно в архитектуре существования x86 процессоров.

Если взять ARM процессор, то мы можем добиться лучших результатов путем перемещение логики ПО в «железо». Алгоритм будет выполнятся не на процессоре общего назначения, и на специальном сопроцессоре работающем в тандеме с основным ядром ARM. Одним из примеров является компания Google, которая разработала свой дизайн серверов. А так же специализированные сервера Amazon для услуг хостинга.

AWS Graviton — специализированный процессор для Amazon Web Services

Amazon стала одной из первых компаний решившей разработать процессоры «для себя». Новые процессоры должны были заменить решения на x86, в части некоторых сервисов.

Процессоры AWS Graviton созданы по оригинальной разработке Amazon с использованием 64-битных ядер Arm Neoverse и обеспечивают оптимальное соотношение цены и качества для облачных нагрузок Amazon EC2.

Процессоры AWS Graviton первого поколения используются для инстансов Amazon EC2 A1 – первых в мире инстансов AWS на базе архитектуры ARM. Эти инстансы позволяют значительно сократить затраты на другие инстансы общего назначения для горизонтально масштабируемых приложений, таких как веб-серверы, микросервисы на базе контейнеров, средства обработка данных журналов, а также других рабочих нагрузок, для управления которыми можно использовать меньшие ядра и доступные объемы памяти.

Процессоры AWS Graviton2 по сравнению с процессорами AWS Graviton первого поколения отличаются более высокой производительностью и расширенными возможностями. Они используются для работы инстансов Amazon EC2 T4g, M6g, C6g и R6g, а также их вариантов с локальным SSD‑хранилищем на базе NVMe, которые обладают увеличенной на 40 % производительностью (по сравнению с аналогичными инстансами текущего поколения на базе архитектуры x86) и предназначены для самых разнообразных рабочих нагрузок, в том числе запуска серверов приложений, микросервисов, высокопроизводительных вычислений, автоматизации проектирования электроники, игровых приложений, баз данных с открытым исходным кодом и кэширования в памяти.


SoC AWS Graviton2.

Инстансы на AWS Graviton2 использует компания компания Snap Inc, известный поставщик сервисов для социальных сетей, таких как Snapchat и Bitmoji. По заявлению инженер-программиста компании, переход на инстансы C6g на базе Graviton2 позволил уменьшить загрузку CPU примерно на 10 % за счет лучшей производительности.

Переход на инстансы M6g на Graviton2 позволили крупнейшему онлайн кинотеатру Netflix увеличить производительность java-приложений до 50% по сравнению с инстансами на M5 (Intel Xeon Scalable или AMD EPYC).

ARM сервера, за и против

ARM сервера как правило используются в небольших нишах и не подходят для небольших команд разработчиков, которые могут работать с любым сервером. Малый бизнес скорее всего выберет x86 сервер, чем сервер на ARM. Мало того, при построении небольшой системы конечная стоимость серверов на x86 и ARM будет практически сопоставима.

Однако, не смотря на это, выгода использования ARM серверов будет следующей:

Еще одна очевидная проблема — поддержка устаревшего программного обеспечения. С одной стороны хорошо когда компания развивает продукт и может его в дальнейшем перенести на ARM архитектуру. Но что делать если используется продукт от компании, которая уже не существует на рынке, или поддержка продукта прекращена.

Многие разработчики ПО по отношению к ARM архитектуре занимают выжидательную позицию, т.к. пока нет запросов от крупных клиентов на поддержку ARM.

А как насчет этих старых привычек? У программистов принято, раз работает нормально, не трогай. Поскольку серверные технологии развиваются не быстро, люди склонны придерживаться проверенных платформ, а именно оборудования x86. Поэтому любое использование серверов ARM создает лишний риск, и для перехода потребуется изрядная смелость и уверенность.

На правах рекламы

Наша компания предлагает в аренду серверы с современными процессорами от Intel и AMD под самые разнообразные задачи. Эпичные серверы — это VDS с AMD EPYC, частота ядра CPU до 3.4 GHz. Максимальная конфигурация — 128 ядер CPU, 512 ГБ RAM, 4000 ГБ NVMe. Создайте свой собственный тариф самостоятельно в пару кликов!

Источник

Информ портал о технике и не только