Организацию ЦЕРН никому представлять не надо — все знают Большой адронный коллайдер (БАК). Но не все знают, что эксперименты, проводимые на установках такого класса, требуют чудовищных вычислительных мощностей для обработки полученных результатов. И без своего спутника, распределённой вычислительной сети LCG (LHC Computing Grid) БАК был бы бесполезной дорогой игрушкой. Но большие вычислительные мощности означают и соответствующий уровень энергопотребления. Чтобы выяснить, какая процессорная архитектура показывает себя наиболее эффективной и экономичной в деле построения вычислительных сетей класса LCG, в ЦЕРН был проведён соответствующий эксперимент.
Честь архитектуры ARMv8 выпало защищать серверу Applied Micro X-Gene 1, поддерживающему 64-битные вычисления. А соперниками выступили системы на базе Intel Xeon E5-2650 и ускоритель Xeon Phi SE10/7120. В качестве программной платформы для архитектуры x86 использовался специальный дистрибутив Linux, созданный в ЦЕРН, а для платформы ARM была использована Fedora 19. Тестирование с помощью теста Geant4 ParFullCMS показало, что чудес не бывает, и чистая производительность без учёта энергопотребления по-прежнему остаётся вотчиной Intel. Победителем стал Xeon Phi SE10/7120, способный работать с 244 потоками кода.
Однако двухпроцессорный сервер на базе Xeon E5-2650 уступил ему совсем незначительно. И в аутсайдерах, ожидаемо, оказалась платформа ARM X-Gene1, показавшая в 2,48 раз меньший результат. Но если взглянуть на результаты с другой стороны, то при обработке восьми потоков X-Gene 1 потреблял энергии меньше, нежели Xeon E5-2650, работающий с единственным потоком, демонстрируя при этом почти трёхкратное преимущество в производительности (x2,73). Следовательно, в ряде случаев использование архитектуры ARM может быть более выгодным, нежели применение традиционных серверов на базе Intel Xeon. Особенно, если речь идёт о массивной параллельной нагрузке, а такой сценарий обработки данных весьма характерен для экспериментов ЦЕРН.
Заключение исследователей из ЦЕРН звучит примерно так: «даже при отсутствии оптимизаций в используемом для ARMv8 64-битном компиляторе GCC, платформа X-Gene 1 показывает многообещающие результаты, доказывающие, что разработки Applied Micro могут составить серьёзную конкуренцию Intel Xeon, особенно в плане энергоэффективности». Команда исследователей заявила, что будет рада протестировать новое поколение северов X-Gene 2 — процессоры, установленные в них, произведены с использованием 28-нанометрового техпроцесса и могут иметь до 16 ядер с частотой 2,8 ГГц.
|