|
|
IBM eServer pSeries 690 (Regatta) – Общая информация![]() pSeries 690 - новая старшая модель pSeries 4 октября 2001 г. компания IBM объявила новую UNIX-систему – сервер масштаба предприятия eServer pSeries 690. Эта система полностью эксплуатирует возможности новой, мощной микропроцессорной технологии IBM POWER4, использует революционно новую технологию сверхплотной упаковки, содержит множество функций повышения надежности и доступности, унаследованных от мэйнфреймов, и на достаточно высоком уровне поддерживает возможности логического разбиения и кластеризации. Предлагается три основных конфигурации p690: Варианты p690 и p690 Turbo предназначены для обработки коммерческих рабочих нагрузок общего характера, рабочих нагрузок OLTP и Web, а также для научно-технических вычислений с низкими требованиями к пропускной способности. Вариант p690 HPC оптимизирован для научно-технических задач с высокими требованиями к пропускной способности, таких, как компьютерное моделирование задач гидродинамики, трехмерное моделирование нефтяных месторождений и т.п. В этом варианте объем кэш-памяти, приходящейся на каждый процессор, увеличен вдвое. Дебют 64-разрядного кристалла POWER4 В новой системе используются новейшие 64-разрядные процессоры IBM POWER4 тактовой частотой 1,1 ГГц и 1,3 ГГц. Уникальная особенность архитектуры системы – два процессора PowerPC на одном кристалле (многопроцессорность на уровне микросхем или «SMP на кристалле»), на котором также содержится коммутатор с высокой пропускной способностью, большой кэш и ресурсы ввода-вывода. Каждая микросхема содержит рекордное число транзисторов – 170 миллионов. Технология многокристальных модулей (Multi-Chip Module, МСМ) pSeries 690, разработанная на основе процессорной технологии z/900, объединяет четыре микросхемы POWER4 в блок размером с кулак, содержащий восемь процессоров и отличающийся сверхвысокой плотностью интеграции и скоростью работы при низком энергопотреблении. Модели с числом процессоров от 8 до 32 В коммерчески выпускаемых вариантах системы pSeries 690 может насчитываться 8, 16, 24 или 32 процессора. Полная 32-процессорная конфигурация p690 содержит четыре MCM. Объем оперативной памяти варьируется от 8 до 256 Гбайт, размер кэш-памяти L1 – 32 Кбайт для данных и 64 Кбайт для команд, размер кэш-памяти L2 – 5,6 Мбайт на каждый MCM, размер кэш-памяти L3 – до 128 Мбайт на каждый MCM, в системе ввода-вывода может насчитываться до 160 (64-разрядных) слотов PCI. Многие технологии RAS перенесены с мэйнфреймов на платформу UNIX. Длинный список функций RAS, включая т.н. «самовосстанавливающуюся архитектуру», обещает обеспечить высочайший уровень надежности в сегменте UNIX-серверов. В коммерчески выпускаемых вариантах системы pSeries 690 используются операционные системы – AIX5L и Linux, причем для данной версии AIX заявляется о «серьезной интеграции с Linux». Первый сервер IBM UNIX, поддерживающий логические разделы Данная система поддерживает логические разделы – до 16 (минимум ресурсов в одном разделе: 1 процессор, 1 Гбайт памяти и 1 слот PCI), предоставляя заказчику значительно большую гибкость формирования разделов по сравнению с системами конкурентов, а также возможность любого сочетания рабочих нагрузок AIX5L и Linux. Новая старшая модель pSeries Сервер p690 демонстрирует значительный прогресс по сравнению с предыдущей старшей моделью линии – pSeries 680.
Кристалл процессора POWER4ВведениеВыполненный на основе самых передовых технологий, революционно новый процессорный кристалл IBM POWER4 является основным фактором, обеспечивающим высокую производительность нового флагмана линейки корпоративных серверов IBM – системы pSeries 690. Начиная со второго квартала 2002 года процессор POWER4 будет также устанавливаться в старших моделях систем eServer iSeries (AS/400), благодаря чему характеристики старших моделей iSeries вплотную приблизятся к Regatta. Корпорация IBM является общепризнанным мировым лидером в области микроэлектроники, обладая богатейшей историей исследований, разработок и инноваций в части технологии и производства полупроводниковых схем, которые компания использует как для собственных систем, так и для развития сотрудничества с другими производителями. Подразделение IBM Microelectronics проектирует и изготавливает широкий набор полупроводниковых изделий, включая заказные специализированные микросхемы (ASIC), процессоры, память, сетевые и коммуникационные микросхемы. Основные процессорные модули IBM, RISC-процессоры серии PowerPC, в течение многих лет использовались в серии UNIX-серверов RS/6000 (с конца 2000 серия переименована в eServer pSeries). Кристалл POWER4 в настоящее время является самым крупным и мощным микропроцессором, выпускаемым компанией. Цели проекта POWER4 Проект IBM POWER4 был направлен на создание мощного процессорного кристалла и системной архитектуры, специально предназначенных для серверов. Для достижения этой цели использовались последние достижения в плотной модульной упаковке процессорных блоков, в полупроводниковой технологии, архитектуре и структуре системы, которые позволили достичь высокой производительности и получить единый процессорный блок для северных семейств IBM – высокопроизводительных линеек pSeries (UNIX) и iSeries (AS/400). Ниже перечислены конкретные цели проекта POWER4: Два процессора на кристалле Разработка процессора POWER4 была одним из крупнейших проектов по разработке и проектированию процессоров за всю историю IBM. В этом проекте была задействована мощная команда (300 разработчиков) из отделения IBM в Остине, штат Техас (отвечающего за разработку серверных процессоров), эксперты по процессорам больших ЭВМ, персонал из подразделения IBM Research, отделения IBM в Рочестере, штат Миннесота, и другие группы. Их цель состояла в разработке серверного процессора нового поколения с уникальными возможностями, реализованного на базе новейших достижений полупроводниковых технологий, предназначенного для работы в новых моделях UNIX-серверов pSeries (прежде всего в высокопроизводительном сервере p690) и для семейства серверов iSeries (AS/400). Эта главная цель была успешно достигнута, и кристалл POWER4 демонстрирует новые решения и новые уровни ресурсов, которые раньше не применялись в кристаллах серверных процессоров. Краткие характеристики: ![]() Схема 64-разрядного кристалла IBM POWER4 В кристалле POWER4 размещены два 64-разрядных процессорных ядра PowerPC (в вариантах кристалла для коммерческих задач), большой кэш второго уровня (L2) с общим доступом, каталог и контроллер кэша L3 и высокопроизводительная коммутирующая матрица каналов связи; все это изготовлено на одном полупроводниковом кристалле. Так называемый метод многопроцессорной обработки на кристалле (Chip Multi-Processing - CMP) фактически реализует на одном кристалле симметричную многопроцессорную систему (SMP) с двумя процессорами, что дает большие преимущества в достигаемой ширине полосы пропускания, плотности упаковки, скорости работы и потребляемой мощности. Такой подход – реализация многопроцессорной системы на одном кристалле – резко контрастирует с методами, применяемыми в серверных системах конкурентов. Серверная система IBM pSeries 690ВведениеСервер pSeries 690 Regatta – это крупный (до 32 процессоров) сервер масштаба предприятия, выпускаемый в 8-, 16-, 24- и 32-процессорной версии. Это первый UNIX-сервер IBM, поддерживающий логические разделы (LPAR), и первый UNIX-сервер pSeries на базе кристалла IBM POWER4. Система состоит из процессорной подсистемы и до восьми корпусов ввода-вывода, каждый из которых выполнен в виде выдвижного ящика для монтажа в стойку. Процессорная подсистема состоит из 1-4 многокристальных модулей (MCM), каждый из которых содержит четыре 2-процессорных кристалла POWER4, образующих конструктивный блок процессорной подсистемы с 8 CPU. Каждый корпус ввода-вывода содержит 20 слотов ввода-вывода PCI и до16 отсеков для дисковых накопителей. Система размещается в одном стоящем на полу стоечном шкафу размером 24 дюйма и может содержать до четырех ящиков ввода-вывода. Для расширения до максимальных восьми корпусов ввода-вывода необходим второй шкаф. Система работает под управлением операционной системы AIX5L для POWER4 версии 5.1. Конструктивный блок многокристального модуля Ключевым аспектом конструкции процессорной подсистемы является сверхкомпактная упаковка процессорных модулей. На многокристальном модуле смонтировано четыре процессорных кристалла POWER4, составляющие вместе 8-процессорный конструктивный блок SMP. ![]() Многокристальный модуль (МСМ) сервера p690 ![]() Керамический носитель/соединитель кристаллов МСМ p690 Во всех конкурирующих системах четыре отдельных процессорных кристалла, кэши, оперативная память, шина/коммутатор и схема подключения ввода-вывода размещены на полноразмерной 4 процессорной системной плате, имеющей гораздо большие физические размеры, низкую плотность монтажа и более высокую потребляемую мощность. Единственный MCM p690 по мощности процессора/кэша сравним с двумя платами Sun Uniboard или двумя платами HP Superdome. Такая компактная конструкция является важным фактором, который вместе с кристаллом POWER4 обеспечивает высокую производительность системы p690. Обзор системы памяти Ширина полосы пропускания между процессором и кэшем L2 превышает 125 Гбайт/с. Каждый каталог кэша L3 (внутреннего) кристалла POWER4 имеет доступ к внешнему кэшу L3 (128 Мбайт на каждый MCM в полной конфигурации) на 1/3 тактовой частоты процессора и к главной памяти (до 256 Гбайт в полной конфигурации) с помощью контроллеров памяти с шириной полосы пропускания между процессором и кэшем L3 свыше 10 Гбайт/с. Кэш-память L3 и ее взаимодействие с MCM Кэш L3 для каждого кристалла состоит из двух микросхем eDRAM емкостью по 16 Мбайт, смонтированных в отдельном модуле. Для каждого кристалла POWER4 используется один контроллер памяти с 1 или 2 портами, и каждый порт может поддерживать до 16 Гбайт памяти. Физически это реализовано в виде платы памяти с двумя контроллерами и микросхемами памяти, на MCM имеются две платы памяти. В различных конфигурациях можно использовать различные платы памяти с размерами от 4 Гбайт до 32 Гбайт, так что можно создать сбалансированную конфигурацию для типично используемых прикладных программ. Применение чередующегося доступа к памяти зависит от используемой конфигурации платы. Система в полной конфигурации В максимальной 32-процессорной конфигурации четыре модуля MCM, каждый из которых насчитывает четыре кристалла POWER4, то есть 8 процессоров, соединены вместе с помощью каналов связи кристалл-кристалл. Каждый модуль MCM имеет доступ к кэшу уровня 3 объемом до 128 Мбайт. Поддерживается синхронная динамическая оперативная память с коррекцией ошибок ECC SDRAM объемом до 256 Гбайт. ![]() Внешний вид системной платы С точки зрения архитектуры система pSeries 690 как целое является системой типа ccNUMA (неоднородной доступ к памяти с согласованным кэшем), построенной из 8-процессорных SMP-модулей MCM, каждый из которых в свою очередь состоит из четырех кристаллов POWER4 с архитектурой «2-процессорный SMP на кристалле». Для обеспечения согласованности кэша используется каталог. Подсистема ввода-вывода и внутренняя дисковая память В системе ввода-вывода pSeries 690 используются адаптеры PCI, размещенные в корпусах ввода-вывода системы, которые подключены к процессорной подсистеме с помощью кабелей дистанционного ввода-вывода (Remote I/O - RIO). Производительность системы pSeries 690Эталонные тестыSPECjbb2000: Эта интересная тестовая программа SPEC, измеряющая производительность Java (которая эмулирует прикладную программу с трехэтапной обработкой заказов на сервере Java и делает основной упор на производительность среднего звена обработки) для 16-процессорной системы p690 HPC дала результат в 169794 операций. Данное значение можно сравнить с результатом этого же теста для 24-процессорной системы IBM p680, который равнялся 157754. Новый сервер Sun Fire 15000 от Sun в максимальной 72-процессорной конфигурации для коммерческих задач показал результат 323309. 24-процессорный сервер HP Superdome показал результат 146825. TPC-C: Результаты тестов TPC-C для p690 и Sun Fire 15000 до сих пор не опубликованы. Однако возможность получения высокого результата в TPC-C указывается высоким результатом, полученным на IBM p680 (24 проц., Oracle 8i, 20.03.01) - 220,807 tpmC при относительной стоимости единицы производительности tpmC в $34,18, в настоящее время это четвертый по величине результатов для автономных систем. LINPACK TPP: 16-процессорный сервер p690 Turbo установил новый рекорд в пиковой производительности Linpack Peak в 83200 мегафлоп (миллион операций с плавающей запятой в секунду) и показал результат для N=1,000 в 28080 мегафлоп, что наглядно демонстрирует его возможности в общих технических расчетах. 16-процессорный HP Superdome (553 МГц) показал результат 35325 и 12220 мегафлоп в таких же испытаниях. Sun не публиковала результаты этого теста. Fluent: Программа эмуляции гидродинамических расчетов Fluent (перенос жидкости, тепла и массы - CFD) является широко используемой инженерной расчетной программой, она также широко используется для тестирования производительности. На наборе данных FL5M1, 32-процессорный сервер p690 установил новый рекорд в 4826,8 заданий/день, в то время как 72-процессорный Sun Fire 15000 достиг значения 2723,4 заданий/день. Система p690 (32 процессора, 128 ГБ памяти, 432 ГБ дисковой памяти) стоит 2,378 млн. долл., в то время как Sun Fire (72 процессора, 288 ГБ памяти и 432 ГБ дисковой памяти) стоит 4,141 млн. долл. Таким образом, p690 обогнал по производительности Sun Fire на 77%, при стоимости всего в 43% от его стоимости, что дает трехкратный выигрыш по соотношению цена/производительность в этом тесте. Сервер p690 победил Sun Fire во всех девяти категориях теста Fluent, в некоторых случаях перевес производительности превышал 100%. Сервер HP Superdome (32 процессора) показал результат 2215,4 заданий/день, что на 54% ниже результата IBM p690; отметим, что обе системы являются 32-процессорными. Тесты SPEC процессора В эталонных тестах одного процессора SPEC для процессора p690 Turbo были получены следующие результаты; они приведены вместе с полученными ранее наивысшими результатами для систем с процессорами Power предыдущего поколения:
Эти эталонные тесты производительности целочисленных операций и операций с плавающей точкой проверяют производительность микропроцессора и архитектуры памяти (и компилятора). Поскольку производительность операций с плавающей точкой в сравнении с предыдущим самым быстрым 76-процессорным сервером Power RS62/IV увеличилась втрое, а целочисленная производительность – почти вдвое, то рост производительности за счет микропроцессора POWER4 очевиден и впечатляющ. График тестирования Для получения более адекватных результатов был отобран ряд основных промышленных тестовых программ и составлен график тестирования. В четвертом квартале 2001 и в первом квартале 2002 будут выполнены следующие тесты, их результаты будут опубликованы: Это является явным намеком на то, что хорошие результаты ожидаются в большинстве, если не во всех этих тестах (производители обычно молчат о тестах, не обещающих хороших результатов), и мы с интересом ждем результатов этих тестов Операционная системаВведение в AIXAIX – это открытая операционная среда UNIX от IBM. Это зрелая, признанная операционная система UNIX масштаба предприятия, обеспечивающая глубокий уровень интеграции, гибкость и надежность для задач e-бизнеса корпоративного масштаба и работающая на ряде систем IBM и OEM-поставщиков архитектуры POWER, включая IBM pSeries 690 и все системы RS/6000. AIX поддерживает существующие 32- и 64-разрядные аппаратные системы до их пределов масштабирования, и содержит как часть основной операционной системы ключевые технологии Интернета, в частности, Java. Главным из добавленных недавно преимуществ является сильное сходство AIX с Linux, которое позволяет популярным приложениям Linux работать в среде AIX после обычной перекомпиляции. Операционная система поддерживает широкий круг систем, от рабочих станций и серверов начального уровня до крупных систем, подобных pSeries 680 и 690, и вплоть до массивных кластерных суперкомпьютеров RS/6000 SP. Действующие и расширенные недавно особенности AIX включают: 32-разрядное и 64-разрядное ядра; поддержку 32-разрядных и 64-разрядных API; динамическую настройку и подключение устройств; журнальную файловую систему (JFS) и программный администратор логических томов (Logical Volume Manager – LVM); расширенное управление системой с помощью инструмента System Management Interface Tool (SMIT) и Web-средства управления системой. Системам PSeries 690 требуется вариант AIX5L для POWER4 версии 5.1 с определенными APAR. Обзор AIX5L AIX5L – значительно модернизированная версия операционной системы AIX, введенная в 2000 г. после больших усилий по разработке с участием IBM и ряда партнеров из сообщества открытых систем. AIX5L обеспечивает прекрасную двоичную совместимость для всех предыдущих 32-разрядных и 64-разрядных приложений AIX, гарантируя заказчикам, что их существующие бизнес-приложения продолжат работать после перехода к ОС нового поколения. Основанная на богатейшем опыте IBM в области коммерческих и научно-технических задач, AIX5L масштабируется в широком диапазоне систем и конфигураций, служит платформой для обширных вариантов кластеризации (направленных как на наращивание мощности, так и на снижение простоев - подробное обсуждение см. в разделе 7), а теперь, для pSeries 690, была добавлена поддержка логических разделов LPAR. (Подробное обсуждение см. в разделе 6). Это поколение AIX5L содержит следующие принципиально новые или значительно усовершенствованные функции и возможности: Ряд этих возможностей и оказывается особенно полезным в применении к новому серверу pSeries 690. |