インテル® マックス・シリーズ:飛躍的に進歩したメモリー帯域幅とパフォーマンスでHPCとAIを前進

この記事は約9分で読めます。
最新情報:インテルは、テキサス州ダラスで開催されるSupercomputing 2022(SC22)カンファレンスに先立ち、ハイパフォーマンス・コンピューティング(HPC)と人工知能(AI)を対象に、インテル® Xeon® CPU マックス・シリーズ(開発コード名:Sapphire Rapids HBM)とインテル® データセンター GPU マックス・シリーズ(開発コード名:Ponte Vecchio)の2つの最先端プロセッサーを提供する、インテル® マックス・シリーズ製品ファミリーを発表しました。この新しい製品ファミリーは、アルゴンヌ国立研究所で稼働間近のスーパーコンピューターAuroraに搭載される予定となっており、その導入に関する最新情報もあわせて本日公開されています。

インテル® Xeon® CPU マックス・シリーズは、広帯域幅メモリーを内蔵した初の、そして唯一の、x86ベース・プロセッサーです。コード変更の必要なく、多くのHPCワークロードを高速化します。インテルの最高集積度のプロセッサーとなるインテル® GPU マックス・シリーズは、1,000億を超えるトランジスターを47タイルのパッケージに組み込み、最大128ギガバイト(GB)の広帯域幅メモリーを内蔵しました。この2つのプロセッサー・シリーズはいずれも、oneAPIのオープン・ソフトウェア・エコシステムにより提供される共通のプログラミング環境を利用することができます。インテルが2023年の提供開始を予定しているoneAPIとAIツールによって、インテル® マックス・シリーズ製品ファミリーの高度な機能を構築できるようになります。

「どのHPCワークロードもおくれを取ることがないように、帯域幅とコンピューティング性能、開発者の生産性、最終的には影響力まで、すべてを最大化するソリューションが必要です。インテル® マックス・シリーズ製品ファミリーが広帯域幅メモリーをさらに幅広い市場へと拡張すると同時に、oneAPIによりCPUとGPUを横断したコード共有が容易になるため、世界が直面している最難関の課題を短期間で解決することが可能になります」
– インテル コーポレーション 副社長 兼 スーパーコンピューティング事業本部 本部長、ジェフ・マクベイ(Jeff McVeigh)

本技術の重要性:ハイパフォーマンス・コンピューティング(HPC)は、気候変動の抑制、世界中で多くの人の命を奪う感染症の治療など、科学と社会が直面する最難関の課題を解決に向け、先進のさまざまなイノベーションを大規模に取り入れた、テクノロジーの最先端を象徴する技術です。

インテル® マックス・シリーズ製品は、このコミュニティーが必要とする要件をスケーラブルでバランスの取れたCPUとGPUで満たしながら、メモリー帯域幅の大幅な進歩を組み込み、oneAPIのオープン、標準ベース、クロスアーキテクチャーのプログラミング・フレームワークによって統合しました。インテル® マックス・シリーズ製品を導入することで、リサーチ部門やビジネス部門はこれまでよりも短期間かつ持続可能な方法で、問題の解決につなげていくことができます。

提供スケジュール:インテル® マックス・シリーズ製品は、2023年1月の提供開始が予定されています。インテルはお客様とのコミットメントを確実に実行し、アルゴンヌ国立研究所にはスーパーコンピューターAuroraに搭載するインテル® GPU マックス・シリーズのブレードを、ロスアラモス国立研究所や京都大学をはじめとするスーパーコンピューティングの拠点にはインテル® Xeon® CPU マックス・シリーズを出荷する予定となっています。

インテル® Xeon® CPU マックス・シリーズがもたらすもの:インテル® Xeon® CPU マックス・シリーズは、4つのタイルで構成されインテルのエンベデッド・マルチダイ・インターコネクト・ブリッジ(EMIB)テクノロジーを使用して接続される最大56個のPerformance-coresを、350ワットの消費電力枠内で実装しています。また、64GBの広帯域幅インパッケージ・メモリーを内蔵し、PCI Express 5.0とCXL1.1 I/Oに対応しました。コア当たりの広帯域幅メモリー(HBM)は1GBを上回り、広く普及しているHPCワークロードの大半に十分適応できる容量となっています。実環境のHPCワークロードで、インテル® Xeon® CPU マックス・シリーズは競合製品と比べて最大4.8倍高いパフォーマンスを発揮します。[1]

  • 同等のHCPGパフォーマンスの場合、AMD Milan-Xクラスターと比べて68%低い消費電力。
  • インテル® AMXの拡張機能によりAIパフォーマンスが引き上げられ、INT8とINT32を組み合わせた累積演算で、インテル® AVX-512と比べてピーク時のスループットは8倍。2
  • HBMとDDRのさまざまなメモリー構成で動作する柔軟性。
  • ワークロードのベンチマーク結果:
    • 気象モデリング:HBMのみを実装したMPAS-AでAMD Milan-Xクラスターと比べて2.4倍高速。
    • 分子動力学:DeePMD上でDDRメモリー構成の競合製品と比べて2.8倍高いパフォーマンス。

インテル® GPU マックス・シリーズがもたらすもの:インテル® GPU マックス・シリーズは、最大128個のHPC対応Xe-coreを内蔵し、要件の極めて厳しいワークロードを対象に、新しい基盤アーキテクチャーで構築されました。さらに、次のような特長を備えています。

  • 業界最高レベルとなる408MBのL2キャッシュと64MBのL1キャッシュにより、スループットとパフォーマンスを向上。
  • 科学的データのビジュアル化やアニメーションの高速化を意図して設計された、レイトレーシングのアクセラレーションをネイティブ実装した唯一のHPC/AI向けGPU。
  • ワークロードのベンチマーク結果:
    • 金融:Riskfuelクレジット市場オプション価格決定モデルで、NVIDIAのA100と比べて2.4倍高いパフォーマンスを実現。
    • 物理:NekRS仮想原子炉シミュレーションにおいて、A100と比べて1.5倍改善。

インテル® GPU マックス・シリーズは、さまざまなお客様からの幅広いニーズに応え、次のとおり複数のフォームファクターで提供される予定です。

  • インテル® マックス・シリーズ1100 GPU:56個のXe-coreと48GBのHBM2eメモリーを内蔵した、300ワットのダブルスロット幅PCIeカード。インテルのXe Linkブリッジ経由で複数のカードを接続できます。
  • インテル® マックス・シリーズ 1350 GPU:112個のXe-coreと96GBのHBMを内蔵した、450ワットのOAMモジュール。
  • インテル® マックス・シリーズ 1550 GPU:128個のXe-coreと128GBのHBMを内蔵した、インテル最大のパフォーマンスを誇る600ワットのOAMモジュール。

個別のカードとモジュール以外にも、4つのGPU OAMキャリアボードとインテルの Xe Link により構成されるインテル® データセンター GPU マックス・シリーズのサブシステムが提供される予定です。これにより、サブシステム内でハイパフォーマンスのマルチGPU通信が可能になります。

インテル® マックス・シリーズ製品が実現すること:2023年に、現在アルゴンヌ国立研究所で構築中のスーパーコンピューターAuroraは、倍精度演算のピーク性能が2エクサフロップスを超える初のスーパーコンピューターになると期待されています。3さらに、1万枚以上のブレードにそれぞれ6基のインテル® GPU マックス・シリーズと2基のインテル® Xeon® CPU マックス・シリーズを実装するAuroraは、1つのシステム内にインテル® マックス・シリーズ製品のGPUとCPUを組み合わせたパワーを初めて実証すると見込まれます。

アルゴンヌ国立研究所とインテルは、SC22開催に先立ち、128枚の製品版ブレードで構成される、Auroraのテスト開発システム「Sunspot」を公開しました。早期アクセスを提供するAurora Early Science Programに参加する研究者は、2022年後半からこのシステムを利用できるようになります。

インテル® マックス・シリーズ製品はほかにも、ロスアラモス国立研究所のCrossroads、ローレンスリバモア国立研究所とサンディア国立研究所のCTS-2システム、京都大学のCamphor3といった、国の安全保障や基礎研究に不可欠なHPCシステムへの搭載が予定されています。

次のステップ:Supercomputing 2022でインテルはお客様とともに、12社のOEMメーカーから今後リリースされる、インテル® マックス・シリーズ製品を搭載した40を超えるシステムデザインを公開します。このカンファレンスでは、AIとHPCの幅広いアプリケーションを使用した、インテル® マックス・シリーズ製品のパフォーマンスと機能を詳しく紹介するデモをご覧いただけます。また、インテルのアーキテクト、お客様企業、エンドユーザーから、インテルのプラットフォーム・ソリューションが持つパワーについて見解を聞くこともできます。ぜひインテルのブース#2428までお越しください。[SC22でインテルが実施するアクティビティーについては、こちら(英語)に詳細を記載しています。]

インテル® データセンター GPU マックス・シリーズ(開発コード名:Rialto Bridge)は、インテル® GPU マックス・シリーズの後継として、パフォーマンスの向上はもちろん、シームレスなアップグレード・パスを用意し、2024年に登場する予定です。インテルはこれに続き、HPCの未来を実現する次の大きなアーキテクチャー・イノベーションを創出しようと計画しています。開発コード名Falcon Shoresで呼ばれる今後登場するXPUでは、Xe-coreとx86コアが単一のパッケージ上に統合される見込みです。この画期的な新しいアーキテクチャーは、インテルおよびパートナーが提供する最新IPを統合できる柔軟性も備えた、インテルのIDM 2.0モデルを活用して製造されます。

1 ワークロードと構成については、http://www.intel.com/PerformanceIndex/(英語)のSupercomputing 2022ページを参照してください。結果は状況によって異なります。

2 出典:インテル® AMXがPerformance-coreにもたらす効果について、インテルが公開しているステートメントと詳細情報。「Performance Index:Architecture Day 2021」、edc.intel.com/content/www/tw/zh/products/performance/benchmarks/architecture-day-2021/。

3 倍精度演算のピーク性能。性能は、使用状況、構成、その他の要因によって異なります。
ワークロードと構成については、http://www.intel.com/InnovationEventClaims/(英語)を参照してください。結果は状況によって異なります。

タイトルとURLをコピーしました