IBM Power

Power10はPOWER9と何が違うのか〜メモリー編〜

記事をシェアする:

Power10プロセッサーを搭載したサーバーの発表が、少しずつ近づいてきています。Power10プロセッサーはインターフェース周りの変更がいくつかあり、メモリーの帯域幅向上や大容量化を実現する設計となっています。本記事では、POWER10プロセッサーについて調査と研究をしている水野 智之が、POWER10プロセッサーのメモリーについて3つの特長を紹介するとともに、実際にどのような場面で貢献できるのかを考察します。

2021年、Power10プロセッサーを搭載するサーバー・ハードウェアの発表が予定されているIBM Power Systems。今後、IBM Systems Japan Blogでは、POWERプロセッサーとIBM Power Systemsの歴史的な出来事や、Power10プロセッサーの紹介と具体的なユースケースといった内容の記事を毎月公開します。

水野 智之

水野 智之
日本アイ・ビー・エム株式会社 テクノロジー事業本部 Power Systems テクニカル・セールス

2017年からIBM Power Systemsのエンジニアとしてプリセールスとして活動。現在、製造やメディアのお客様を中心に営業活動をする。また、Power SystemsにおけるLinuxやOpenShiftに関する情報発信を行っており、社内外のセミナーで講師も担当する。Power10プロセッサー研究会のメンバーとして活動中。


1.メモリー接続はより高帯域に!

Power10プロセッサーの発表で目を引くものといえば、バンド幅の向上ではないでしょうか? POWER9プロセッサーではPCIe Gen4の採用やNVLinkといったCPU単体性能の性能だけではなく、周辺の接続にも注意を払って設計されていました。同じように、Power10プロセッサーでの革新はプロセッサー周りのインターフェースにも見られます。CPU単体の処理性能だけでなく、システム全体として高速な処理を可能にするというPOWERプロセッサーの設計方針がよくわかる部分といえます。

前回の記事 (Power10はPOWER9と何が違うのか〜概要編〜) でも簡単に触れていますが、メモリーへのインターフェースにはOpen Memory Interface (OMI)が採用されています。このインタフェースは、チップあたり16チャネル搭載しており、1TB/s もの帯域幅を実現できる設計となっています。POWER9プロセッサーでは、メモリーの帯域幅が 230GB/s であったので、4倍以上の帯域幅を確保しています。

2.多様なメモリーへの対応

OMIインターフェースは、バンド幅だけでなく複数のメモリー・モジュールに対応できるよう設計されています。既存のDDR4はもちろんですが、DDR5やGDDR DIMM、Storage Class Memory (SCM)にも対応しています。これらすべてをOMIインターフェースでカバーしており、単一のインターフェースで柔軟なメモリーの選択ができるようになっています。初期オファリングでは、ソケットあたり最大4TB OMI DRAMメモリーをサポートする予定となっています。このメモリーは、ピーク帯域が410GB/sとなっています。

OMIはメモリーバッファーを搭載し、メモリーバスをより少ない配線で利用できるように変換をします。その変換のために、MicroChip DDR4 bufferを使用しています。メモリーは通信速度が重要ですが、このバッファーは、Direct AttachのDDR4と比較してもレイテンシーが10ns以下に抑えられています。

その他のメモリーについてもご紹介します。OMI-attached GDDR DIMMは、最大800GB/s という高帯域幅をもち、低コストでパッケージできるメモリーとなっています。OMI-attached Storage class Memory は大容量で暗号化された永続メモリーを提供でき、Power10プロセッサーを搭載するシステムでは、2ペタバイトのロード/ストア メモリーをサポートできます。将来的には、DIMMとの交換によるアップグレードが可能となり、より広帯域かつ大容量のDDR5 OMI DRAMメモリーも使用できる予定です。

3.ペタバイトクラスのメモリー空間を実現

昨今、SAP HANAやDeep Learningなど大容量のメモリーを使用するシステムやアプリケーションが増えてきています。Power10プロセッサーでは、他システムのメモリーを自身のメモリーとしてマッピングする機能を持っています。複数のシステム組み合わせてクラスターを構成可能で、各々のシステムが持つメモリーをシェアできます。このメモリークラスタリングは、Power10プロセッサーのもう一つのインターフェースであるPowerAXON経由で実現します。

低レイテンシーで動かしたいワークロードは自システムのメモリー上で動かす、スピードよりも大容量のメモリーを必要とするワークロードは他システムのメモリーを利用するといった形で、ワークロードの特性に合わせて利用するメモリーを使い分けられるようになります。クラスタリングによって2ペタバイトもの大規模な構成が可能になります。

メモリーのクラスタリングによって、システム構成の柔軟性が増し、最適化が進むと考えられます。1台のサーバーでは構成できなかったようなメモリー空間を使えるようになることで、実現できるワークロードもあるかもしれません。 ワークロードごとに最適なメモリーを割り当てることができます。そうすると、サーバー台数や処理速度の最適化が実現できるでしょう。

Hot Chips資料より

メモリーに見るPower10の可能性

昨今は、デジタル変革と言われるように業務や事業の変革が求められています。今回のPower10プロセッサーは、そのようなところにも貢献できるのではないでしょうか。

Deep Learning、画像認識といったテクノロジーに代表されるように、画像や動画を活用して業務を変えていく、新しい事業を立ち上げることが、ここ数年で多々見られます。

さらに、ストリーミング形式で提供されるサービスがどんどん増えてきています。こういったストリーミングサービスには、遅い、重いといったユーザビリティの低下がマイナスな印象となることはおわかりいただけると思います。
安定して大量のデータをサーバー側で処理しながらユーザーに届けるにはどうすればいいのか、と考えるとインフラの性能が鍵になることは間違いありません。

Power10プロセッサーで「より大きなメモリーをより高速に扱える」ことは大きな意味を持つと感じています。企業の扱うデータは数やサイズは更に増加傾向にあります。さらには、リアルタイムなやり取りを求められています。CPUの処理能力だけではなく、全体を最適化してより高速かつ大規模な処理をするためには、メモリーの進化が必須であるように思えます。

メモリーに特化して今回は調査をしましたが、このPower10プロセッサーが、実際のハードウェアとして登場するときがとても楽しみになりました。果たして、どのような未来を描いてくれるシステムとなるのかワクワクが止まりません。

本記事では、メモリーに着目してPower10プロセッサーを説明しました。POWER9プロセッサーからさらに発展を遂げており、システム全体としての性能向上に繋がっています。次回のブログ記事では、メモリー以外のインターフェースを取り上げてご紹介します。なお、今回ご紹介したメモリー構成はプロセッサーの能力のみを示すものであり、システム製品のオファリングを意味するものではないことをご了解ください。

<連載記事「Power10はPOWER9と何が違うのか」>

現在のIBM Power Systems

POWER9プロセッサー搭載IBM Power Systems

POWER9プロセッサー搭載IBM Power Systems

2021年6月現在、IBM Power SystemsはPOWER9プロセッサーを搭載し、スケールアウト・サーバースケールアップ・サーバー、そして、AIの学習や推論に最適な高速コンピューティング用サーバーを提供しています。また、企業の大規模基幹システムを担うSAP HANA環境の効率的な構築と安定稼働に貢献する認定ハードウェアも提供しております。

IBM Power Systemsが提供するスケーラビリティーはハイブリッドクラウドに最適です。また、災害対策のバックアップ環境や、開発・検証環境構築のためにIBM Power SystemsのLPAR(論理区画)をIBM Cloud経由で従量課金にて活用できるIBM Power Systems Virtual Serverもご利用いただけます。

明確なロードマップのもと、時代が必要とする機能を提供するために確実に進化を続けているIBM POWERプロセッサーとIBM Power Systemsにご期待ください。


関連情報

More IBM Power stories

実用規模のワークロードで量子回路の深さを削減するフラクショナル・ゲート

フラクショナル・ゲートは、実用規模の実験の効率を向上するのに役立つ新しいタイプの量子論理ゲートです。     IBM® は、IBM Quantum Heron™ QPUに新しい種類の量子論理ゲートを導 […]

さらに読む

量子スピン鎖の大規模シミュレーションを行う量子アルゴリズム

Stony Brook大学の研究者は、計算能力の限界を押し進めて実用規模のスピン鎖シミュレーションを可能にするために、さまざまな量子シミュレーション手法を組み合わせて改良しています。   量子計算の起こりがいつ […]

さらに読む

基底状態問題について量子優位性の発見に役立つ評価指標

さまざまな計算手法の基底状態問題を解く能力を評価するのに役立つ指標を定義する論文が、新たに Scienceで発表されました。     量子優位性の発見は、今日の量子計算研究において重要な側面になってい […]

さらに読む