IBM Power

Power10はPOWER9と何が違うのか〜I/O編〜

記事をシェアする:

Power10プロセッサーを搭載したサーバーの発表が間近になってきました。Power10プロセッサーのメモリーについての特徴やその可能性について解説した「Power10はPOWER9と何が違うのか〜メモリー編〜」に続き、本記事では、Power10プロセッサーのI/O編として、外部デバイスとのディスクI/OやネットワークI/OなどがPOWER9と比べてどのくらい性能が良くなったのか、それにより、どのようなメリットがあるのかを、POWER10プロセッサーについて調査と研究をしている阿達 佑太が紹介します。

2021年、Power10プロセッサーを搭載するサーバー・ハードウェアの発表が予定されているIBM Power Systems。今後、IBM Systems Japan Blogでは、POWERプロセッサーとIBM Power Systemsの歴史的な出来事や、Power10プロセッサーの紹介と具体的なユースケースといった内容の記事を毎月公開します。

阿達 佑太

阿達 佑太
日本アイ・ビー・エム株式会社 IBM Lab Services Power Systems Delivery Practice

2015年にIBM入社後、ラボサービス・エンジニアとして、AIXやLinux on Power関連の構築、技術支援を担当。昨年、IBM Power Systems Virtual Serverの東京/大阪リージョンの構築も担当し、現在はそれらを利用したPower Systemsクラウドのデリバリーも推進中。また、IBM社内でPower10プロセッサー研究会のコアメンバーとしても活動中。


1.Storage Class Memory (SCM)の対応

I/O(Input/Output:入出力)といえば、ストレージなどの外部デバイスとのディスクI/Oを想像するのではないでしょうか?Power10では、「Power10はPOWER9と何が違うのか〜メモリー編〜」で紹介されたようにStorage Class Memory(以下、SCM)にも対応しています。ここでは、SCMに対応することで、どのようなメリットがあるのかについて説明します。

コンピューターの主要メモリー階層は一般的に、「CPU」→「メイン・メモリー」→「ストレージ」の3層となっており、 CPUに近づくにつれてアクセス時間が短くなり、ストレージに近づくにつれて容量が大きくなります。昨今の半導体技術の進化により、CPUやメモリーは性能が大幅に向上しています。ストレージなどの補助記憶装置ももちろん進化していますが、それでもCPUやメモリーと比べるとI/O性能差は大きく、ここがボトルネックになっているという事実があります。

これを解消するために考えられた技術がSCMと呼ばれるものになります。SCMはストレージのように不揮発性があり大容量で、メイン・メモリーのようにアクセスが高速であるという技術的特徴を持つ、メイン・メモリーとストレージのメリットを併せ持ったような存在になります。まだまだ開発途上ではあるものの、メイン・メモリーと同じDDR4スロットに搭載可能な他社製品もあり、現在注目されている新技術になります。

このSCMを利用することで、例えばデータベースシステムに大きなメリットをもたらします。従来のデータベースは、補助記憶装置であるストレージへのディスクI/Oがボトルネックになっていましたが、SCMを用いることにより、このストレージへのディスクI/Oがなくなるため、飛躍的に性能が向上されることが期待されます。さらに、電源が切れてもデータが消失しない不揮発性メモリーであるという特性から、常に電源を入れておく必要もなくなり、劇的な消費電力削減も期待できます。

IBMでは温室効果ガス排出量ネット・ゼロの達成も目指しており、クリーンな地球環境の保全にも取り組んでいます。近年の情報化社会の発展により、膨大なデータが使われるようになってきており、このようなデータ処理の増加に伴い、エネルギー消費量も加速度的に増大されることが予想されます。そういった背景から、エネルギー消費量をいかに抑制するかが課題であり、このSCMを利用することにより、ストレージとメモリー間のデータのやりとりがなくなることで、結果的に消費電力を抑えることとなります。この1度のデータ処理による電力消費量は微細なものであるかもしれませんが、24時間365日稼働しているサーバーのデータ処理が積み重なれば、消費量は膨大なものとなります。

この消費電力を抑えることがサステナビリティーの促進に寄与し、ネット・ゼロへ繋がることとなるでしょう。

2.OpenCAPIの継続

OpenCAPI(Coherent Accelerator Processor Interface) とは、CPUと外部アクセラレーター(ASICやFPGAなど)、ストレージと直接接続するための高速プロセッサ拡張バス規格です。

IBMでは最初に「CAPI」として、POWER8プロセッサーに搭載しました。その当時は、IBMが独自に開発した規格であり、NVIDIA社のGPUとFPGAに限定されたものでしたが、その後、CAPIのオープン化を図り、「OpenCAPIコンソーシアム」が設立され、POWER9プロセッサーで初めてOpenCAPI技術を導入した製品を出荷しました。それ以降、様々なベンダーがOpenCAPIの接続デバイスを提供し、Powerプロセッサーのシステムを強化しています。

このOpenCAPIを使用することのメリットとしては、低レイテンシーであるということが挙げられます。もしOpenCAPIではなく、PCI Express経由でデータのI/Oを行なった場合、外部デバイスとメイン・メモリーのメモリー空間が完全に分離されているため、デバイスドライバーを経由して外部デバイスのメモリーがマッピングされたアドレスへ読み書きをする必要があります。この処理によって、レイテンシーが悪化します。一方で、OpenCAPI経由であると、外部デバイスとメイン・メモリーがフラットなメモリー空間でアクセス可能となるため、アプリケーションはメモリーへアクセスするだけで外部デバイスへ直接読み書きができるようになります。その結果として、上記のようなオーバーヘッドがなくなり、レイテンシーが小さくなるというメリットがあります。

また、OpenCAPIでは、先ほど説明したSCMとの接続もサポートされています。このような外部デバイスやSCMとのアクセスのレイテンシーが小さくなることで、最近話題となっている5GやIoT、エッジコンピューティングなどさまざまな分野で有利に働くことが考えられるでしょう。

今回、そのOpenCAPIが引き続きPower10でも搭載されており、さらに高いレベルの性能や機能を提供します。その機能の一つが、Power10で搭載された新技術である「メモリー・インセプション」と呼ばれるものです。この「メモリー・インセプション」技術により、他のシステムのメイン・メモリーを直接共有することができ、ペタバイトクラスのメモリー・クラスタが実現されます。このメモリー・インセプションにOpenCAPIのプロトコルが使われています。

このように、OpenCAPIがPower10にも継続してサポートされることにより、外部アクセラレータとのI/O性能を向上させるだけでなく、メモリー・クラスタリングという新たな技術も可能としております。

OpenCAPIの特長を説明する図

OpenCAPIの特長(Hot Chips資料より)

3.PCIe Gen5への変更

ここではまず、PCIeのこれまでの歴史について説明します。PCIeとはPCI Expressの略称であり、コンピューターの拡張バス、拡張スロットの現在主流となっている接続規格の一つとなります。近年のストレージ等のハードウェアの進化により、インターフェースのデータ帯域が飽和し、せっかくの高性能化を享受できないという課題がありました。そこで、高速データ通信が可能なシリアル転送方式のインターフェースとしてPCIeが注目されてきました。また、PCIeにはレーンと呼ばれる信号線が存在し、上りと下りを合わせて1レーンと数えます。このレーン数に比例して帯域が高速化されるといった特徴もあります。

このPCIeには世代ごとに名称が分かれており、一般的に2世代目をGen2、3世代目をGen3というような呼び方をしています。世代ごとのデータ転送速度(理論値)の違いは以下のようになっております。

  • PCIe Gen1: 1レーンあたりの片方向250 MB/s
  • PCIe Gen2: 1レーンあたりの片方向500 MB/s
  • PCIe Gen3: 1レーンあたりの片方向1 GB/s
  • PCIe Gen4: 1レーンあたりの片方向2 GB/s
  • PCIe Gen5: 1レーンあたりの片方向4 GB/s

Power10は5世代目であるPCIe Gen5インターフェースが搭載されております。Power10に搭載されたPCIe Gen5インターフェースでは、シングル・チップ・モジュールの場合、チップあたり最大32レーンが利用可能(デュアル・チップ・モジュールの場合は最大64レーン)であり、1レーンあたりの片方向で最大4GB/s のデータ転送速度になります。また、POWER9で実装されていたPCIe Gen4と比較して倍の帯域幅を提供します。

このように、転送速度や使用可能な帯域幅が増えることにより、様々な恩恵が受けられます。例えば、大量のデータを処理する必要があるデータ分析、数百から数千の計算ノードで構成されたデータ集約型のワークロードにおいても活躍できるでしょう。さらに、将来5Gの利用拡大が進むことにより、トラフィックI/O
の広帯域化というものは必ず求められることになります。このように、PCIe Gen5を利用することによるメリットは多く挙げれます。

今後、PCIe Gen5を搭載した外部デバイスとの利用も考えられ、I/Oのボトルネックがさらに解消されていくでしょう。

本記事では、I/Oに着目してPower10プロセッサーを説明しました。本記事で紹介したSCM、OpenCAPI、PCIe Gen5への対応によって、Power10プロセッサーはより高いI/O性能を実現できます。この高いI/O性能によって、オンプレミスおよびクラウド・コンピューティングにおける企業の課題を解決するための最適なソリューションを提供します。なお、今回紹介した機能はプロセッサー能力を示すものであり、必ずしもシステム製品のオファリングに含まれるものではないことをご了解ください。IBM の将来の方向性および指針に関するすべての記述は、予告なく変更または撤回する場合があります。 これらは目標および目的を提示するためにのみ使用しています。

<連載記事「Power10はPOWER9と何が違うのか」>

現在のIBM Power Systems

POWER9プロセッサー搭載IBM Power Systems

POWER9プロセッサー搭載IBM Power Systems

2021年8月現在、IBM Power SystemsはPOWER9プロセッサーを搭載し、スケールアウト・サーバースケールアップ・サーバー、そして、AIの学習や推論に最適な高速コンピューティング用サーバーを提供しています。また、企業の大規模基幹システムを担うSAP HANA環境の効率的な構築と安定稼働に貢献する認定ハードウェアも提供しております。

IBM Power Systemsが提供するスケーラビリティーはハイブリッドクラウドに最適です。また、災害対策のバックアップ環境や、開発・検証環境構築のためにIBM Power SystemsのLPAR(論理区画)をIBM Cloud経由で従量課金にて活用できるIBM Power Systems Virtual Serverもご利用いただけます。

明確なロードマップのもと、時代が必要とする機能を提供するために確実に進化を続けているIBM POWERプロセッサーとIBM Power Systemsにご期待ください。


関連情報

More IBM Power stories

実用規模のワークロードで量子回路の深さを削減するフラクショナル・ゲート

フラクショナル・ゲートは、実用規模の実験の効率を向上するのに役立つ新しいタイプの量子論理ゲートです。     IBM® は、IBM Quantum Heron™ QPUに新しい種類の量子論理ゲートを導 […]

さらに読む

量子スピン鎖の大規模シミュレーションを行う量子アルゴリズム

Stony Brook大学の研究者は、計算能力の限界を押し進めて実用規模のスピン鎖シミュレーションを可能にするために、さまざまな量子シミュレーション手法を組み合わせて改良しています。   量子計算の起こりがいつ […]

さらに読む

基底状態問題について量子優位性の発見に役立つ評価指標

さまざまな計算手法の基底状態問題を解く能力を評価するのに役立つ指標を定義する論文が、新たに Scienceで発表されました。     量子優位性の発見は、今日の量子計算研究において重要な側面になってい […]

さらに読む