IBM Power
高速化された計算能力によってAI時代を担うサーバー
2017-12-06
カテゴリー IBM Power
記事をシェアする:
2018年5月8日更新
2018年5月8日、IBM Power System AC922の新モデル 8335-GTXを発表しました。8335-GTXは、32GBまたは16GBのメモリーを搭載する水冷システム設計のNVIDIA Tesla V100 GPUを最大6基、POWER9プロセッサーを2基(合計36コアまたは44コア)搭載。水冷システムとして提供されるAIやディープラーニングに最適化されたサーバーです。
AIやディープラーニングに最適なIT基盤を構築できるサーバーとは
AIやディープラーニングには、大量のデータを高速に処理するITインフラストラクチャーが必須です。さらに、ディープラーニングで大量の学習用データを処理する局面においては、行列演算が得意なGPUの活用は不可欠です。
では、GPUを搭載しているサーバーが用意できれば、AIやディープラーニングのための基盤として万全なのでしょうか。
1台のサーバーに搭載できるGPUの数には上限があるため、ディープラーニングの学習時間を短縮するためには、GPUを搭載する複数のサーバーを接続して大規模化を図る必要があります。また、PCIeによってGPUとCPUが接続されている場合は、GPUを使いこなすためにCPUとの間での転送オーバーヘッドを考慮する必要もあります。必ずしもGPUを搭載してさえいれば良いというわけではないのです。
IBMが2016年9月に発表したIBM Power System S822LC for HPC(通称:IBM Minsky)は、GPUとCPUの高速連携を実現するNVIDIAのNVLinkを搭載することで、オーバーヘッドを気にせずにGPUを利用可能としました。さらに、TensorFlow、Caffee、Chainerといった主要なオープンソースのフレームワークの利用が可能なディープラーニング高速化技術「Distributed Deep Learning」を活用して、数十台のサーバーに搭載された数百基のGPUを駆使してスケーリングすることで、学習時間の大幅な短縮が可能であることを実証しました。具体的には、TensorFlowやCaffeを256 GPUでスケーリングすることで、16日から7時間へとトレーニングの所用時間の短縮を実現しています。
つまり、IBM Power System S822LC for HPCは、AIやディープラーニングのために最適なIT基盤を構築できるサーバーであり、多くのお客様に採用いただいております。
IBM Power Systemsが最新のプロセッサーと次世代の入出力アーキテクチャーを搭載
本日、IBMは、AI時代を担うために進化を遂げた新たなサーバーを発表しました。それが、Accelerated Compute(加速された計算能力)という言葉を冠したIBM Power System AC922です。
IBM Power System AC922は、最新のプロセッサーであるIBM POWER9プロセッサー、NVIDIA Tesla V100 GPU、次世代の入出力アーキテクチャーであるPCIe 4.0、CAPI 2.0、NVLink 2.0などが搭載される超高速サーバーです。
PCIe 3.0でGPUとCPUが接続されるx86プロセッサー・ベースのサーバーとの比較において、IBM Power System AC922は上述した次世代の入出力アーキテクチャーの先進性と優位性により、約5.6倍のデータ転送が行えます。これは、まさに、データセントリック・コンピューティングを具現化したものであり、システム全体の性能を高める上で最大のボトルネックになっている「データの移動」を最小化します。
高速のデータ転送によって、高いデータ・スループットが実現できるため、IBM Power System AC922はパフォーマンス要求が厳しいデータ集約型のワークロードに対応して、優れた性能を発揮します。
また、第二世代となったNVLinkは、CPUメモリーとGPUメモリーをコヒーレンシーを保って接続します。簡単に言い換えれば、NVLink 2.0を介してCPUとGPU間で統一されたメモリーが提供されます。これは、搭載するメモリーがCPUより少ないGPUにとって大きな意味を持ちます。何故ならば、メモリーが不足した場合、GPUは計算が行えなくなるからです。そのため、これまでは、GPUにデータを送る際はバッチサイズの調整が必要でした。しかし、NVLink 2.0を搭載するIBM Power System AC922であれば、CPUメモリーをGPUメモリーとして利用できるため、GPUが搭載するメモリー容量の課題が解消できます。NVLink 2.0によってヘテロジニアス・コンピューティングを実現してAI時代を担うサーバー、それが、IBM Power System AC922なのです。
スーパーコンピューターのビルディング・ブロック
ところで、皆様は、2018年に完成が予定されているスーパーコンピューターである、SummitとSierraをご存知でしょうか?
200ペタフロップスの目標能力を目指すSummitと、125ペタフロップスの目標能力を目指すSierraは、このIBM Power System AC922を用いて構築されます。つまり、IBM Power System AC922は、スーパーコンピューターを構築できる汎用の商用サーバーなのです。
IBM Power System AC922を用いたAIのデプロイメントは効率的かつ容易に行えます。選別され、テストされ、コンパイル済みのディープラーニングのためのバイナリー・ソフトウェアとライブラリーをパッケージ化したディストリビューションであるIBM PowerAIを利用することで、ディープラーニング開発環境の構築が迅速かつ容易となるからです。企業や組織におけるAI活用への取り組みに理想的なサーバーの選択肢として、IBM Power System AC922の採用をご検討いただければ幸いです。
*Bob PiccianoがTHINK Blogに寄稿した『AIを活用した組織変革加速のすすめ』も、ご一読ください。
*製品カタログ(日本語版)のダウンロードは、こちら。
IBM Power System AC922(8335-GTG)
マイクロプロセッサー
POWER9プロセッサー(with NVLink) 16コア × 2
POWER9プロセッサー(with NVLink) 20コア × 2
レベル2(L2)キャッシュ
コアあたり 256KB
レベル3(L3)キャッシュ
コアあたり 5MB
メモリー
最大 1TB
内蔵ストレージ
Small Form Factor(SFF) ドライブ・ベイ × 2
(オプションでNVMe SSDをPCIeスロットでサポート)
内蔵SCSIディスク・ベイ
なし
メディア・ベイ
なし
アダプター・スロット
NVLink対応 NVIDIA Tesla V100 GPUアクセラレーター用 SXM 2.0ソケット × 4
PCIe x16 G4 LPスロット(CAPI使用可能) × 2
PCIe x8 (Shared) G4 LPスロット(Multi-Host Socket Direct 機能サポート、 CAPI使用可能 ) × 1
PCIe x4 G4 LPスロット(CAPI使用不可) × 1
I/Oポート
USB 3.0 × 2
1GB イーサネット × 2
可用性(RAS)機能
プロセッサー命令再試行
オペレーティング・システム
Red Hat Enterprise Linux
電源要件
200V〜240V
サイズ
444.5mm(W) × 88.9mm(H) × 850.9mm(D)
保証
3年間、翌営業日対応 CRU(交換部品の送付)保証サービス (9×5/CRU)
保証サービスのアップグレード、メンテナンスを利用可能
エネルギー消費効率
掲載対象外
エネルギー消費効率とは、エネルギーの使用の合理化に関する法律 (昭和 54 年法律第 49 号、以下「省エネルギー法」という) で定める測定方法により測定された消費電力を、省エネルギー法で定める複合理論性能で除したものです。ただし、複合理論性能が 200,000MTOPS 以上のものについては省エネルギー法対象外装置であり、掲載のエネルギー消費効率は参考値となります。
実用規模のワークロードで量子回路の深さを削減するフラクショナル・ゲート
フラクショナル・ゲートは、実用規模の実験の効率を向上するのに役立つ新しいタイプの量子論理ゲートです。 IBM® は、IBM Quantum Heron™ QPUに新しい種類の量子論理ゲートを導 […]
量子スピン鎖の大規模シミュレーションを行う量子アルゴリズム
Stony Brook大学の研究者は、計算能力の限界を押し進めて実用規模のスピン鎖シミュレーションを可能にするために、さまざまな量子シミュレーション手法を組み合わせて改良しています。 量子計算の起こりがいつ […]
基底状態問題について量子優位性の発見に役立つ評価指標
さまざまな計算手法の基底状態問題を解く能力を評価するのに役立つ指標を定義する論文が、新たに Scienceで発表されました。 量子優位性の発見は、今日の量子計算研究において重要な側面になってい […]