IBM Power

高速化された計算能力によってAI時代を担うサーバー

記事をシェアする:


2018年5月8日更新

2018年5月8日、IBM Power System AC922の新モデル 8335-GTXを発表しました。8335-GTXは、32GBまたは16GBのメモリーを搭載する水冷システム設計のNVIDIA Tesla V100 GPUを最大6基POWER9プロセッサーを2基(合計36コアまたは44コア)搭載。水冷システムとして提供されるAIやディープラーニングに最適化されたサーバーです。

製品発表レター:IBM Power System AC922 (8335-GTX) サーバーは、水冷システム設計の NVLink GPU 採用の Tesla V100 を最大 6 個搭載して、洞察獲得までの時間短縮のために加速された画期的な AI、HPDA、および HPC パフォーマンスを活用できるように支援します


AIやディープラーニングに最適なIT基盤を構築できるサーバーとは

AIやディープラーニングには、大量のデータを高速に処理するITインフラストラクチャーが必須です。さらに、ディープラーニングで大量の学習用データを処理する局面においては、行列演算が得意なGPUの活用は不可欠です。

では、GPUを搭載しているサーバーが用意できれば、AIやディープラーニングのための基盤として万全なのでしょうか。

1台のサーバーに搭載できるGPUの数には上限があるため、ディープラーニングの学習時間を短縮するためには、GPUを搭載する複数のサーバーを接続して大規模化を図る必要があります。また、PCIeによってGPUとCPUが接続されている場合は、GPUを使いこなすためにCPUとの間での転送オーバーヘッドを考慮する必要もあります。必ずしもGPUを搭載してさえいれば良いというわけではないのです。

IBMが2016年9月に発表したIBM Power System S822LC for HPC(通称:IBM Minsky)は、GPUとCPUの高速連携を実現するNVIDIAのNVLinkを搭載することで、オーバーヘッドを気にせずにGPUを利用可能としました。さらに、TensorFlow、Caffee、Chainerといった主要なオープンソースのフレームワークの利用が可能なディープラーニング高速化技術「Distributed Deep Learning」を活用して、数十台のサーバーに搭載された数百基のGPUを駆使してスケーリングすることで、学習時間の大幅な短縮が可能であることを実証しました。具体的には、TensorFlowやCaffeを256 GPUでスケーリングすることで、16日から7時間へとトレーニングの所用時間の短縮を実現しています。

つまり、IBM Power System S822LC for HPCは、AIやディープラーニングのために最適なIT基盤を構築できるサーバーであり、多くのお客様に採用いただいております。

IBM Power Systemsが最新のプロセッサーと次世代の入出力アーキテクチャーを搭載

本日、IBMは、AI時代を担うために進化を遂げた新たなサーバーを発表しました。それが、Accelerated Compute(加速された計算能力)という言葉を冠したIBM Power System AC922です。

IBM Power System AC922は、最新のプロセッサーであるIBM POWER9プロセッサー、NVIDIA Tesla V100 GPU、次世代の入出力アーキテクチャーであるPCIe 4.0、CAPI 2.0、NVLink 2.0などが搭載される超高速サーバーです。

PCIe 3.0でGPUとCPUが接続されるx86プロセッサー・ベースのサーバーとの比較において、IBM Power System AC922は上述した次世代の入出力アーキテクチャーの先進性と優位性により、約5.6倍のデータ転送が行えます。これは、まさに、データセントリック・コンピューティングを具現化したものであり、システム全体の性能を高める上で最大のボトルネックになっている「データの移動」を最小化します。

高速のデータ転送によって、高いデータ・スループットが実現できるため、IBM Power System AC922はパフォーマンス要求が厳しいデータ集約型のワークロードに対応して、優れた性能を発揮します。

また、第二世代となったNVLinkは、CPUメモリーとGPUメモリーをコヒーレンシーを保って接続します。簡単に言い換えれば、NVLink 2.0を介してCPUとGPU間で統一されたメモリーが提供されます。これは、搭載するメモリーがCPUより少ないGPUにとって大きな意味を持ちます。何故ならば、メモリーが不足した場合、GPUは計算が行えなくなるからです。そのため、これまでは、GPUにデータを送る際はバッチサイズの調整が必要でした。しかし、NVLink 2.0を搭載するIBM Power System AC922であれば、CPUメモリーをGPUメモリーとして利用できるため、GPUが搭載するメモリー容量の課題が解消できます。NVLink 2.0によってヘテロジニアス・コンピューティングを実現してAI時代を担うサーバー、それが、IBM Power System AC922なのです。

スーパーコンピューターのビルディング・ブロック

ところで、皆様は、2018年に完成が予定されているスーパーコンピューターである、SummitとSierraをご存知でしょうか?

200ペタフロップスの目標能力を目指すSummitと、125ペタフロップスの目標能力を目指すSierraは、このIBM Power System AC922を用いて構築されます。つまり、IBM Power System AC922は、スーパーコンピューターを構築できる汎用の商用サーバーなのです。

IBM Power System AC922を用いたAIのデプロイメントは効率的かつ容易に行えます。選別され、テストされ、コンパイル済みのディープラーニングのためのバイナリー・ソフトウェアとライブラリーをパッケージ化したディストリビューションであるIBM PowerAIを利用することで、ディープラーニング開発環境の構築が迅速かつ容易となるからです。企業や組織におけるAI活用への取り組みに理想的なサーバーの選択肢として、IBM Power System AC922の採用をご検討いただければ幸いです。

*Bob PiccianoがTHINK Blogに寄稿した『AIを活用した組織変革加速のすすめ』も、ご一読ください。

*製品カタログ(日本語版)のダウンロードは、こちら


IBM Power System AC922(8335-GTG)

マイクロプロセッサー
POWER9プロセッサー(with NVLink) 16コア × 2
POWER9プロセッサー(with NVLink) 20コア × 2
レベル2(L2)キャッシュ
コアあたり 256KB
レベル3(L3)キャッシュ
コアあたり 5MB
メモリー
最大 1TB
内蔵ストレージ
Small Form Factor(SFF) ドライブ・ベイ × 2
(オプションでNVMe SSDをPCIeスロットでサポート)
内蔵SCSIディスク・ベイ
なし
メディア・ベイ
なし
アダプター・スロット
NVLink対応 NVIDIA Tesla V100 GPUアクセラレーター用 SXM 2.0ソケット × 4
PCIe x16 G4 LPスロット(CAPI使用可能) × 2
PCIe x8 (Shared) G4 LPスロット(Multi-Host Socket Direct 機能サポート、 CAPI使用可能 ) × 1
PCIe x4 G4 LPスロット(CAPI使用不可) × 1
I/Oポート
USB 3.0 × 2
1GB イーサネット × 2
可用性(RAS)機能
プロセッサー命令再試行
オペレーティング・システム
Red Hat Enterprise Linux
電源要件
200V〜240V
サイズ
444.5mm(W) × 88.9mm(H) × 850.9mm(D)
保証
3年間、翌営業日対応 CRU(交換部品の送付)保証サービス (9×5/CRU)
保証サービスのアップグレード、メンテナンスを利用可能
エネルギー消費効率
掲載対象外
エネルギー消費効率とは、エネルギーの使用の合理化に関する法律 (昭和 54 年法律第 49 号、以下「省エネルギー法」という) で定める測定方法により測定された消費電力を、省エネルギー法で定める複合理論性能で除したものです。ただし、複合理論性能が 200,000MTOPS 以上のものについては省エネルギー法対象外装置であり、掲載のエネルギー消費効率は参考値となります。


More IBM Power stories

IBM Z 移行の勘所 – お役立ちブログ情報編

IBM Z をご愛顧いただいているお客様、また IBM Z の導入、展開、移行に際しお世話になっておりますビジネスパートナー向けに、このたび、IBM Systems Japan Blog に IBM Z 移行に関するお役 […]

さらに読む

量子中心のスーパーコンピューターに必要なサーキット・カッティングを可能にするダイナミック・サーキット

Natureに掲載された新しい論文は、一つの量子プロセッサーでは実行不可能なサイズの量子回路を、二つの量子プロセッサーを接続して実行できることを世界で初めて示しました。 今日、世界で最も強力な古典的スーパーコンピューター […]

さらに読む

2年前に設定したチャレンジを達成した IBM Quantum

今回が初回となる IBM Quantum Developer Conferenceで、IBMはアルゴリズム探索を容易にする高性能な量子コンピューターと使いやすい量子ソフトウェアを発表しました。 IBM®は 2年前に、量子 […]

さらに読む