IBM Power
これまでも、これからも、スパコンの技術革新に貢献するIBM Power Systems
2021-06-03
カテゴリー IBM Power
記事をシェアする:
Power10プロセッサー搭載サーバーの年内発表を控えているIBM Power Systems。日本IBMにおけるハイ・パフォーマンス・コンピューティング(以下、「HPC」と記述)の第一人者である大澤 暁が、HPCの歴史に足跡を残したIBM製のスーパーコンピューター(以下、「スパコン」と記述)と、スパコンの技術革新への貢献を続けるIBM Power SystemsとPOWERプロセッサーを紹介します。
大澤 暁
日本アイ・ビー・エム株式会社 テクノロジー事業本部 システムズ・ラボサービス エグゼクティブ・アーキテクト
1987年日本IBMに入社後、並列計算機の基礎研究および開発に従事。その後、日本でスパコン・エリアを初めて拡販するHPC事業推進部の初期メンバーとして、IBM RS/6000 SPを中心としたシステムの販売、構築に携わる。以来、大学や研究機関などにおける大規模システムの多くにかかわり、提案から構築、運用までのお客様支援を実施した。最近は大規模ストレージやソフトウェアなどを含めたシステム・ソリューショニングも推進している。
6月になると、またこの時期がやってきたなと思います。それは、毎年6月(と11月)に、スパコンの世界ランキング「TOP500」が発表されるからです。最近では、昨年第1位となった理化学研究所の「富岳」が記憶に新しいところでしょう。しかし、IBMのPower Systemsも少なからずその栄冠に輝いており、スパコンにおける技術革新に大きく貢献しているのです。本記事では、TOP500を中心にPOWERプロセッサーの歴史を紐解いてみましょう。
TOP500
TOP500は、毎年6月と11月に、ISC (International Supercomputing Conference)およびSC (International Conference for High Performance Computing, Networking, Storage, and Analysis)の開催に合わせて発表されるスパコンのランキングで、2021年6月で第57回目となります。
1993年6月から30年近く、欠かさずに毎年2回発表されており、「すごい」以外の形容詞が見当たりません。記念すべき第1回(1993年6月)の首位は、米国ロス・アラモス国立研究所のThinking Machines Corporation製CM-5で、SPARC RISCプロセッサーが使われていました。CM-5のCMとはConnection Machineの略で、1980年代にマサチューセッツ工科大学で数千の単純なプロセッサーノードを接続した超並列マシンを研究・開発したことから名づけられ、当時は、スパコンの先駆けとして計算科学の分野で反響を呼びました。
TOP500はLinpackというベンチマークの結果数値で競われますが、当時、CM-5は59.7GFlop/sでした。それから28年、現在は500PFlop/s (=500,000,000GFlop/s)を越える競争となっており、ムーアの法則と共に広く知られている半導体の技術革新のみならず、周辺装置やソフトウェアの革新も無視できないでしょう。
ASCI Blue PacificからASCI Whiteへ
IBMがTOP500の上位10位以内に初めて登場したのは1995年11月で、Cornell Theory Center に設置されたIBM RS/6000 SP2 512ノードのシステムでした。その性能は88.4GFlop/sで、この時のTOP500で第8位となりました。SPとはIBMが1991年から推進したScalable POWERparalle の略で、SP2はその第2世代、チップもPOWER2プロセッサーを使用していました。IBMがRISCチップを採用したワークステーションIBM RISC System/6000(RS/6000とも記述します)を導入したのが1990年ですので、わずか5年でスパコン・ランキングの仲間入りを果たしたことになります。
5月6日に当ブログで公開された記事『チェスの世界チャンピオンに勝利したコンピューターはPower Systemsの先祖だった』に掲載された「Deep Blue」は、P2SC (POWER2 Super Chip)が使用されました。POWER2プロセッサーはPOWER1プロセッサーの後継として1993年に投入されましたが、当初8チップ構成であったものをシングル・チップに改良したのがP2SCで、0.29μmの5層CMOSテクノロジー、335mm2のダイ上に約1,500万のトランジスターによって構成されています。シングル・チップなのでP2SCはPOWER2 Single Chipと解釈されることが間々ありましたが、POWER2 Super Chipが正式名称となります。
その後、1995年から米国エネルギー省のASCIプロジェクトが開始され、スパコン競争に拍車がかかるようになりました。その流れを受け、1997年にIntelの「ASCI Red」、1998年にSGIおよびIBMの「ASCI Blue」、その後も2000年と2005年にはIBMの「ASCI White/Purple」と、様々な「色」のシステムが登場しました。
IBMは、PowerPC 604eチップを採用した「ASCI Blue Pacific」をローレンス・リバモア国立研究所に納入し、1998年11月にTOP500では第8位にランクインしました。この「PowerPC」は、シングル・プロセッサーであったPOWERアーキテクチャーの流れをくみ、マルチ・プロセッサーを意図してIBM、Apple、モトローラが連携して開発したチップです。
その後、PowerPCはIBMのワークステーションやスパコンの他にも、AppleのMacintoshや、Wii、PLAYSTATION、Xboxなどのゲーム機にも使われるようになりました。世の中に広くPOWERが知れ渡るようになったのは、この頃ではないでしょうか。ちなみに、PowerPCとは「Performance optimization with enhanced RISC – Performance Computing」の略になりますが、performance optimizationの「Power」に、さらにperformance computingの「PC」かと、ずいぶんと性能に拘るものだと、当時感心した記憶があります。
さて、話を「ASCI Blue Pacific」に戻します。「ASCI Blue Pacific」は、1999年11月と2000年6月の2回とも、「ASCI Red」の2,379GFlop/sに僅差及ばず2,144GFlop/sであり、TOP500の第2位に甘んじました。
一方、POWERプロセッサーの方もPowerPC 604eの流れを継承し、1999年発表のPOWER3プロセッサーからマルチ・プロセッサーを投入し、2000年11月のTOP500では、POWER3-IIを使用したローレンス・リバモア国立研究所の「ASCI White」が4,938GFlop/sとなり、「ASCI Red」を抑えて首位の座を射止めました。「ASCI Red」のプロセッサー数が9,632に対して、「ASCI White」は8,192と少ないにもかかわらず性能が2倍以上となったことから、POWERアーキテクチャーやPOWER3プロセッサーの技術が世の中に認められることになりました。
POWER3-IIは、POWER3の改良版で、0.22μmの6層CMOSテクノロジー、170mm2のダイ上に約2,300万のトランジスターで構成されています。
IBM Blue Geneの登場とSequoia
2002年6月のTOP500では、「ASCI White」の約5倍の性能を持つNECの「地球シミュレータ」が首位になりました。科学技術庁が日本のスパコンをリードするシステムとして位置づけ、地球温暖化や地殻変動といった地球規模でのシミュレーションを行うシステムとして海洋研究開発機構に設置されました。当時のシミュレーションでは行列演算などのいわゆるベクトル計算の比重が大きく、これらを極めて得意とするNECのベクトル型スーパーコンピューターの性能はすさまじく、2004年6月まで5期連続首位をキープしました。
そして、NECに対抗するべく登場したシステムがIBM Blue Geneとなります。IBM Blue GeneはPowerPCの流れをくみ、一つ一つの性能はそれほど高くないプロセッサーを極めて多数搭載する設計となっており、2004年11月にTOP500で第1位となったBlue Gene/Lでは、プロセッサーを32,768個使用し、70.72TFlop/sを達成しました。ローレンス・リバモア国立研究所に設置されたBlue Gene/Lはその後も増強が行われ、2007年11月に212,992プロセッサーで478.2TFlop/sを達成するまでなんと7期連続で栄冠に輝いたのです。
Blue Gene/Lで使用されたチップはPowerPC 440で、多数のプロセッサーを効率よく使用できるように、メモリ以外の部品は一つの集積回路に収めるSoC (System-on-a-Chip)が採用されました。また、プロセッサーのローカル・バスや、様々な構成部品を接続するCoreConnectテクノロジーが発表されました。CoreConnectテクノロジーはロイヤリティ・フリーで、数多くのチップ開発ベンダーなどで使用されることになりました。
Blue Gene/Lは国内外で多くの反響があり、日本国内においても、産業技術総合研究所、高エネルギー加速器研究機構などにご採用いただきました。なお、Blue Geneはそのラック形状にも特徴があり、台形の形状となっています。
当時のスパコンの空冷方式は、ラックの前面または後面から吸気し、反対面に排気する仕組みがほとんどでした。一方、高床式データセンターなどに採用されている空調では、床下からの冷気を効率良く吸気し、高温となった排気を天井に逃がす必要がありありました。IBM Blue Geneが台形のラックとなった背景には、前述した事情があったのです。
従って、Blue Gene本体は前後面吸排気ではなく、横面吸気、反対側の横面排気となっています。まだまだ水冷方式が主流ではなかった時代において、スパコンの冷却方法やそのシステム・デザインにも気を使っていたことが、よくわかります。
この頃から国内でもスパコン開発が活発になり、2011年6月のTOP500では、理化学研究所の「京」が第1位となりました。
そして、2012年6月に、この国産スパコンである「京」から首位の座を奪還したのが、3代目のIBM Blue GeneとなるBlue Gene/Qで構築されたローレンス・リバモア国立研究所の「Sequoia」でした。
「Sequoia」で採用されたBlue Gene/Qは、PowerPC 440の後継となるPowerPC A2がベースであり、1チップで18コアを搭載していました。「Sequoia」は1,572,864コアで16.3PFlop/sを達成し、「京」の10.5PFlop/sを大きく引き離しました。さらに、同時期に第3位にランクインしたアルゴンヌ国立研究所の「Mira」もBlue Gene/Q で構築されました。そして、第7位と第8位もBlue Gene/Qで構築されたスパコンがランクインを果たし、TOP10のうち4つがBlue Gene/Qを採用したスパコンとなりました。これは、業界に大きな衝撃を与える結果となり、スパコン関連ビジネスにかかわっていた小職としても、少なからず誇らしく感じた次第です。
なお、この当時、商用サーバーとしてはPOWER7プロセッサーおよびPOWER7+プロセッサーを採用したIBM Power Systemsを提供しており、日立製作所からはSR16000シリーズが販売されていました。
2009年には、IBMによるBlue Geneの開発貢献に対して、技術的成果を上げた主要なイノベーターに与えられる「アメリカ国家技術賞 (National Medal of Technology and Innovation)」が、当時のアメリカ合衆国オバマ大統領から贈呈されました。
*当時のニュースリリース
百PFlop/s時代の到来とSummit
2012年頃からは各国、各ベンダーや研究機関におけるスパコンの開発競争がさらに白熱し、「Sequoia」も首位の座を維持することは困難でした。特に、中国の技術革新は目覚ましく、2013年6月からなんと5年間もTOP500首位の座を維持したのです。
2017年11月におけるTOP500の第1位は既に93.0PFlop/sと、百PFlop/s時代の幕開けとなっていました。その大台の扉を開けたのがオークリッジ国立研究所に設置された「Summit」です。POWER9プロセッサー搭載システムで構築された「Summit」は、2018年6月のTOP500では2,282,544コアを使用して、122.3PFlop/sを記録しました。
この時点の技術革新としてすぐに思いつくのが、アクセラレーターでしょう。
これまでは、プロセッサー・コアやチップの数を増やすことで性能を稼いできました。現在は、消費電力などの問題から、GPUなどのアクセラレーターを使用することで高性能と低消費電力を両立させることが多くなってきています。POWER9プロセッサーを使用している「Summit」においては、アクセラレーターに2,090,880個のNVIDIA Tesla V100を使用しています。これはとてつもない数のように思われがちですが、上には上がいます。2017年11月のTOP500で第4位となったスパコンでは、アクセラレーターが19,840,000個も使用されていたのです。これはTOP500史上最大のアクセラレーター数になりますが、今後もこの流れは進んでゆくことでしょう。
さて、話を「Summit」に戻します。当時、IBMが設計で力をいれたのは、CPUチップやアクセラレーターの速度を単に早めることだけではありません。メモリーからCPU/アクセラレーターへのデータ供給や、CPU-CPU間、CPU-アクセラレーター間を含むIOバスの性能もバランスよく同等に向上させて、トータルの性能をより良くすることでした。
詳細は割愛しますが、高性能キャッシュ/メモリ・アーキテクチャーと、NVLINK高速バスなどの革新技術を駆使することで、「Summit」は米国エネルギー省のCORALプロジェクトを成功に導きました。同時期に、「Summit」以外にも、ローレンス・リバモア国立研究所に設置された「Sierra」がTOP500の第3位にランクインし、POWER9プロセッサーを搭載するスパコンが初参戦で堂々と金メダルと銅メダルのダブル受賞となりました。その後も、2018年11月から2019年11月までの3期にわたり、「Summit」と「Sierra」が連続で第1位と第2位を独占し、他の追随を許しませんでした。
ちなみに、POWER9チップは、14nmの17層FinFETテクノロジー、約80億のトランジスタで構成されており、POWER9を使用しているサーバーには、いくつかのモデルがあります。
「Summit」で使用されているのはIBM Power System AC922で、Linpackに代表されるHPC、科学技術計算以外にもAI向けサーバーと位置付けられています。上述した革新した技術により、近年のAI時代において従来のワークロード以外でも新しい使用法に対応できるシステムと言えましょう。
このような業界動向に対応するために、「Summit」はTOP500で当初から使用されてきた倍精度演算のLinpackベンチマークに加えて、新たに混合精度演算ベンチマークHPL-AIも実施しています。これはAIアプリケーションの多くが倍精度演算ではなく単精度演算を使用することにより、ある程度精度を犠牲にしても速さを優先する傾向があるためです。このHPL-AIを使用した結果、「Summit」は2019年11月には445PFlop/sを達成しました。これはエクサフロップスの約半分という驚異的な数値と、話題になりました。
Power10の登場、そして、これからも
エクサフロップスと聞くと、知らない人はいないであろう「富岳」が代表的です。「富岳」は、理化学研究所と富士通が開発したエクサ・スケールのスパコンであり、2020年6月のTOP500ランキングで415PFlop/s(「Summit」の3倍の性能)を記録しました。「富岳」の基本設計開始から約7年、この日本の技術力には敬意を表したいと思います。今月下旬に、第57回のTOP500ランキングが発表されますが、今回の第1位も「富岳」であり、この状況はしばらく続くことでしょう。
しかしながら、POWERプロセッサーもさらに進化しています。
2020年のHot Chipsカンファレンスで大きな話題となったPower10プロセッサーは、高性能化・省電力化はもちろんのこと、アクセラレーターを使用することなくMachine Learning/Deep Learningに不可欠な行列演算を高速で実施する機能など、将来にわたって重要となる機能および革新技術を積極的に取り入れています。
Power10プロセッサーの詳細については、5月31日に当ブログで公開された『Power10はPOWER9と何が違うのか〜概要編〜』など、他の記事に譲りたいと思います。今後も、定期的にPower10プロセッサーの情報が発信されますので、是非ともお待ちいただければと思います。
TOP500ランキングが発表される6月。「富岳」という国産スパコンだけでなく、新たなPower10プロセッサーを搭載するシステムに思いを馳せると、次の新しい時代の新しいハードウェアの誕生が予感されて夢が膨らみます。本年中に登場するであろうPower10プロセッサーを搭載するシステムと、過去から現在、そして将来にわたって躍進を続けるPOWERプロセッサーに、皆さんと一緒に期待したいと思います。
現在のIBM Power Systems
2021年6月現在、IBM Power SystemsはPOWER9プロセッサーを搭載し、スケールアウト・サーバー、スケールアップ・サーバー、そして、AIの学習や推論に最適な高速コンピューティング用サーバーを提供しています。また、企業の大規模基幹システムを担うSAP HANA環境の効率的な構築と安定稼働に貢献する認定ハードウェアも提供しております。
IBM Power Systemsが提供するスケーラビリティーはハイブリッドクラウドに最適です。また、災害対策のバックアップ環境や、開発・検証環境構築のためにIBM Power SystemsのLPAR(論理区画)をIBM Cloud経由で従量課金にて活用できるIBM Power Systems Virtual Serverもご利用いただけます。
明確なロードマップのもと、時代が必要とする機能を提供するために確実に進化を続けているIBM POWERプロセッサーとIBM Power Systemsにご期待ください。
関連情報
実用規模のワークロードで量子回路の深さを削減するフラクショナル・ゲート
フラクショナル・ゲートは、実用規模の実験の効率を向上するのに役立つ新しいタイプの量子論理ゲートです。 IBM® は、IBM Quantum Heron™ QPUに新しい種類の量子論理ゲートを導 […]
量子スピン鎖の大規模シミュレーションを行う量子アルゴリズム
Stony Brook大学の研究者は、計算能力の限界を押し進めて実用規模のスピン鎖シミュレーションを可能にするために、さまざまな量子シミュレーション手法を組み合わせて改良しています。 量子計算の起こりがいつ […]
基底状態問題について量子優位性の発見に役立つ評価指標
さまざまな計算手法の基底状態問題を解く能力を評価するのに役立つ指標を定義する論文が、新たに Scienceで発表されました。 量子優位性の発見は、今日の量子計算研究において重要な側面になってい […]