IBM Systems

データセンター向けにIBMがご提供するソリューションと将来のビジョン

記事をシェアする:

はじめに

本記事では、データセンターを構築・保守運用する際にお使いいただけるIBMのソリューションと将来のビジョンをご紹介します。日本国内に立地するデータセンターの重要性はますます高まっています。IBMは、柔軟かつ堅牢なデータセンターを、ユーザー企業としてのお客様が安心して効率よく活用いただけるよう、また、データセンター事業者が構築・運用いただけるよう、保守運用の効率化や環境対応などに有用なソリューションをご提供して貢献いたします。

背景

国内データセンターの需要が高まっている背景には、AI利用やDXの進展に加えて経済安全保障上のソブリンの要求が強くなっている状況もあります。加えて、インターネットが急成長した2000年前後に構築したデータセンターの老朽化が進み、対応が急務になっているという背景もあります。データセンターの形態は、パブリック・クラウドから、ホスティング・サービス、ハウジング・サービス、そして自社持ちのデータセンターまでさまざまですが、データセンター全般の利点としては、リソースを集約することで電力効率、システム運用や管理の効率化、常に最新の設備を利用しやすいこと、などが挙げられます。

課題

データセンターが満たすべき条件として、物理的な品質、施設の位置の地理的な優位性、セキュリティー品質などがあり、それらを高い水準で満たすことがデータセンター事業者の従来からの課題でした。近年、それらに加えて、高いサステナビリティー水準が求められるようになってきています。また、ITシステムが複雑化して保守運用作業はより難しくなってきていることに加え、人手不足の問題もますます深刻化しています。これらの課題に対処するために、先進技術を活用し、保守運用の生産性を継続的に改善したり、環境負荷を削減したりする行動がデータセンターに求められています。

ソリューション

以下では、ますます難しくなる上述したような課題に、データセンターが対処するためにお使いいただけるIBMのソリューションと、将来のデータセンターに利用できる技術のビジョンをご紹介します。

1.電力効率の良いサーバー

IBMは、省電力・低発熱量のサーバーをご提供することで、データセンターの消費電力削減や設置スペースの削減および空調の最適化に貢献してきました。IBMのメインフレーム製品系列IBM Zの最新機種であるz16では最大構成時の消費電力あたりシステム能力が、前モデルz15と比較して18%、前々モデルz14と比較して54%向上しています[1]。同規模構成のz16とz14を比較した場合には、電力消費量18%、重量31%、設置面積50%以上の削減が可能でデータセンターのサステナビリティー向上に直接的に貢献することができます。実際に、ヨーロッパのお客様の事例では、Oracleデータベースの処理を従来のx86環境では16サーバーで計149コアを用いていたところを、1台の10コアIBM LinuxONEサーバーに集約することができました。LinuxONEはIBM Zのハードウェアを用いたエンタープライズ・グレードのLinuxサーバーです。このサーバー統合によりCO2e(温室効果ガスのCO2換算量)で70%の削減が実現しました。消費電力削減に効果を発揮しているもう一つの技術は、この最新のz16/LinuxONEに搭載されているAIチップです。z16ではプロセッサー(IBM Telum)に統合AIアクセラレーター(AIU)が標準搭載されました。昨今、メインフレーム上で行われる基幹業務においてもAIを活用するタスクが増えてきています。従来はその処理のためにGPUを備えたサーバーをメインフレームとは別に用意し、メインフレームからそちらにデータを送ってAI推論を行わせることもありましたが、このTelumプロセッサー上に通常のCPUと共にオンチップで搭載されたAI推論アクセラレーターを使うことで、別にAI推論サーバーを用意する必要もなくなるのに加えて、呼び出しも含めたAI推論全体にかかる時間の削減も実現します[2]。クレジット・カードの不正検知モデルを使用したテストでは約1ミリ秒のレイテンシーを保ちながら、1日に3,000億回(1秒間に約350万回)の推論を実行できるという結果が得られています。

そして、もう一つのサーバー系列であるIBM Power製品でも、IBMはパフォーマンスとエネルギー効率を向上し続けています。現在最新モデルで使われているPower10プロセッサーでは、7nmの半導体チップを採用することにより、14nmチップを用いた前モデルであるPower9プロセッサーと比較して1.3倍の処理能力と50%の省電力を実現しています。同じ仕事量でのエネルギー消費は、2世代前のPower8プロセッサーと比べて52%、Power9と比べて33%の削減を実現しています。たとえば、あるお客様のユースケースについて、このPower10とRed Hat OpenShiftを利用すれば、既存の125台のx86サーバーを1台のPowerサーバーに集約し、エネルギー消費を79%、ソフトウェアのコストを92%削減できると試算されています。

IBM ZとIBM Powerは、コストの点でも効率的で無駄のない運用が可能です。これらのサーバーには、Capacity-on-demandやDynamic Capacityと呼ばれるソリューションが用意されており、これを利用することによってオンプレミス環境でも、クラウドと同じような分単位の従量課金が適用されます。すなわち、余裕のある容量をプロセッサーおよびメモリに物理的には確保しておきながら、利用していない従量課金部分のリソースについてはコストが発生しません。ひとたび災害対策で待機マシンの使用が必要になった時や、繁忙期のピーク負荷などにおいて需要が一時的に伸びた時だけ、自動的に対応してリソースの配分が行われ、使用したリソースが課金対象となります。こうすることによって、緊急時にもシステムの安定稼働が保たれる一方で、通常時や初期の投資コストの抑制が実現できます。

IBMは将来にわたってもこれらのサーバーへの投資を継続していきます。IBMはサーバー製品開発の中長期的なロードマップを持っており、メインフレーム(IBM Z)についてはすでに3世代のメインフレームのリリースを計画しています。前述したAIチップについては将来的にさらに大幅に省電力化するためにアナログAIチップの研究を進めています[3] [4]。アナログAIチップは、メモリーとプロセッサーを分けた従来のフォン・ノイマン型アーキテクチャーとは全く異なる構造で、ニューラル・ネットワークの計算を行い、例えば約14倍というエネルギー効率の改善を実現できます。また、IBMはこれらのロードマップにおいて、さらに微細化した半導体の採用を予定しています。現行のPower10プロセッサーおよびz16プロセッサーは7nmの半導体を利用していますが、将来のIBMサーバーをひとつの実用先とした技術として、IBMは2021年にナノシート構造を利用して2nmスケール半導体技術を開発した事を発表しました[5]。この技術を利用すれば、Power10やz16で利用している7nmの半導体チップに対してさらに45%高い計算能力、あるいは75%の消費電力削減が実現されることが予想されています。そして、この2nmすらもまだ微細化・高集積化の終着点ではありません。IBMは2nmを超えるサブナノ・レベルの微細化も数年で実現することをすでに見込んでいます[6]。そのような将来に続く技術のためにIBMは継続的な投資とパートナーシップ拡大を進めています。

2.仮想化技術とIBM Vela

言うまでもなく、データセンターの実現と効率的な運用の上で、仮想化技術は欠かすことができません。仮想化にもさまざまなレベルがありますが、共通して言えることは、仮想化技術を用いることでセットアップの簡単化、柔軟で動的なリソース確保とリソースの有効活用、障害復旧の迅速化などの効果が実現しているということです。仮想化技術のひとつであるアプリケーション・コンテナを、大規模分散環境で管理するためのオープンソース・プラットフォームである Kubernetesは、今やクラウド・ネイティブ環境のデファクト・スタンダードとなっています。Red Hat OpenShiftは、Kubernetesに対して継続的インテグレーション/継続的デリバリー(CI/CD)の機能や、企業向けセキュリティー機能、その他のさまざまな管理機能の自動化、サポートを加えて提供している製品です。企業ITにおいてオンプレミスやパブリック・クラウドを含め、複数のIT拠点を連携させるハイブリッドクラウド環境はもはや必然であるという認識が共有されています。

次に、仮想化技術のひとつの応用例として、クラウド・ネイティブなAIスーパーコンピューターであるIBM Velaをご紹介します[7]。これは、基盤モデル、すなわち大規模なAIモデルを学習するために、GPUを備えたスーパーコンピューターです。従来、スーパーコンピューターには、ハイパフォーマンス・コンピューティング(HPC)のための高性能ネットワーク・ハードウェアや並列ファイルシステムなど、クラウドのデータセンターとはまったく違う仕組みを用いたHPC独特のアーキテクチャーが使われるのが通常でした。それに対し、IBMはクラウドの持つ柔軟性や可搬性、そしてユーザーにとっての使いやすさ(生産性)をAI開発用スーパーコンピューターにも導入するために、クラウド・データセンターで用いられる一般的なハードウェアやソフトウェア・スタックの上にスーパーコンピューターで必要とされる機能を実装し、チューニングを行いました。これにより、AIクラスターを柔軟かつダイナミックに拡張し、さまざまな種類のワークロード間でリソースを数分の間にシフトすることが容易になりました。VelaはまだIBM社内での利用にとどめており、お客様にご提供しているものではありませんが、このアーキテクチャーは世界中のどのデータセンターでもどんな規模でも展開できるように設計されており、オンプレミスのAI開発環境の設計に採用することも可能になっています。IBMはこのアーキテクチャーの横展開や、お客様への詳しいご紹介を計画しています。

AIスーパーコンピューターVelaのインフラストラクチャー図
AIスーパーコンピューターVelaのインフラストラクチャー図

3.運用管理におけるAIOpsの利用

近年、ITシステムの保守運用作業が難しくなる傾向にあります。これは背景に、ITシステムの多様性や、データのやりとりを行う接続先やその種類が増えたこと、扱うデータ量やトランザクション数が膨大になっていることがあります。人手不足もあいまって、障害が起きた範囲や原因の特定、復旧作業に以前よりも時間がかかるだけでなく、障害が起きていることの検知にも、これまで以上の効率化・自動化を実現するような新しい仕組みの活用が必須となっています。そこで、重要度を増しているのが、IT運用に各種AI技術を利用する、AIOpsと呼ばれる一連の技術です。その一つとして、IBM Instana Observabilityが提供する可観測性(オブザーバビリティー)向上は、人が指定した対象を監視する従来のモニタリングを超えて、動的に変化する環境で自動的にデータを収集し、複雑に関係するサービス間の依存関係を自動的に把握し、人がとらえきれないシステム挙動を可視化します[8]。IBM Cloud Pak for AIOps with Instana[9]では、そうして収集されたデータをAIを用いて自動解析し、早期に異常を発見、迅速に根本原因を特定して障害時間と影響を削減することができます。これによりインシデントの数を50%に削減できたり、誤アラートを調査するのに浪費される時間を80%削減したりといった効果が事例で報告されています[10]。加えて、IBM TurbonomicによるAIを利用したアプリケーション・リソースの自動的な最適化は、コストの削減だけでなく、アプリケーション・パフォーマンスを確保することによって障害の未然防止にも有効です[11]

今後さらに、生成AIを活用することによって、手作業が必要だった環境のセットアップや運用管理の半自動化・効率化が進んでいきます。Red Hat Ansibleは、大規模で異種混在なサーバー群を扱う組織全体のITプロセスを対象にした構成管理・自動化ツールであり、他の多くの自動化ツールや構成管理ツールと組み合わせ、それらをも活用する自動的なシステム管理を行うことができます[12] [13]。Ansibleを利用するには、基本的にはシステム管理者がYAML形式のAnsible Playbookにその挙動を記述する必要がありますが、2023年5月にIBM watsonxとともに発表し2023年後半に利用可能になることが予定されているRed Hat Ansible Lightspeed with watsonx Code Assistantは、生成AIを使うことでそのPlaybookの作成を支援します[14]。IBM watsonxは、基盤モデルや生成AIを企業が安心して活用するためのAIとデータのプラットフォームであり[15]、IBM watsonx Code Assistantはプログラミング言語を対象とした生成AIの製品群です。Red Hat Ansible Lightspeed with watsonx Code Assistantを用いると、システム管理者が自然言語(英語)で命令を記述すれば、YAML形式のPlaybookのコードが自動的に生成されます。これによってAnsibleユーザーがタスクを作成する負担が軽減されます。

4.テクノロジー・ライフサイクル・サービス

そして、IBMは製品だけでなく、データセンターの設計から、設備工事、移設、保守運用まで含めたサービスも、IBM製品だけでなく多くのマルチベンダー製品(HWとSW)を含めた環境を対象にご提供しています[16]。サービスの種類は以下の表の通りです。

表:DC事業者向け IBM TLS (Technology Lifecycle Service) ご提供サービス
分類 サービス 内容 IBM TLSの貢献価値
基本 設備工事 データセンター施設およびコンピューター機器周辺の、耐震/空調/電源工事や配線敷設など
  • 単なる設備工事だけではなく、移設や保守などとあわせて全体サービスをプロジェクトとして責任ある形でご提供
移設サービス データセンター移設に関する計画策定・移設作業
  • 設備や移設対象のコンピューター機器に精通したIBM技術員による推進
  • 移設に伴う機器障害にも、IBM技術員が即時対応
CE常駐サービス CE(IBM技術員)が、データセンターに常駐
  • IBM技術員が現地にスタンバイし、IBM/他社のコンピューター機器障害へ迅速に対応(24/365も可)
DCエネルギーマネジメント データセンターの電力・CO2排出量の見える化と制御、故障を予兆・予測、エネルギー消費の運用管理を自動化
  • 設備保守と自社の省エネ対策で培った経験
  • AIが実装された次世代エネルギーマネジメントシステム(IBM Maximo)の活用
DCネットワーク設計・導入 主にCisco機器(IBMは世界で6社のCiscoゴールドパートナーの1社)による、DCのネットワークを設計・構築・運用
  • Cisco認定資格保有技術者:70名のスキル集団によるサービス提供
  • IBMはCisco正規保守も提供
拡張

SO的な事業もされている場合(SO=システムアウトソーシング)

マルチベンダー包括保守 SOで取り扱いされている多くのマルチベンダー製品(HWおよびSW)の保守を、正規&第三者保守を組み合わて包括提供
  • IBMの購買力をレバレッジしつつ、お客様の保守管理ワークロードを軽減するとともに、全体保守コストを削減
障害対応窓口の一本化 オンプレシステム/クラウド/マルチベンダー製品の障害へ一元対応 (24/365)
  • ワンストップ対応によるお客様負荷の軽減および障害回復の迅速化、課題管理・対応と報告・再発防止

おわりに

この記事では、省電力化や運用の高度化のために今すぐデータセンターに利用可能なIBMのソリューションを、実際の事例での効果や将来的なビジョンを交えながらご紹介しました。さらに先の技術に関して、2022年11月にIBMは米国ニューヨーク州ハドソンバレー地域での、半導体やメインフレーム、AI、量子コンピューターなどの研究開発や製造に今後10年で200億ドルを投資することを発表しました[17]。日本への投資についても2023年5月に、シカゴ大学と東京大学に量子コンピューターの研究の加速のために10年で1億ドルを拠出することを発表しました[18]。IBMは従来型のコンピューターと、AIチップを用いるようなAI、そして量子コンピューターがひとつに統合された、新しいコンピューター・アーキテクチャーの実現も将来に描いています[19]。長期的には、そのようなアーキテクチャーを、Velaにも利用された仮想化技術やAIOpsによる運用自動化とともにデータセンターにも導入し、システム管理者の負担を軽減しつつ、ユーザーに特殊なスキルがなくても使えるようにするという未来を実現していきます。


参考文献

  1. 加倉井 宏一, 釘井 睦和,「IBMインフラストラクチャーにおけるサステナビリティーへの取り組み」, ProVision Vol.99, 2023年5月24日, https://community.ibm.com/community/user/japan/blogs/provision-ibm1/2023/05/24/vol99-0006-mainframe
  2. 石井 学,「サステナブルなITによるDX推進(第5回) z16によるAIを利用した基幹系処理のイノベーション」, ProVision Vol.98, 2023年1月17日, https://community.ibm.com/community/user/japan/blogs/provision-ibm1/2023/01/17/vol98-0013-mainframe
  3. 「IBM Researchによるディープラーニング推論のための最新アナログAIチップ」, IBMソリューション・ブログ, 2023年8月18日, https://www.ibm.com/blogs/solutions/jp-ja/analog-ai-chip-inference/
  4. 「AIタスクの実行に必要な消費電力を大幅に削減するIBM Researchの最新プロトタイプ・チップ」, IBMソリューション・ブログ, 2023年8月28日, https://www.ibm.com/blogs/solutions/jp-ja/analog-ai-chip-low-power/
  5. 「IBM、世界初の2 nmのチップ・テクノロジーを発表し、半導体における未知の領域を開拓」, IBMニュースリリース, 2021年5月7日, https://jp.newsroom.ibm.com/2021-05-07-IBM-unveils-worlds-first-2-nm-chip-technology-pioneering-unknown-territory-in-semiconductors
  6. 「The path to 1 nanometer chips and beyond」, IBM Research blog, 2022年12月5日, https://research.ibm.com/blog/1nm-chips-vtfet-ruthenium (英語)
  7. 「IBMがクラウド上にAIスーパーコンピューターを構築した理由」, IBMソリューション・ブログ, 2023年6月21日, https://www.ibm.com/blogs/solutions/jp-ja/ai-supercomputer-vela-gpu-cluster/
  8. 「IBM Instana Observability」, https://www.ibm.com/jp-ja/products/instana
  9. 「インテリジェントなIT運用の構築」, https://www.ibm.com/jp-ja/products/cloud-pak-for-watson-aiops
  10. 「Forrester Total Economic Impact of IBM Cloud Pak for Watson AIOps with Instana」, 2021年7月21日, https://community.ibm.com/community/user/aiops/communities/community-home/digestviewer/viewthread?MessageKey=aa421498-117b-4ec4-8ab7-973bb65d8d53&CommunityKey=6e6a9ff2-b532-4fde-8011-92c922b61214 (英語)
  11. 「Turbonomicによるクラウド・コスト削減と最適化」, https://www.ibm.com/jp-ja/products/turbonomic/cloud-optimization
  12. 「Ansibleとは」, 2023年9月27日更新, https://www.redhat.com/ja/technologies/management/ansible/what-is-ansible
  13. 「AnsibleとChef:知っておくべきこと」, 2023年2月15日, https://www.redhat.com/ja/topics/automation/ansible-vs-chef
  14. 「Red Hat、AIを活用したIT自動化のための「Ansible Lightspeed」を発表」, Red Hatプレスリリース, 2023年5月26日, https://www.redhat.com/ja/about/press-releases/red-hat-introduces-ansible-lightspeed-ai-driven-it-automation
  15. 「IBM watsonx」, https://www.ibm.com/jp-ja/watsonx
  16. 「IBM Technology Lifecycle Services」, https://www.ibm.com/jp-ja/services/technology-lifecycle-services
  17. 「IBMとCEOのアービンド・クリシュナ、 米国バイデン大統領をNY州ポキプシーの研究拠点に迎え、ハドソンバレー地域に10年間で200億ドルの投資計画を発表」, IBMニュースリリース, 2022年10月11日, https://jp.newsroom.ibm.com/2022-10-11-IBM-and-CEO-Arvind-Krishna-Welcome-President-Biden-to-Poughkeepsie-Site,-Company-Plans-to-Invest-20-billion-in-the-Hudson-Valley-Region-Over-10-Years
  18. 「IBM、10万量子ビットを搭載した「量子を中心としたスーパーコンピューター」向け新技術の開発に向け、世界の大学と1億ドルの投資に基づくパートナーシップを締結」, IBMニュースリリース, 2023年5月21日, https://jp.newsroom.ibm.com/2023-05-21-IBM-Launches-100-Million-Partnership-with-Global-Universities-to-Develop-Novel-Technologies-Towards-a-100,000-Qubit-Quantum-Centric-Supercomputer
  19. 「半導体、量子、AIなどの先端テクノロジーの研究開発と社会実装」, ProVision, Vol. 99, https://community.ibm.com/community/user/japan/blogs/provision-ibm1/2023/07/04/vol99-0008-ibm
More IBM Systems stories

IBM Z 移行の勘所 – お役立ちブログ情報編

IBM Z をご愛顧いただいているお客様、また IBM Z の導入、展開、移行に際しお世話になっておりますビジネスパートナー向けに、このたび、IBM Systems Japan Blog に IBM Z 移行に関するお役 […]

さらに読む

IBM Power プロセッサー搭載サーバーの、省エネ法に基づく、エネルギー消費効率

2024年5月16日更新:IBM Power S1012のエネルギー消費効率を追加しました。 当記事では、IBM Power プロセッサーを搭載するサーバー製品の、「エネルギーの使用の合理化等に関する法律」(以下省エネ法 […]

さらに読む

IBM Power Salonのご案内〜毎月第2水曜日9時開催〜

6月よりPower Salonページはお引越しします! 新しいページはこちら 「IBM Power Salon」それは、IBM Powerユーザーのための自由な語り場 日本IBMは、「IBM Power Salon」を2 […]

さらに読む