発表情報 / 重要情報
IBM Telumプロセッサー:IBM ZとIBM LinuxONE用の次世代マイクロプロセッサー
2021-08-26
カテゴリー IBM LinuxONE | IBM Z | 発表情報 / 重要情報
記事をシェアする:
今日のデジタル経済において、データは、価値を獲得するための膨大な機会を提供します。しかし、企業のトランザクション・データからリアルタイムに洞察を抽出する取り組みは、実現が難しいものとなる可能性があります。データの存在する基盤とは別のシステムで推論ソリューションを稼働させる場合、膨大な量のトランザクション・データを基にディープラーニング・モデルを実行することは困難です。なぜなら、レスポンスタイムへの影響を考慮する必要があるアプリケーションの場合は、レイテンシー、可変性、セキュリティー上の観点や懸念から、それが現実的ではない可能性があるからです。そして、IBMは、このような課題に、ハードウェアとマイクロプロセッサーの設計における最新の革新を通じて取り組んでいます。
本日、IBMは、マイクロプロセッサーに関する技術シンポジウムである「Hot Chips 33」にて、IBM Telumプロセッサーを発表しました。IBM Telumプロセッサーは、次世代のIBM ZとIBM LinuxONEのCPUチップになります。このIBM Telumプロセッサーは、大規模なトランザクションの実行中にリアルタイムかつ大規模なのAI推論を可能とするものであるため、不正行為の予防措置をリアルタイムで実現することを願う企業や組織に歓迎されています。
7nmのマイクロ・プロセッサーであるIBM Telumプロセッサーは、レスポンスタイムを犠牲にすることなく、大量のトランザクションやワークロードのデータからAIベースの洞察を獲得できる設計です。これは、AI推論専用の新しいオンチップ・アクセラレーターを使用することで実現しており、トランザクション・ワークロードに直接組み込まれたリアルタイムAIを可能にします。具体的には、以下のような、パフォーマンス、セキュリティー、可用性の向上をもたらします。
- マイクロプロセッサーには、5GHz以上のクロック周波数で動作する8つのプロセッサー・コアが含まれており、各コアは新たに設計し直した32MBのプライベート・レベル2キャッシュによってサポートされています。レベル2キャッシュは相互に作用して、256MBの仮想的なレベル3と2GBのレベル4キャッシュを形成します。プロセッサー・コア自体の改善に加え、現行のIBM z15プロセッサーに比べてコアあたりのキャッシュを1.5倍に増加させることで、スレッドごとのパフォーマンスと総容量の両方において大幅な向上を実現する設計です。IBM Telumプロセッサーが実現するパフォーマンスの向上は、複雑なトランザクション・システムにおける迅速なレスポンスタイム、特にリアルタイムAI推論で強化する場合には不可欠です。
- IBM Telumプロセッサーは、メイン・メモリーの透過的な暗号化によるセキュリティー上の大幅な革新も特長です。IBM Hyper Protected Virtual Serversと信頼できる実行環境のパフォーマンスと使いやすさを向上させる設計であるため、ハイブリッドクラウド・アーキテクチャーにおいて機密データを処理するための最適な選択肢となります。
- 現行のIBM z15プロセッサーは、99.99999%の可用性をIBM ZとLinuxONEにおいて実現する設計でした。IBM Telumプロセッサーは、新たに設計された8チャネルのメモリー・インターフェイスを含む主要な革新により、チャネルまたはDIMMの障害に耐えられ、可用性をさらに向上する設計です。その結果、レスポンスタイムに影響を与えることなく、透過的にデータを回復します。
IBM Zプロセッサーには、暗号化、圧縮、ソートなどの一般的なタスクのパフォーマンスを向上させる設計の専用のアクセラレーターを組み込んできた歴史があります。IBM Telumプロセッサーの場合は、チップあたり6TFLOP(テラフロップス)を超える計算能力を提供する統合AIアクセラレータを追加します。すべてのコアがこのアクセラレータにアクセスできるため、全体の計算能力をダイナミックに活用することで、推論の待ち時間を最小限に抑えられます。キャッシュに直接接続する集中型のアクセラレーターにより、IBM Telumプロセッサーは、レスポンスタイムへの影響を考慮する必要があるワークロードに対して、非常に低いレイテンシーの推論を可能にする設計です。そして、AIアクセラレーションは、最大200TFLOPの計画されたシステムサポートにより、最も要求の厳しいワークロード要件に対応してスケールアップする設計でもあります。
推論ソリューションの利用にあたり、データを他システムに出さずにIBM Zに保持できることは、レイテンシーの観点でもデータ保護の観点でもメリットとなります。IBM Telumプロセッサーは、レスポンスタイムへの影響を考慮する必要があるトランザクションにAIを埋め込むために、一貫した低レイテンシーを提供します。これにより、顧客はAI推論の結果を活用して、トランザクションが完了する前にトランザクションの結果をより適切に制御できるようになります。たとえば、清算および決済アプリケーションのリスク軽減にAIを活用して、どの取引またはトランザクションが価格変動リスクにさらされている可能性が高いかを予測し、効率的な決済プロセスのソリューションを提案します。疑わしいトランザクションの迅速な修復は、顧客がコストのかかる結果に直面したり、ビジネスへの悪影響を防ぐことに役立ちます。
たとえば、ある国際銀行は、IBM Zとは別のプラットフォーム上の推論ソリューションを使用する代わりに、クレジットカード認証プロセスの一部としてIBM Z上でAIを使用しています。その結果、銀行はクレジットカード取引の承認処理中に不正を検出できるのです。この国際銀行は、将来的には、複雑なディープラーニングAIモデルを活用しながら、ミリ秒未満のレスポンスタイムを達成することを目指しています。その一方で、1秒あたり最大100,000トランザクションをスコアリングするために必要となるスケールとスループットを維持しています。顧客は、すべてのトランザクションの不正を検査するために、待ち時間がミリ秒からさらに短くなることと、信頼性が高く一貫性のある推論応答時間を望んでいます。IBM Telumプロセッサーは「トランザクション・ワークロードとAIワークロードを組み合わせた大規模な実行」という、特に困難な要件の充足と達成に役立つ設計です。
今日のITランドスケープでは、データだけでなく、データを活用して最大限の洞察を得る方法も重要です。このため、AIの利用方法を知り、AIをサポートするインフラストラクチャーを準備することが、コンピューティングの新しい標準になりました。将来に備えるための最初のステップは、IBM Telumプロセッサーから始まります。
関連情報:ニュースリリース『IBM、オンチップによるAI処理の高速化を実現する次世代チップを発表』
本記事は「IBM Telum Processor: the next-gen microprocessor for IBM Z and IBM LinuxONE(written by Christian Jacobi and Elpida Tzortzatos)」を抄訳し、一部編集したものです。
IBM Z 移行の勘所 – お役立ちブログ情報編
IBM Z をご愛顧いただいているお客様、また IBM Z の導入、展開、移行に際しお世話になっておりますビジネスパートナー向けに、このたび、IBM Systems Japan Blog に IBM Z 移行に関するお役 […]
2024年に60周年を迎えるもの
毎年、様々な周年が話題になります。調べてみると、2024年に周年を迎えるものは、列挙はしませんが多種多様です。その中で、日本にとって象徴的と言えるのは、たぶん、開業60周年を迎える東海道新幹線ではないかと思います。 東名 […]
IBM System/360 Special Calendar Wallpaper for 2024
The year 2024 is the 60th anniversary of the announcement of IBM System/360. I have already created the IBM Ma […]