Hybrid Data Management
New Db2 & Db2 Warehouse v11.5.4 The Database with AI, for AI Release !
2020年07月13日
カテゴリー Db2 | Hybrid Data Management | IBM Data and AI
記事をシェアする:
本記事はDb2 Product Manager Roger Bitarのこちらの記事の翻訳となります。
6月30日、IBMはDb2データベースの最新バージョンであるDb2 11.5.4をリリースされました。Db2 11.5リリースでは、Db2でサポートされるエディションの数が簡略化されました。サポートされているエディションの数が3に集約されました。つまり、「アドバンストエディション」、「スタンダードエディション」、および「コミュニティエディション」です。このリリースでは、中小規模のワークロード向けの新しい「ベースエディション」が導入されています。すべてのエディションは、HADR、pureScale、BLUアクセラレーション(カラムナー表)などの同じDb2機能、およびその他の機能を追加コストなしでサポートします。 IBMは、コンプライアンスステータスに影響を与えることなく、新しいエディションへの移行パスを作成しました。レガシーエディションを使用している既存のお客様は、新しいエディションへの移行中に影響を受けません。無料の「コミュニティエディション」から始めて、最初の90日間は他のすべてのエディションを無料で試すことができ、ビジネスに最適なエディションを決定できます。
この新しいリリースには、さらなるパフォーマンス改良、コスト削減、マルチクラウドサポート(OpenShift 4.x対応)、グラフデータベース、空間分析(Geospatial Analytics)、機械学習(In-DB Analytics & Python UDF)、自動ワークロード管理、セキュリティ機能強化、開発者向け機能拡張等、多くの機能強化が含まれています。以下のセクションでは、これらの拡張機能の詳細と、Db2 11.5.4リリースへのアップグレードを検討するメリットについてご紹介します。
1.パフォーマンス向上
さらなるパフォーマンス機能改良には、様々なものが含まれます。Db2 WarehouseやDb2 BLUで利用される列表において、クエリ構造とクエリが最終的に返す結果をを踏まえて事前に重複排除、集計を行うことで複雑なクエリの中で使用するメモリ量を抑えることで複雑なクエリのパフォーマンスを高速化させる機能や、リモートデータソースとのデータ連携機能であるフェデレーションをDb2 Warehouse MPP環境において並列処理で実行できるように拡張されました。さらにデータベース起動時のアクティベートのプロセスが高速化され社内ベンチマーク結果では起動時間は1/30の速度まで短縮化されてきています。パフォーマンス向上の新機能についてはこちらのブログを参照ください。
2.コスト削減
このリリースでは、「Adaptive Workload Manager for Columnar」が導入されています。1秒程度のショートクエリから、いくつものサブクエリで構成された実行時間の長い複雑なクエリまで、さまざまな種類のクエリを使用すると、メモリやCPUなどのシステムリソースをめぐって競合します。このAIベースの機能拡張により、特に非常に大規模な列表データベースでは、クエリのパフォーマンスが何倍も向上します。リソースのチューニングを完全に自動化し、リソースの推定ニーズに基づいてクエリをさらに分類して優先順位を付け、パフォーマンスを最大化することで、DBAの時間と労力を節約します。
オプティマイザーを効率的に活用して複雑なクエリを調整することに多くの時間を費やしたお客様は、新しいDb2リリースにアップグレードすると以前のバージョンで実施したプラン最適化が失われることを避けるため、このDb2 11.5.4リリースでは、アップグレード後でも、以前に使用したオプティマイザ実行プランをロックダウンするオプションが設けられています
Db2 v11.5.4で使用されている新たな圧縮技術は、さらにストレージ使用効率を改善します。これは今までの辞書ベース圧縮で圧縮効果が低かったVARCHAR、VARGRAPHIC、およびVARBINARYに適用されます。新しいページベースの文字列/VARCHAR圧縮アルゴリズムを使用することで、現在と比べて使用されるディスク領域のほぼ50%を節約できます。
3. マルチクラウド & OpenShift v4 サポート対応
Db2 11.5.4では、IBM Cloud Pack for Dataを使用して、クラウドへの移行をこれまで以上にシンプルにしました。同じDb2機能は、顧客のニーズを満たすために多くのフォームファクターで提供されます。プライベートクラウド、ハイブリッドクラウド、パブリッククラウド、ホストされたクラウドまたはマネージドクラウド、またはRedHat OpenShiftプラットフォームのコンテナー化された展開で、ベアメタルまたは仮想化環境のオンプレミスに展開できます。
Db2及びDb2 Warehouseは、IBM Cloud Pack for Dataに完全に統合されたサービスです。 IBM Cloud Pack for Dataは、RedHat OpenShiftを搭載した、当社の最高のハイブリッドクラウドおよびマルチクラウドプラットフォームです。 Cloud Pack for Dataには、物理サーバー、仮想化環境、または任意のクラウドプラットフォームなどのインフラストラクチャレイヤーが含まれています。このレイヤーは、RedHat OpenShiftプラットフォームを使用してKubernetesによって管理されます。次のレイヤーは、オプションでIBMデータサービス、データ仮想化、およびAIプラットフォームとシームレスに統合します。 IBM Cloud Pack for Dataを使用すると、既存のDb2オンプレミスデプロイメントをコンテナ化またはクラウド化する方法が簡単になります。このブログでは、IBM Cloud Pack for Dataの一部としてのDb2について詳しく説明しています。
4.グラフデータベース対応
Db2 11.5.4は、このリリースで初めてグラフエンジンを導入します。グラフデータベースは、エンティティ間の関係として情報を格納し、ノードとエッジを使用してこのデータを表します。グラフデータベースは、詐欺や不正の検出、360度の顧客ビュー分析及びレコメンデーションエンジンにおいて非常に有益です。別個のグラフデータベースのライセンスを取得し、データベース間でデータを絶えず複製するのではなく、Db2グラフはDb2の上でグラフ分析を有効にし、同じデータのコピーでグラフ分析とSQLを実行できるようにすることで、コストと管理負荷を提言します。
Db2 Graph Database Engineは、Db2ですでに定義されている既存の関係を使用して、基になるデータの仮想グラフビューを作成します。または、Db2で既に定義されているテーブルとビューをグラフのノードとエッジにマッピングする方法を定義することにより、独自のグラフモデルを作成できます。 Db2 Graphは、Apache TinkerPopフレームワークを使用してグラフモデルを公開し、Apache Gremlinクエリを実行できるようにします。 Db2 Graphは、クエリの実行時にDb2から必要なデータのみをフェッチするため、Db2のデータに加えられた更新が反映されます。 Db2グラフの詳細については、このブログをご覧ください。
5.地理空間分析エンジン機能拡張
空間分析は、地理的分析の一種であり、位置分析の観点から人間の行動のパターンとその空間的表現を説明しようとします。例には、最近傍分析やティーセンポリゴンが含まれます。空間分析により、さまざまな質問をして、その答えを見つけることができます。企業は、空間分析を使用して、より効率的な販売地域を定義し、輸送または製造コストを最小限に抑えるか、顧客の理解を深めることで、利益を増やすことができます。科学研究者は空間分析を使用してCOVID-19感染をよりよく理解し、疾患の広がりに対するさまざまな影響の影響を予測するためのより良いモデルを開発できます。
Db2 Spatial Extenderは行編成テーブルの空間分析を提供していましたが、このDb2 11.5.4リリースで導入されたSpatial Analyticsにより、行編成テーブルと列編成テーブルの両方で空間分析を実行できるようになりました。これにより、列表をベースにしたDb2 Warehouse/Db2 BLUデータベースに展開される分析ワークロードで空間分析を実行できます。
6.In-Database MLの機能拡張
Db2 11.5.4リリースでは、データベース内の機械学習機能(In-DB ML)が導入されています。 AIとMLを使用すると、データから学習し、パターンを特定し、人間の機能を強化するより賢明な決定を下すことができます。パターンを調べてデータを収集および分析すると、顧客のニーズをよりよく識別し、傾向を明らかにし、競合他社よりも早くイノベーションを起こすことができます。
MLモデルはニューラルネットワークを使用して構築されており、モデルのトレーニングは大規模なデータセットに依存しています。モデルの精度は、ニューラルネットワークの深さとトレーニングデータの量と質に依存します。収集および分析できるデータが多いほど、モデルの精度が高くなります。 Db2及びDb2 Warehouseに蓄積されたデータを外に移動させることなく、DBの中で活用することで、モデルを構築およびトレーニングするための処理、クレンジング、正規化におけるコスト、時間、労力を節約できます。
Db2 11.5.4は、データ準備にかかる作業、いわゆる前処理作業、およびモデルトレーニング作業をサポートし、データサイエンティストがDb2のIn-DB分析機能を活用して、DBの中でデータの準備、トレーニング、およびスコアリングできるようにします。現在、分類と回帰の形で教師あり学習アルゴリズムをサポートしています。分類は詐欺の検出に役立ちますが、回帰は予測と推定に役立ちます。 Db2でのAI / MLの詳細については、このブログをご覧ください。
7.セキュリティ機能拡張
このDb2 11.5.4リリースでは、シングルサインオン(SSO)用のJSON Web Token(JWT)が導入されています。 JWTは、アプリケーション間で情報をJSONオブジェクトとして安全に送信するためのコンパクトで自己完結型の方法を定義しています。この拡張により、JWTトークンを作成できるフロントエンドアプリケーションでユーザーが認証されると、アプリケーションはユーザー固有のトークンを生成し、シングルサインオンを使用してバックエンドで認証するためにDb2に渡すことができます。
このリリースのもう1つのセキュリティ強化は、認証キャッシュです。この機能拡張により、初回のログイン認証情報がキャッシュされ、その後の試行が可能になります。したがって、顧客は、キャッシュされた資格情報を使用することにより、高頻度アプリケーションの認証システムの過負荷を排除できます。これにより、多数のユーザーが同時にDBにアクセスするようなアプリケーションのパフォーマンスが向上につなげることが可能となっています。
8.データサイエンティスト & 開発者向け機能拡張
機械学習セクションで説明されているように、Db2 11.5.4はデータ準備、前処理にかかる作業や予測モデルのトレーニング作業をIn-DBで行うことをサポートしています。これは、Python UDFサポートを介して行われます。 Python UDFを使用すると、Python関数をUDFとして再パッケージ化してDb2に保存できます。必要に応じて、データベースの操作やストアドプロシージャと同様の関数として、Pythonコードを直接呼び出すことができます。
このリリースの新機能は、Db2 RESTサービスのサポートです。これにより、開発者はHTTPメソッドを利用してサービスを呼び出すため、開発の詳細や言語の依存関係を気にすることなく、アプリケーションを構築できます。各開発者定義のサービスは、単一のSQLステートメントに関連付けられています。これで、一連のスケーラブルなRESTful APIを介してDb2と対話するWeb、モバイル、およびクラウドアプリケーションを開発できます。
9.まとめ
Db2 11.5.4リリースでのこれらすべての機能強化により、アップグレードへの関心が高まっています。 Db2グラフやDb2 In-DB ML機能、Python UDFを利用した予測モデルの開発をDb2上で可能とし、コストや運用管理作業を省力化する機能が含まれています。またセキュリティ、空間分析、マルチクラウド、パフォーマンスの向上も実現します。これらの機能強化はすべて、ROIを改善し、ビジネスの成長を助け、顧客と開発者を満足させていきます。
<参考記事>
Upgrade your Db2 database to the 11.5.4 release, save money, and keep your developers and customers happy
Introducing Db2 11.5.4 — The database with AI, for AI
敷居もコストも低い! ふくろう販売管理システムがBIダッシュボード機能搭載
IBM Data and AI, IBM Partner Ecosystem
目次 販売管理システムを知名度で選んではいないか? 電子取引データの保存完全義務化の本当の意味 ふくろう販売管理システムは「JIIMA認証」取得済み AIによる売上予測機能にも選択肢を 「眠っているデータの活用」が企業の ...続きを読む
テクノロジーが向かう先とは〜中長期テクノロジー・ロードマップ
IBM Cloud Blog, IBM Data and AI
IBM テクノロジー・ビジョン・ロードマップ – IBM テクノロジー・アトラスを戦略的・技術的な予測にご活用いただけます – IBM テクノロジー・アトラスとは? IBM テクノロジー・アトラス ...続きを読む
データ・ロードマップ
IBM Data and AI
生成AIによるビジネス革新は、オープンなデータストア、フォーマット、エンジン、製品指向のデータファブリック、データ消費を根本的に改善するためのあらゆるレベルでのAIの導入によって促進されます。 2023 オープン・フォー ...続きを読む