DataOps

IBM Cloud Pak for Dataが企業のDataOpsを加速し、ビジネスの俊敏性とコスト削減を両立してリスクを軽減する

記事をシェアする:

今日のビジネスでは、信頼性の高いデータをほぼリアルタイムで活用できるようにすることが求められています。その背景にあるのは、事実に基づく円滑な意思決定プロセスに対する強いニーズです。そこで、事業継続性を最優先に考えるリーダーの間で現在、注目を集めているデータ活用手法が「DataOps(データオプス)」です。これは、データのソースとユーザーの間に信頼できるデータ・パイプラインを構築することにより、重要なビジネス目標に応じて信頼性の高いデータを迅速に提供するアプローチです。

IBM Cloud Pak for Dataは、DataOpsの加速に向けて、全ての重要なクラウドとデータ、AIによる自動化機能を統合し、任意のクラウド上でマルチクラウドのオープンなデータ/AIプラットフォームをベースにしたマイクロサービスとしてコンテナ化します。調査会社のForrester Research社が最近公開したレポート『Total Economic Impact of IBM Cloud Pak for Data(IBM Cloud Pak for Dataがビジネスにもたらす効果)』で報告されているように、最新のCloud Pak for Dataはユーザーがデータを理解して信頼し、活用しやすくするとともに、リスクとコスト負担を65~85%軽減するように設計されています。

 

データを理解する

IBM Watson Knowledge CatalogとIBM Watson Knowledge Catalog InstaScan for Cloud Pak for Dataは、データの発見と品質およびガバナンス管理の自動化にかかる時間を90%短縮します。
正しいデータ・オンボーディングの第一歩は、データをビジネスの言葉で定義して理解しやすくすることです。データ・オンボーディングを迅速化することで、下流工程におけるデータ操作や活用のためのデータ・パイプラインを加速することができます。例えば、IBM Global Chief Data Officeでは、AI主導の自動データ・カタログ作成システムを活用して、複数のビジネス・プロジェクトでデータ・オンボーディングのスピード化を実現。それにより、これまで数十年間、手作業で行ってきたデータ・カタログ作成のボトルネックを解消し、2,700万ドルのコストを削減しました。

AI主導のデータ・カタログ化とメタデータ管理により、データの一貫した定義とルールに基づいて組織や業界のことを把握できるようになります。これにより、DataOpsの実践においてビジネス価値を高めるためにデータを活用可能となるのです。Watson Knowledge Catalogの機能強化とWatson Knowledge Catalog InstaScan for Cloud Pak for Dataの登場により、ビジネス・アナリストは構造化データや非構造化データについてスピーディに理解できるようになり、コンプライアンスの取り組みも効率化されます。

Watson Knowledge Catalog InstaScanはクラウド・ストレージのBoxと緊密に統合されており、リモートワークやモバイル・ワークをサポートし、クラウド上のコンテンツに関するガバナンスおよびセキュリティー管理を自動化します。これは、BoxやGoogle Drive、マイクロソフトのサービスにおけるコンテンツ管理など、主要なクラウドにおいてデータ・フットプリントをサポートする上でも役立ちます。

 

データを信頼する

IBM Master Data Connect for Cloud Pak for Dataは、信頼性が確保されたマスター・データへのアクセスの可用性を高め、市場投入までの時間を75%短縮します。
企業が自社データのマスターを作成する主な理由は、さまざまなアプリケーションの中でサイロ化し、あるいは重複しているエンティティーについて、信頼できる一元的なビューを得るとともに、エンティティー間の関係性や階層を見通すためです。

IBM Master Data Connectは、Cloud Pak for Dataのスケーラブルで高性能なマイクロサービス・アーキテクチャーをベースにしており、マスター・データに対する極めて高速で可用性の高い読み取り専用アクセスを提供し、アプリケーションやユーザーに最も近いデータ・センター内の該当データに容易にアクセスできるようにします。これにより、顧客や製品、取引についてより深く理解したユーザーが、マスター・データの高速検索やクエリーを実行することが可能となります。そのことが、新たな収益源の創出やデータ管理コストの削減につながり、最終的な収益に貢献するのです。

IBM Master Data Connect for Cloud Pak for Dataを使用することで、企業は消費者や消費者向けアプリケーションをミッション・クリティカルなデータから切り離し、プロジェクトの展開を加速することができます。また、顧客向けアプリケーションでマスター・データを正確かつ最新の状態に保ち、顧客体験を高めることも可能です。IBM Master Data Connectは、すでにご利用中のIBM Master Data Managementや、今年リリースされたIBM Master Data Management Extended Service for Cloud Pak for Dataと組み合わせて使うことができます。

 

データを活用する

IBM InfoSphere Virtual Data Pipeline for Cloud Pak for Dataは、本番データベースと待機系データベースのストレージ・コストを削減します。
IT部門の悩みの1つは、多くの場合、データ・サイエンティストが行うデータ分析などの処理が、収益の源泉である本番システムのパフォーマンスを低下させてしまうことです。IBM Virtual Data Pipeline(VDP)は、本番システムのパフォーマンスを低下させることなく、本番データのクローンを作成します。このクローンは常に最新の状態に保たれるため、Cloud Pak for Dataプラットフォームにデータを供給したり、データ仮想化のソースにしたりすることができます。

また、VDPは個人情報へのロール・ベースのアクセス制御によってセキュリティーとアクセス管理を強化するほか、データ分析チームが業務プロセスやシステムのパフォーマンスに影響を及ぼすことなく、最新のデータにほぼ瞬時にアクセスできるようにします。IBM VDP for Cloud Pak for Dataは、業務ユーザーやデータ分析チームが必要とするときに、運用中のシステムに影響を与えることなく大規模なアクセスを行うことを可能にします。

さらに、アプリケーションや運用担当者、データ分析担当者が大量のデータにリアルタイムにアクセスする必要がある場合、IBM DataStage for Cloud Pak for Dataはデータを迅速に取り込み、ハンド・コーディングと比べて9倍高速な自動ジョブ生成機能によってジョブを構成し、アプリケーションやユーザーにリアルタイムにデータを供給します。自動ジョブ生成機能は、さまざまなソースやターゲット(z/OS、SAPなど)からの高品質なデータの取り込みと、ジョブ生成の自動化やベスト・プラクティスの確立を支援します。

加えて、DataStage on Cloud Pak for Dataを使用すれば、高速に自動生成したジョブを高性能かつ低レイテンシーの並列エンジン上で実行することも可能です。このエンジンは、Google、Amazon Web Services(AWS)、IBM、Microsoft Azureなど各種クラウド・プラットフォーム上のリアルタイム分析エンジンにデータを供給するために、1時間あたり数百万件のレコードを低レイテンシーで発行することができます。

 

学びは続く

IBMは、今後もDataOps機能への投資を続け、規範的な方法論とAI/機械学習ベースのテクノロジー、およびIBM DataOps Center of Excellenceにより、お客様のDataOps実践の旅をご支援します。お客様は、IBMのDataOps Center of Excellenceのサポートの下、ビジネス目標を基にカスタマイズされたアプローチを開発し、市場の変化に応じて適切なパイロット・プロジェクトを行いながら、価値創出を加速させることができます。

Cloud Pak for Dataと、同ソリューションがもたらす86~158%の予想投資対効果の詳細については、Forrester Research社のレポート『Total Economic Impact of IBM Cloud Pak for Data』をご覧ください。


この投稿は、2020年5月5日に、米国 IBM Cloud Blog に掲載されたブログ (英語)の抄訳です。

More DataOps stories

データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む


データ分析者達の教訓 #21- 異常検知には異常を識別する「データと対象への理解」が必要

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

皆さんこんにちは。IBMの宮園です。IBM Data&AIでデータサイエンスTech Salesをしています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、デー ...続きを読む


【予約開始】「SPSS秋のユーザーイベント2024」が11月27日にオンサイト開催

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  本年6月800名を超える方々にオンライン参加いただいたSPSS春のユーザーイベントに続き、『秋のSPSSユーザーイベント』を11月27日に雅叙園東京ホテルにて現地開催する運びとなりました。 このイベントは ...続きを読む