IBM Data and AI
データ・ガバナンスは初めてですか? 始めるための5つのベスト・プラクティス
2020年10月09日
カテゴリー IBM Cloud Blog | IBM Data and AI | IBM Watson Blog
記事をシェアする:
IBMはデータ・ガバナンスのベスト・プラクティスをご利用いただけるようWatson Knowledge Catalog Academyを立ち上げました。
データ・ガバナンスとデータのカタログ化には、さまざまな定義や方法論がありますが、大変な労力がかかることがあります。どこから手をつければよいのでしょうか? データ・ガバナンスのフレームワークを構築するためのベスト・プラクティスとは、どう展開してけばよいのでしょうか? IBM Watson Knowledge Catalog Academy (英語)は、企業データ管理とAIモデルのガバナンス、品質、コラボレーションに関する緊急課題に対応するために作られた新しいリソースです。データ・ガバナンスのフレームワークを構築するためのベスト・プラクティス作成は、急速に変化するビジネス環境によって作業環境を作り直す場合には特に重要です。
企業がオンプレミスからハイブリッドやリモートの勤務形態に移行するにつれて、データ・ガバナンスへの関心は高まりつつあります。従業員が分散環境に接続してデータを共有する場合、強固なデータ・ガバナンスのポリシーと手法があれば、企業が膨大なデータの保護とデータ・プライバシーの課題を克服する上で役立つということがガートナー社の最新の調査によって示されています。
データ・ガバナンスの専門知識について堅固な基盤を築くために、IBMでは以下の5つのポイントをご検討いただくようお勧めしています。
データ・ガバナンスとデータ管理の違い
これらに違いがあるのでしょうか? 答えは「はい」ですが、これらの概念はとても関連性があります。
データ・ガバナンスとは、企業規模でのデータの可用性、関連性、使いやすさ、保全性、セキュリティーの管理を意味します。データ・ガバナンスは、データ・リネージュ(来歴)全体を通してデータの所有者、ビジネス用語、規則、ポリシー、プロセスを定義することにより、企業が組織で保有する知識を管理する上で役立ちます。
データ管理とは、データ・ガバナンスの技術的な実装であり、企業データの定義と管理のための包括的な手法のことです。データ管理のポリシーや手順によって、データの収集と編成が正しく行われるようになります。データのマスク、暗号化、プロファイル作成、定義を行うためのツールや技法の使用もここに含まれます。
情報資産のさまざまなソースとタイプの理解
企業規模の大小に関係なく、企業データを十分に理解していなければ、それらを完全に保護したり使用したりすることはできません。情報資産は1つの単位として定義および管理される一連の情報であり、効率的な理解、共有、保護、使用が可能です。そうした情報資産には、個人情報(PII)、知的財産、財務情報、さらには企業の業務にとってその他の非常に重要な情報などがあります。データがある場所に関係なく、さまざまなデータ・ソースの識別や適切な役割ベースのアクセスも重要です。これらのソースとは、通常リレーショナル・データベースに保管されている従来型の構造化データ・ソースだけでなく、Eメール、ブログ、その他のWebコンテンツのような非構造化データ・ソースも含まれます。
企業の成熟度の測定
企業の強みとニーズを適切に評価するには、データ・ガバナンスの成熟度の状態を把握しなければなりません。データ資産は、スプレッドシート、組織固有の知識、コーディングを使用するよりも、メタデータの取り込み、データ・クラスにポリシーの割り当て、データ品質の評価とスコアリング、データ統合用のツールの活用により、カタログ化されなければなりません。データ・ガバナンスの成熟度の評価が完了したら、チームは企業全体のデータ・ガバナンス機能をどう向上させるか、手段を探っていくことができます。
データ・カタログの能力
統合プラットフォーム上に信頼性の高いエンドツーエンドのソリューションがないために、多くの企業がデータの管理に苦労しています。最新のデータ・カタログは信頼できる唯一の情報源として機能し、企業全体で共有されるすべてのメタデータの編成や管理を可能にして簡単にコラボレーションできるようにします。
「広範囲に分散された多様なデータ資産の検索、インベントリー管理、分析に、企業が苦慮し続けており、データ・カタログの需要は急上昇している。」とガートナー社 (社外リンク)の調査は示しています。AIと機械学習を使用してデータのカタログ化 (英語)を支援することは、データ・ガバナンスのベスト・プラクティス計画の中核機能となり得ます。
堅固なデータ・カタログによって、開発者とデータサイエンティストが企業データを分析したり人工知能(AI)用に準備したりできるようになるだけでなく、大規模な情報の検索と分類、データに隠された価値の発見、データの可視性の向上、データ・ガバナンス・ポリシーの適切な適用も可能になります。
詳細: eBook「最新のデータ・カタログの包括的ガイド (英語、要登録)」をご覧ください。
安定したガバナンス基盤のためのベスト・プラクティス
ビジネス価値を認識して利害関係者間の効率性を高めるには、企業がデータ・ガバナンスとデータ管理の指針をデータ・カタログのエンドツーエンドのプラットフォーム内に統合する方法を理解しなければなりません。これら5つの指針はそれぞれ、企業が強固なガバナンス基盤をどのように構築できるのかを明確に説明しています。企業が基幹業務における効率性の向上とコラボレーションの促進を目指す場合、最初のステップはビジネス定義の意味に焦点を合わせてすぐに実施できるマイルストーンを作成する堅固なビジネス分類法の構築でなければなりません。
エンドツーエンドのビジネス対応基盤を提供するためのベスト・プラクティスの詳細については、「データ・ガバナンス: 最新の機械学習ナレッジ・カタログの重要性 (英語)」をお読みください。
次のステップ
データ・ガバナンス、データのカタログ化、Watson Knowledge Catalogの中核概念に関する理解を継続的に深めていきます。今すぐWKC Academyをご検討ください。
Watson Knowledge Catalogの詳細については、https://www.ibm.com/jp-ja/cloud/watson-knowledge-catalogをご覧ください。
Watson Knowledge Catalogは、IBM Cloud Pak for Dataの基本オファリングに含まれます。この統合データとAIプラットフォームの詳細については、Webページやこちらのレポート(要登録)」をお読みください。
原文:New to data governance? Five best practices to get started (https://www.ibm.com/blogs/journey-to-ai/2020/09/new-to-data-governance-five-best-practices-to-get-started/(英語))
セキュリティー・ロードマップ
IBM Cloud Blog
統合脅威管理、耐量子暗号化、半導体イノベーションにより、分散されているマルチクラウド環境が保護されます。 2023 安全な基盤モデルを活用した統合脅威管理により、価値の高い資産を保護 2023年には、統合された脅威管理と ...続きを読む
量子ロードマップ
IBM Cloud Blog
コンピューティングの未来はクォンタム・セントリックです。 2023 量子コンピューティングの並列化を導入 2023年は、Qiskit Runtimeに並列化を導入し、量子ワークフローの速度が向上する年になります。 お客様 ...続きを読む
ハイブリッドクラウド・ロードマップ
IBM Cloud Blog
コンポーザブルなアプリケーション、サービス、インフラストラクチャーにより、企業は複数のクラウドにまたがるダイナミックで信頼性の高い仮想コンピューティング環境の作成が可能になり、開発と運用をシンプルに行えるようになります。 ...続きを読む