IBM Watson Blog
Discovery の最大限の活用
2022年07月08日
カテゴリー IBM Cloud Blog | IBM Data and AI | IBM Watson Blog
記事をシェアする:
本ブログ記事は、IBM Cloud Docs の「Getting the most from Discovery」ページ を翻訳したものです。最新情報は、https://cloud.ibm.com/docs/discovery-data?topic=discovery-data-version-choose をご参照ください。
Discovery が再設計され、新規機能とソリューション構築のよりシンプルな方法が追加されました。
この再設計された製品は、Discovery v2 と呼ばれます。IBM Cloud 上にプラス・プラン、エンタープライズ・プラン、またはプレミアム・プランのインスタンスを作成すると、Discovery の新しい改善されたバージョンが利用できるようになります。Discovery v2 は、IBM Cloud Pak for Data 上でインスタンスをインストールし、プロビジョンすることでもデプロイされます。
Discovery v1 は、IBM Cloud 上でライト・プランまたは拡張プランのインスタンスを作成するとプロビジョンされます。
最新バージョンを使用するメリット
Discovery v2 は、以下の機能と拡張を提供します。
- 単一の環境内で多くのさまざまなユースケースをサポートする、プロジェクト・ベースのエクスペリエンス
- ビジネス・ユーザーが独自のドメインの言語を理解するプロジェクトを構築できるよう支援する、辞書、パターン、および分類器を追加するための組み込みのカスタマイズ・ツール
- 場所を問わずに価値あるデータに素早くアクセスできる、主要データ・ソースへのコネクター
- ヒューマン・リーダブルな文書 (PDF など) の構造から学習する、Smart Document Understanding
- 対象が絞られた答えを検索して見つけるために機械学習で最適化された、すべての文書タイプに対応する自然言語照会
- 答え検索、キュレーション、表の検索などの高度な検索機能
- 法的な契約の検索と解釈に役立つ、すぐに使用できる契約の理解の機能 (英語のみ)
- 非構造化テキストの詳細な分析に使用できる、フル機能のコンテンツ・マイニング・アプリケーション
- カスタム・アプリケーションのデプロイを支援する、カスタマイズ可能なユーザー・インターフェース・コンポーネント
v1 と v2 の機能比較
Discovery v1に慣れている方は、Discovery v2 がv1と比べてどう違うかこちらで詳細をご覧ください。
Discovery v2 は、これまで使用できなかった新たな機能を提供します。以下の表は、現時点での両バージョンの対応機能について説明しています。
機能 | 再設計された 製品 (v2) |
以前の バージョン (v1) |
|
プロジェクトを使用した作業の編成
|
✔️
|
||
Smart Document Understanding (SDU) を使用した文書の注釈付け
|
✔️
|
✔️
|
|
直感的なユーザー・インターフェースのツールを活用したドメイン固有の成果物 (辞書やカスタムの機械学習モデルなど) の追加
|
✔️
|
||
コンテンツ・マイニング・プロジェクト・タイプを作成し、組み込みのコンテンツ・マイニング・アプリケーションを使用した詳細なデータ分析の実行 (IBM Cloud Pak for Data プラン、エンタープライズ・プラン、およびプレミアム・プランのみ)
|
✔️
|
||
分析 API を使用したリアルタイムでの NLP の実行 (IBM Cloud Pak for Data プランおよびエンタープライズ・プランのみ)
|
✔️
|
||
必要な労力を削減しながら同様の効果をもたらすことができる、事前にトレーニングされた Smart Document Understanding モデルのコレクションへの適用
|
✔️
|
|
|
スキャンされた文書やその他イメージからのテキストの処理
|
✔️
|
✔️
|
|
表からの意味の抽出
|
✔️
|
||
契約からの洞察の取得 (IBM Cloud Pak for Data プラン、エンタープライズ・プラン、およびプレミアム・プランのみ)
|
✔️
|
||
データへの品詞 (Parts of Speech) エンリッチメントの適用
|
✔️
|
||
エンティティー抽出、センチメント分析、およびキーワード抽出の各エンリッチメントの使用
|
✔️
|
✔️
|
|
Natural Language Understanding サービスで利用できるようになった、カテゴリー分類、概念のタグ付け、関係抽出、感情分析、意味役割分析のエンリッチメントの使用
|
✔️
|
||
データへの Watson Knowledge Studio NLP モデルの適用
|
✔️
|
✔️
|
|
データベース、ファイル・システム、FileNet P8、および HCL Notes を含めた IBM Cloud Pak for Data デプロイメントでのより多くのコネクターのサポート
|
✔️
|
||
IBM Cloud Pak for Data デプロイメントでの一部のコネクターの文書レベルのセキュリティーのサポート
|
✔️
|
||
Watson Discovery News コレクションを使用した事前にエンリッチされたデータの活用
|
✔️
|
||
外部データ・ソースのクロールのプログラマチックな構成
|
✔️
|
||
取り込みの正規化プロセスの文書タイプ別の構成。文書セグメンテーション、HTML ファイルの包含ルールまたは除外ルール、JSON 正規化などの構成オプション
|
✔️
|
||
トークン化辞書の構成
|
✔️
|
||
FAQ の抽出 (ベータ) や正確な回答などの質問と答えの強化された機能
|
✔️
|
||
Discovery 照会言語 (DQL) API のサポート
|
✔️
|
✔️
|
|
文書からのパッセージの取り出し
|
✔️
|
✔️
|
|
照会結果を改善するための関連性トレーニングの実行
|
✔️
|
✔️
|
|
Continuous Relevancy Training の構成
|
✔️
|
||
表の検索
|
✔️
|
||
照会結果の重複排除
|
✔️
|
||
照会結果での文書類似性の特定
|
✔️
|
||
照会でのプリファレンス (bias) の指定
|
✔️
|
||
照会ロギングとメトリックの確認
|
✔️
|
||
対応する機能の詳細
上限の詳細
プランごとの成果物の上限について詳しくは、各機能の資料を参照してください。
- Advanced rules model limits
- Classifier limits
- Collection limits
- Dictionary limits
- Document limits
- Machine Learning model limits
- Pattern limits
- Project limits
- Query limits
- Regular expression limits
- SDU limits
次の制限は、コンテント・マイニング・プロジェクトにのみ適用されます。
利用しているプラン・タイプの上限と使用量の現在のステータスは、いつでも「プランの上限と使用量 (Plan limits and usage)」ページから確認できます。
- 製品ページの上部から、ユーザー・アイコン をクリックします。
「使用量 (Usage)」セクションに短いサマリーが表示されます。
- すべて表示 (View all)」をクリックして、プランの制限カテゴリーのすべての使用量の情報を確認します。
ページを離れるには、Web ブラウザーの戻るボタンまたは「マイ・プロジェクト (My Projects)」タブをクリックします。
原文:IBM Cloud Docs – Getting the most from Discovery (https://www.ibm.com/cloud/blog/announcements/price-increase-for-db2-warehouse-on-cloud-plans-on-ibm-cloud)
敷居もコストも低い! ふくろう販売管理システムがBIダッシュボード機能搭載
IBM Data and AI, IBM Partner Ecosystem
目次 販売管理システムを知名度で選んではいないか? 電子取引データの保存完全義務化の本当の意味 ふくろう販売管理システムは「JIIMA認証」取得済み AIによる売上予測機能にも選択肢を 「眠っているデータの活用」が企業の ...続きを読む
セキュリティー・ロードマップ
IBM Cloud Blog
統合脅威管理、耐量子暗号化、半導体イノベーションにより、分散されているマルチクラウド環境が保護されます。 2023 安全な基盤モデルを活用した統合脅威管理により、価値の高い資産を保護 2023年には、統合された脅威管理と ...続きを読む
量子ロードマップ
IBM Cloud Blog
コンピューティングの未来はクォンタム・セントリックです。 2023 量子コンピューティングの並列化を導入 2023年は、Qiskit Runtimeに並列化を導入し、量子ワークフローの速度が向上する年になります。 お客様 ...続きを読む