Data Science and AI
watsonx Assistantの変革・新しいアーキテクチャーを徹底紹介
2023年11月08日
カテゴリー Data Science and AI | IBM Data and AI | IBM Watson Blog
記事をシェアする:
〜watsonx Assistantの対話型AIに最適化された新しい基盤モデルは、わずかなトレーニングで優れた結果をもたらします〜
Haode Qi著 2023年8月15日 (読了時間4分)
バーチャル・アシスタントを構築したことがある人なら、適切なトレーニング例を収集するための調査が重要な最初のステップであることを知っているでしょう。これは、顧客に対する正確な応答を保証するために必要なトレーニング例を決定することと、顧客が望むものを求める方法のすべてのバリエーションを考慮するために会話AIが十分に堅牢であることを確認するために必要な数を決定することを含む、時間のかかるプロセスです。
最近まで、正しい判断を下すためには、会話ログやアナリティクス、そして組織全体の何十ものリソースを組み合わせる必要がありました。幸いなことに、watsonx Assistantの新しい基盤モデルとトランスフォーマー・アーキテクチャーは、顧客の期待に見合う顧客体験を提供するために必要だった数時間、数日、数週間を節約することができます。
全く新しいアーキテクチャーの導入
IBMの最新ベータ版アルゴリズムは、業界をリードするランタイム・レイテンシーを維持しながら、旧バージョン比較でわずかな学習データで、平均して同レベルの卓越した精度を実現します。
これは、様々な業界ドメインから500の英語ワークスペースを使用し社内テストした結果からも、以前は約50のトレーニング例を必要とした精度のレベルが、現在では1アクションあたり平均わずか5トレーニング例で達成できるようになったことからも明らかです。
これらの改善の鍵は、トランスフォーマー・アーキテクチャーに基づく新しい基盤モデルにあります。watsonx Assistantアルゴリズムは、この新しいモデルと他の背景リソースを組み合わせ、言語モデルの最新の進歩を活用しています。
ボンネットの下を見てみましょう。
このような利点は、単に既製の基盤モデルにプラグインして野放しにしておけば得られるというものではありません。私たちは、精度を高め、実行時の待ち時間を短縮するテクニックを開発しました。
精度を向上させるために、様々なドメインから収集したデータでモデルを訓練する対照学習を採用しました。同じ意図を持つ文は肯定的なペアとして扱われ、異なる意図を持つ文は否定的なペアとして扱われます。このアプローチにより、モデルは異なる意図のニュアンスをより理解しやすくなり、全体的な精度が向上することになります。
より少ないデータで精度を向上させることは説得力がありましたが、一方で、新しい基盤モデルでは実行速度に課題がありました。もちろん、顧客のリクエストがあってからアシスタントが応答するまでの経過時間は、顧客体験の基本的な要素です。
私たちは、顧客から高い信頼を得ている短いランタイム・レイテンシーを維持する必要がありました。そこでモデルの階層数を減らしながら、同レベルの精度性能を維持するモデル抽出を実施しました。
下図に示す通り、モデル抽出は教師モデルから生徒モデルへ知識を伝達するプロセスを表します。生徒モデルは、同じ入力文が与えられたときに教師モデルの出力を模倣する目的で学習されるため、実行時のパフォーマンスが向上します。これで、精度と実行効率のバランスをとることができるわけです。
さらに、バーチャル・アシスタントと対話する顧客は、さまざまな長さの入力をすることが多いことも認識していました。トランスフォーマー・モデルは、入力の長さに対して2次関数的なランタイム・スケーリングを持っており、2倍の長さの入力は4倍のランタイム・レイテンシーをもたらす可能性があることを意味します。
この問題に対処するために、研究コミュニティーで導入されたトークン・プルーニング(剪定)と呼ばれるアプローチを使用しました。このアプローチは、トランスフォーマー・モデルの注意機構を活用し、文脈に基づいて、ストップワードや句読点などの重要でない単語に低い重みを割り当てることが出来るよう工夫されています。
その結果、長いユーザー入力には重要でないトークンが少なくなり、精度を犠牲にすることなく待ち時間が短縮されます。また、短いユーザー入力を保護するための措置も講じており、プルーニング処理中に重要な情報が失われないようにしているのも特徴です。
新しいアルゴリズムを使い始める準備はできましたか?
現在、watsonx Assistant がサポートする主要な 13 言語すべてについて、ベータ版アルゴリズムが公開されています。新しいバージョンは、アルゴリズム・バージョンページのアクション設定から選択できます。試してみて、ページにある「フィードバックを送信」リンクを使用してフィードバックを共有してください。
結論
適切なトレーニングデータをwatsonx Assistantに取り込むことは、アシスタントの成功と、顧客が信頼できる精度の基本です。しかし、IBMは、モデルのトレーニング技術における重要な進歩を活用し、作業負荷を劇的に軽減しました。このトレーニング技術は、優れた結果とランタイム・レイテンシーへの影響を与えることなく、効果的にモデル自体に改善効果をもたらします。
より多くのユースケースであれ、チャネルであれ、アシスタントを実際に構築する時間が増えました!
詳細については、watsonx Assistantの製品ドキュメントと、以前のアルゴリズム・バージョンの記事を参照してください。
本記事でご紹介している、IBMの対話型AIソリューションのご紹介
本記事は、USブログ「Watson Assistant’s new transformer architecture brings greater accuracy with less effort」を翻訳し再編集したものです。
敷居もコストも低い! ふくろう販売管理システムがBIダッシュボード機能搭載
IBM Data and AI, IBM Partner Ecosystem
目次 販売管理システムを知名度で選んではいないか? 電子取引データの保存完全義務化の本当の意味 ふくろう販売管理システムは「JIIMA認証」取得済み AIによる売上予測機能にも選択肢を 「眠っているデータの活用」が企業の ...続きを読む
テクノロジーが向かう先とは〜中長期テクノロジー・ロードマップ
IBM Cloud Blog, IBM Data and AI
IBM テクノロジー・ビジョン・ロードマップ – IBM テクノロジー・アトラスを戦略的・技術的な予測にご活用いただけます – IBM テクノロジー・アトラスとは? IBM テクノロジー・アトラス ...続きを読む
データ・ロードマップ
IBM Data and AI
生成AIによるビジネス革新は、オープンなデータストア、フォーマット、エンジン、製品指向のデータファブリック、データ消費を根本的に改善するためのあらゆるレベルでのAIの導入によって促進されます。 2023 オープン・フォー ...続きを読む