Data Science and AI

watsonx Assistantの変革・新しいアーキテクチャーを徹底紹介

記事をシェアする:

〜watsonx Assistantの対話型AIに最適化された新しい基盤モデルは、わずかなトレーニングで優れた結果をもたらします〜

Haode Qi著 2023年8月15日 (読了時間4分)

Waston Assistant AI機能イメージ図

バーチャル・アシスタントを構築したことがある人なら、適切なトレーニング例を収集するための調査が重要な最初のステップであることを知っているでしょう。これは、顧客に対する正確な応答を保証するために必要なトレーニング例を決定することと、顧客が望むものを求める方法のすべてのバリエーションを考慮するために会話AIが十分に堅牢であることを確認するために必要な数を決定することを含む、時間のかかるプロセスです。

最近まで、正しい判断を下すためには、会話ログやアナリティクス、そして組織全体の何十ものリソースを組み合わせる必要がありました。幸いなことに、watsonx Assistantの新しい基盤モデルとトランスフォーマー・アーキテクチャーは、顧客の期待に見合う顧客体験を提供するために必要だった数時間、数日、数週間を節約することができます。

watson assistant操作画面キャプチャ

トレーニングのスタートは、最初のアクション作成時

全く新しいアーキテクチャーの導入

IBMの最新ベータ版アルゴリズムは、業界をリードするランタイム・レイテンシーを維持しながら、旧バージョン比較でわずかな学習データで、平均して同レベルの卓越した精度を実現します。

これは、様々な業界ドメインから500の英語ワークスペースを使用し社内テストした結果からも、以前は約50のトレーニング例を必要とした精度のレベルが、現在では1アクションあたり平均わずか5トレーニング例で達成できるようになったことからも明らかです。

異なる業界やユースケースに焦点を当てた数百のワークスペースのベンチマークから得られた測定値

「複数業界、ユースケースに焦点を当てた数百のワークスペースのベンチマーク測定値グラフ」

 

これらの改善の鍵は、トランスフォーマー・アーキテクチャーに基づく新しい基盤モデルにあります。watsonx Assistantアルゴリズムは、この新しいモデルと他の背景リソースを組み合わせ、言語モデルの最新の進歩を活用しています。

 

ボンネットの下を見てみましょう。

このような利点は、単に既製の基盤モデルにプラグインして野放しにしておけば得られるというものではありません。私たちは、精度を高め、実行時の待ち時間を短縮するテクニックを開発しました。

精度を向上させるために、様々なドメインから収集したデータでモデルを訓練する対照学習を採用しました。同じ意図を持つ文は肯定的なペアとして扱われ、異なる意図を持つ文は否定的なペアとして扱われます。このアプローチにより、モデルは異なる意図のニュアンスをより理解しやすくなり、全体的な精度が向上することになります。

Watson Assistantの学習模試図

「フライトのキャンセルをしたいのですが」と 「フライトのキャンセルをする」は肯定的な正のペアとして扱われ、同じフレーズはトレーニング中に 「搭乗手続きをする」と否定的な負のペアとして扱われる

 

より少ないデータで精度を向上させることは説得力がありましたが、一方で、新しい基盤モデルでは実行速度に課題がありました。もちろん、顧客のリクエストがあってからアシスタントが応答するまでの経過時間は、顧客体験の基本的な要素です。

私たちは、顧客から高い信頼を得ている短いランタイム・レイテンシーを維持する必要がありました。そこでモデルの階層数を減らしながら、同レベルの精度性能を維持するモデル抽出を実施しました。

下図に示す通り、モデル抽出は教師モデルから生徒モデルへ知識を伝達するプロセスを表します。生徒モデルは、同じ入力文が与えられたときに教師モデルの出力を模倣する目的で学習されるため、実行時のパフォーマンスが向上します。これで、精度と実行効率のバランスをとることができるわけです。

watson assistant学習モデルの模式図2

生徒モデルは、トレーニング中に「フライトをキャンセルしたい」という同じ入力を与えられたときに、教師モデルと同じようなベクトルを生成するように学習する

 

さらに、バーチャル・アシスタントと対話する顧客は、さまざまな長さの入力をすることが多いことも認識していました。トランスフォーマー・モデルは、入力の長さに対して2次関数的なランタイム・スケーリングを持っており、2倍の長さの入力は4倍のランタイム・レイテンシーをもたらす可能性があることを意味します。

この問題に対処するために、研究コミュニティーで導入されたトークン・プルーニング(剪定)と呼ばれるアプローチを使用しました。このアプローチは、トランスフォーマー・モデルの注意機構を活用し、文脈に基づいて、ストップワードや句読点などの重要でない単語に低い重みを割り当てることが出来るよう工夫されています。

その結果、長いユーザー入力には重要でないトークンが少なくなり、精度を犠牲にすることなく待ち時間が短縮されます。また、短いユーザー入力を保護するための措置も講じており、プルーニング処理中に重要な情報が失われないようにしているのも特徴です。

トークン選別の図

“Hi”、カンマ、”to “のようなトークンは重要度が低いため、トークン・プルーニング時に削除される

新しいアルゴリズムを使い始める準備はできましたか?

現在、watsonx Assistant がサポートする主要な 13 言語すべてについて、ベータ版アルゴリズムが公開されています。新しいバージョンは、アルゴリズム・バージョンページのアクション設定から選択できます。試してみて、ページにある「フィードバックを送信」リンクを使用してフィードバックを共有してください。

Watson Assistantグローバル設定画面

この変更は、お使いのwatsonx Assistantのグローバル設定画面から行うことができます。

結論

適切なトレーニングデータをwatsonx Assistantに取り込むことは、アシスタントの成功と、顧客が信頼できる精度の基本です。しかし、IBMは、モデルのトレーニング技術における重要な進歩を活用し、作業負荷を劇的に軽減しました。このトレーニング技術は、優れた結果とランタイム・レイテンシーへの影響を与えることなく、効果的にモデル自体に改善効果をもたらします。

より多くのユースケースであれ、チャネルであれ、アシスタントを実際に構築する時間が増えました!

詳細については、watsonx Assistantの製品ドキュメントと、以前のアルゴリズム・バージョンの記事を参照してください。


本記事でご紹介している、IBMの対話型AIソリューションのご紹介


 

本記事は、USブログ「Watson Assistant’s new transformer architecture brings greater accuracy with less effort」を翻訳し再編集したものです。

More Data Science and AI stories

ジェネレートするAI。クリエートする人類 。 | Think Lab Tokyo 宇宙の旅(THE TRIP)

IBM Data and AI, IBM Partner Ecosystem, IBM Sustainability Software

その日、船長ジェフ・ミルズと副船長COSMIC LAB(コズミック・ラブ)は、新宿・歌舞伎町にいた。「THE TRIP -Enter The Black Hole-」(以下、「THE TRIP」)と名付けられた13度目の ...続きを読む


イノベーションを起こす方法をイノベーションしなければならない(From IBVレポート「エコシステムとオープン・イノベーション」より)

Client Engineering, IBM Data and AI, IBM Partner Ecosystem

不確実性が増し、変化が絶え間なく続く時代には「イノベーション疲れ」に陥るリスクがある。誰もがイノベーションを起こしていると主張するならば、結局、誰もイノベーション(革新的なこと)を起こしてなどいないことになるだろう 当記 ...続きを読む