IBM Research

ラボの枠を超えて:IBMリサーチ、企業のためにAIの進歩のパイプラインを強化

記事をシェアする:

AIによる自然言語処理には、技術的にまだまだ多くの課題があります。文法や綴りなどの言語的なルールは必ずしも規則的であるわけではなく、言語が異なれば、ルールも異なります。また、ある程度ルールがわかりやすい言語においても、地域や年代など様々な要因で異なっていたり、あいまいな表現も伴うこともあります。

自然言語処理(NLP)システムが自然言語を習得するには、新しい文章の一般化と推論の両方を行い、文脈を理解して、異なる単語間の関係を認識する必要があります。
IBMはNLPテクノロジーにおけるリーダーであり、これによりコンピューター・システムは感情、方言、抑揚、および人間の言語のその他の側面を分析、理解できるようになります。IBMリサーチは、文書理解のためのWatson Discovery、バーチャル・エージェント向けのWatson Assistant、高度な評判分析を実現するWatson Natural Language Understandingなど、IBMが市場に送り込んだNLP機能の多くの開発に貢献しています。また、IBMリサーチは、企業が契約書のような複雑なビジネス文書内の情報を認識および抽出できるようにするためにIBMがリリースを予定しているテクノロジーの開発にも関わっています。

NLPに対するIBMリサーチの貢献は、自社のオファリングのみにとどまりません。私たちは、大規模な研究コミュニティが利用できる、質問応答、タスク指向型対話、および文章要約といった分野における主要な言語理解のベンチマークの開発において貢献しています。私たちは自社の組織外の研究者に積極的にデータ・セットを提供しており、当社のデータ・セットはオープン・ドメイン・データによく見られるより汎用的なベンチマークとは対照的に、企業が直面している現実的な課題を表すものとなっています。

1つの例として、当社のTechQAデータ・セットにはトレーニング用に600、開発用に310、および評価用に490の質問/応答のペアが含まれています。これらはユーザーによって提起され、ITサポート分野の専門家により回答された実際の質問です。質問と応答はどちらも長く、中央値は35文字です。これに対して現在のリーダーボードで通常見られる中央値は12文字しかありません。私たちは、IBM DeveloperおよびIBM developerWorksフォーラムで公開されたIBM Technote(特定の技術的問題を解決する技術文書)に承認済みの回答が載せられた質問を収集することで、このデータ・セットを作成しました。

IBM リサーチのProject Debaterは、最新のNLPをさらに前進させる上で重要な役割を果たしています。2018年の6月に、当社は史上初のAIと人間のライブ公開討論を行って、Project Debaterを世界にデビューさせました。多くの人にとって、そのパフォーマンスは驚くべきものでした。というのは、私たちはAIがすばやく事実に基づく討論を構築し、反論を考慮し、反証する、そしてそのすべてを私たちが毎日話すのと同じ自然言語で行うことが可能であることを実証したからです。私たちがお披露目に立ち会ったProject Debaterは、堅牢な自然言語処理(NLP)機能をあらゆるビジネスに提供するための取り組みにおける次の一歩に過ぎませんが、それは非常に重要な一歩であると言えます。

IBMがProject Debater向けに開発されたNLP機能のWatsonへの統合を開始するという本日の発表によって、IBMリサーチはまたもやラボの独自のテクノロジーを企業に提供することになります。

今後数カ月で、Watson Discovery、Watson Assistant、およびWatson Core Servicesを使用するIBMのお客様は、高度な評判分析、新しい要約機能、高度なトピック・クラスタリング、およびビジネス文書内の要素のカスタマイズ可能な分類を初めて活用できるようになります。例えば、新しい高度な評判分析機能によって、Watson APIは慣用句(「up in the air『有頂天になる』」など)や、日常会話で用いられる口語表現を識別および分析できるようになります。

私たちの目標は、それが弁護士の公判準備を支援することであれ、オンライン・フォーラムにおける市民談話をさらに促進することであれ、投資戦略を支持または弱体化する財政的な事実を特定することであれ、IBM Watsonのお客様にProject DebaterのNLP機能を日々の課題に適用する能力を提供することです。

Project Debater at CambridgeケンブリッジでのProject Debater

Project Debater at CambridgeケンブリッジでのProject Debater


 
Project Debaterの機能を開発するに際し、私たちは、公開デモンストレーションを通じて、この技術が徐々に成熟してきたことを立証しました。2019年1月のCESカンファレンスにおいて、私たちはProject DebaterのSpeech-by-Crowdの意思決定サポート機能を紹介しました。次の月には、サンフランシスコの2019 THINKカンファレンスにて、IBMリサーチはProject Debaterの2回目のライブ・ディベートを開催し、その成長するスキルセットをディベート・チャンピオンのハリシュ・ナタラジャン(Harish Natarajan)氏に対してテストしました。11月には世界最古のディベート・ソサエティであるケンブリッジ・ユニオンにおいて、Project Debaterは傍聴人によって提出された意見を提供することによって、対戦する2つのディベート・チームを補強しました。このことは改めて、テクノロジーがどのように人間と共に働き、そしてどのように支援できるかを明確に示すものとなりました。

将来を見据えて、当社の研究者たちはProject Debaterの中核となるNLP機能の開発を続け、このテクノロジーの機能を改善していきます。例えば優れた議論を確立し、特定の論点について賛成または反対の立場で論じるための関連性の高い情報を正確に特定する能力などです。IBMリサーチのAIチームのNLP戦略は、自然言語の習得のすべての要素である、理解・分類・検索・および生成に焦点を当てた飛躍的な進歩によって、今後もWatsonをはじめとするIBMのAIの戦略をサポートしていきます。

「The Debater」を見る

Project Debaterのメイキング映像である「The Debater」のトレーラーをご覧ください。未知の領域にAIをあえて持ち込んだ選りすぐりの研究者チームのレンズを通して見た、貴重な舞台裏のシーンです。コペンハーゲン国際ドキュメンタリー映画祭の公式セレクション作品。

 
※この記事は米国時間2020年3月11日に掲載したブログ(英語)の抄訳です。

More IBM Research stories
2019年11月21日

気象応用AIアプリケーション開発の勘所——技術者目線のランドスケープ

著者:藤尾 昇平 日本IBM、東京ラボラトリー、ストラテジー&オペレーションズ所属。 入社後、大和研究所に配属、メインフレーム用端末やThinkPadのハードウェア開発に従事。なかでも設計応用・高周波利用のための電磁解析 […]

さらに読む

2019年10月18日

AIプロセッサーの動向とそのソフトウェアの将来を予測

著者:小原 盛幹 IBM東京基礎研究所、コマーシャル・システムズ担当、IBMアカデミー会員、TEC-J バイスプレジデント 現在「AI Hardware Ecosystem」のIBM Research グローバル・リーダ […]

さらに読む

2019年9月1日

なぜ第一生命は「AI活用」に踏み込んだのか?コンタクトセンターの“大改革”の舞台裏

このエントリーをはてなブックマークに追加 第一生命は、コールセンターの業務改善に向けてIBM Watsonを採用。AIコンタクトセンター支援システムを導入した事例と将来の展望について語ります。 ※この記事は2019年8月 […]

さらに読む