IBM Data and AI

勝者を予測:データとAIを活用した魅力的な洞察を提供して、全米オープンテニスへのファンの関与を促進

記事をシェアする:

全米オープンテニスの公式テクノロジー・パートナーとして、IBM コンサルティングは全米テニス協会 (以降、USTA と記述) と協力しています。そして、AIと自動化を用いて、ファンにとって魅力的な洞察を、テニスのデータから導き出しています。

企業レベルで意思決定を行うCTOであれ、どの試合を見るかを決めるテニス・ファンであれ、AIは人々のデータに対する理解にますます影響を与えるようになっています。そして、IBMは、機械学習のアルゴリズムによって生成された結果と出力を、人々が理解および信頼できるプロセスに従う「説明可能なAI」として、USTAに提供することに取り組んでいます。

このプロセスは、「確かで信頼できるデータ」から始まります。全米オープンテニスの場合、「確かで信頼できるデータ」は様々なソースから生成される、膨大な量の構造化データと非構造化データで構成されています。

  • 男子128名、女子128名の選手のデータ(年齢、身長、体重、ツアー・ランキング、最近の成績など)
  • サーブ方向、リターン・ショットの種類、ラリーの回数、ボールの位置など、大会期間中に取得した700万件のプレイ・ベースのデータ
  • 1億件のニュース記事から抽出した言語と感情

これらのデータを組み合わせて分析して自然言語で統計や分析を提供する方法と、AIの「ブラックボックス」を解消して、外部のメディア・ソースを補完する、信頼可能で説明可能な洞察を提供する方法を見ていきましょう。

全米オープンテニスの公式アプリケーション「US Open Tennis Championships」は、ご利用の環境に合わせてインストールしてください。

IBM Power Indexが、選手の「勢い」を分析する方法

テニスは「勢い」を競うゲームです。試合中、トップ・プレーヤーはこの「勢い」を戦略的に利用します。勝っているときは素早くサーブを打つこともありますし、「サーブ・クロック」を最大にして相手のリズムを崩すこともあります。1セットで「2ブレーク・ダウン」した場合は、次のセットに向けて体力を温存するために、相手に「勢い」を譲ることもあります。このような戦略は、全米オープンテニスのようなグランド・スラムの男子シングルスにおける「5セット・マッチ」で、特に有効です。

しかし、「勢い」は、日ごと、大会ごとに、異なる要素です。勝利が長く続いたり、予選を勝ち抜いた選手が、本戦で予想以上の活躍を見せることがあるのは、まさに「勢い」があるからです。そして、「勢い」が生み出した連勝や逆転劇、番狂わせは、ニュースやメディアに取り上げられ、拡散され、選手の自信を高め、コート・サイドの観衆を活気づけ、試合の結果に影響を与えることがあります。

IBM Power Indexは、全米オープンテニスに向けた選手の「勢い」を定量化したものであり、大会期間中は数値が日々変化します。IBM Power Indexは、52週システムに基づく公式のATPランキングとWTAランキングを補完するものです。

IBM Power Indexは、25以上の要素を取り入れています。選手のパフォーマンス要因には、勝敗率、勝率、順位差、サーフェス(コートの表面)、怪我の状態、出場トーナメント数とレベル、ラウンド進行などが含まれます。そして、これらの要因は、Tennis APIを公開しているSportRadarから統計データを取得するサーバーレス・プログラミング・プラットフォームであるIBM Cloud Functionsによって解釈されます。

IBM Power Indexは、 IBM Watson Discoveryの自然言語処理機能を用いて、メディア・ソースも分析します。選手のパフォーマンスや健康状態に関する感情は、何十万もの信頼できるニュース・ソースから抽出され、業界の専門家とファンの視点から分析されます。

これらの分析から、次のような一連の予測的な洞察が生成されます。

  • 注目選手:IBM Power Indexで、現在のツアー・ランクより、 5ランク上位と判定された選手の大会前のビュー
  • 逆転アラート:下位シードの選手の方が、IBM Power Indexの観点で有利な試合
  • 勝利の可能性:最新のパフォーマンスと専門家のデータを反映して毎日変化する、各選手の勝率モデル

Match Insights with Watsonの背景

Match Insights with Watsonは、IBM Power Indexに加えて、自然言語処理、AI、統計分析を駆使してAIが生成するファクト・シートです。一目でわかるデータを提供し、勝敗予想に影響を与える重要な要素をファンが理解するのに役立ちます。Match Insights with Watsonは、「In the Media」、「By the Numbers」、そして、今年の全英オープンテニスで新たに追加された「Win Factors」の3つのセクションに分かれています。

「In the Media」では、本記事上方のIBM Power Indexが、選手の「勢い」を分析する方法で説明したように、Watson Discoveryを使用して抽出された定性的な選手情報を紹介しています。Match Insights with Watsonで使用するために、抽出された文章は文法的な一貫性とトピックの整合性を評価されます。その後、人間のオペレーターに送られ、レビューと承認が行われます。

「By the Numbers」では、これから行われる試合に関する統計的洞察をファンに提供します。2人の選手の間で最も差別化された統計値を強調することでコントラストを描き、その統計値を自然言語に変換します。

「Win Factors」は、Match Insights with Watsonが提示する内容の根拠を明らかにします。具体的には、IBM Power Indexの評価、このサーフェイスでの勝利記録、対戦記録など上位3つの要素を挙げて、AIモデルの仕組みと選手の勝利を予測する理由を解説しています。「Win Factors」は、機械学習モデルを理解するためのオープンソースのツールキットであるAI Explainability 360で評価されています。

信頼できる説明可能なAIは、テニスのような観客の多いスポーツにおける予測に有効性をもたらします。その一方で、信頼できるAIのためのIBMソリューションは、リスクが高い環境でも採用されています。例えば、Neighborhood Trust Financial Partners(労働者の負債の削減および回避と、貯蓄の実現を支援する非営利の金融サービス・イノベーター)は、AI Explainability 360を使用して、AIアルゴリズムが財務的判断にどのように対応するかについて、透明性と説明可能性を提供しています。

IBMは、さまざまな業界で、データを洞察変換するために、AIを使用しています。例えば、「年間10万件に達する顧客からの問い合わせへのルフトハンザ航空のエージェントの対応」、「ロードアイランド州の公衆衛生に関する意思決定に必要となる情報の提供」、「Citiの監査人が何千時間もの手作業による転記の省略」を支援しています。IBMとともに、企業や組織のデータの可能性を最大限に引き出しましょう。

関連リンク


本記事は「Predicting the winners: How IBM uses data and AI at the US Open to drive insights and fan engagement (written by Stephen Hammer)」を抄訳し、一部編集したものです。

More IBM Data and AI stories

データ・ロードマップ

IBM Data and AI

生成AIによるビジネス革新は、オープンなデータストア、フォーマット、エンジン、製品指向のデータファブリック、データ消費を根本的に改善するためのあらゆるレベルでのAIの導入によって促進されます。 2023 オープン・フォー ...続きを読む


AIロードマップ

IBM Data and AI

自己教師学習された大規模なニューラル・ネットワーク、つまり基盤モデルは、AIの生産性とマルチモーダル機能を倍増します。推論と常識的な知識をサポートする、より一般的な形式のAIが登場します。 2023 基盤モデルが、自然言 ...続きを読む


Netezzaとwatsonx.dataによる生成AIのための新しいデータ統合

Hybrid Data Management, IBM Data and AI, Netezza...

注)以下の記事は英語版ブログ「Unify and share data across Netezza and watsonx.data for new generative AI applications」(2024年6 ...続きを読む