SPSS Modeler ヒモトク
データ分析者達の教訓 #16- ステークホルダーの高い期待を使命感と創意工夫で乗り越えろ
2024年04月08日
カテゴリー Data Science and AI | SPSS Modeler ヒモトク | アナリティクス | データサイエンス
記事をシェアする:
皆さんこんにちは。IBMの坂本です。
SPSSを含むデータサイエンス製品の技術を担当しています。
このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を進める上で忘れられない教訓をインタビュー形式で伺い、これからデータ分析に取り組む皆様に参考にしていただくことを目的にしています。
今回インタビューをお願いしたデータ分析者は
2005年にSPSSのコンサルティング部から独立し、事業を立ち上げ、以来さまざまなデータ活用プロジェクトに関われらてきた木暮大輔様です。
このヒモトクでも過去に2度ご登場いただきましたが、今回はテクニカルな内容ではなく過去の苦い経験と教訓を伺います。
木暮 大輔 様
株式会社MAI
代表取締役社長
-日頃のデータ活用業務について教えてください
私は現在、データサイエンスを実践するためのサービスを提供する会社、MAIの代表を務めております。MAIでは、顧客企業でのデータサイエンス部門立ち上げ、部門育成およびデータサイエンティストの人財育成を行っています。私自身は学生時代からデータ分析の研究に取り組み、MAIの起業以降はマーケティング、金融、官公庁から製造業など、様々な産業の分析テーマに取り組んで、分析歴は30年以上になります。
ところで、社名のMAIはMan and AIの略で、人が先に立ち、AIとうまく付き合っていくという意味を込めています。
これまでの分析者達の教訓にも共通しているように、AIだけでは自律してデータ収集からモデリング、運用までを進められるレベルには達しておらず、分析者が分析結果を運用まで結びつけるという強い使命感を持って、運用部門とコミュニケーションをとりながらデータを集め、モデルを作成、検証し、経営部門も交えて意思決定のうえ、運用までこぎつけることができるという意見に私も賛同します。その上で、苦い経験とそこからの教訓を、具体的な事例を交えて記していきたいと思います。
-データ活用業務で味わった苦い経験を教えてください
発売されてから1年目の金融商品の販売促進を目的に、予測モデルを作成してターゲット顧客を選定し、リスト作成、営業部門がリストを参考に顧客を訪問するという、運用案まで握ったうえでのプロジェクトでのことでした。クライアントのプロジェクトメンバーが主体的に進め、私は執事のごとく寄り添ってアドバイザリーを行う立場でした。XGBoostツリーで合格点の精度のモデル作成に成功し、このモデルをもって、運用部門(営業)と経営部(取締役)が参加する報告会に臨むことになりました。XGBoostツリーで何がどうなると商品購入確率が高くなるのかを説明するのは難しく(ある意味ブラックボックス)、説明のために別の決定木モデルを作成することをアドバイス、満を持して発表会に臨みましたが、運用部門にとっては全く納得できない結果であることが分かっただけでした。そこから私も参加して、運用部門とコミュニケーションを頻繁に取り始め、業務(ドメイン)知識を踏まえたうえで、説明変数を取り換えて、運用部門に納得してもらえる説明モデルに修正することで、ようやく運用にこぎつけることができました。
一難去って、また一難、いざ、ターゲットリストを作成すると、スコア(購入確率を基に作成)の同じ顧客が多く並び、営業職が顧客を訪問するための優先順位がつけきれませんでした。
結局、モデル作成からやり直し、スコアのきめが細かいロジスティック回帰モデルを採用することになりました。XGBoostツリーモデルの精度からは多少劣るものの、仮説に基づいた特徴量作成を行うことで、運用に耐えうる精度のモデル作成に成功しました。それでもやはり、運用部門と経営部に納得してもらうための説明力を持たせるために、特徴量の偏差値化や連続値のカテゴリ化、重要度の高い特徴量の購入確率への影響を可視化するなど、工夫を凝らしてモデル作成とその評価を進めました。
-その苦い経験から得られた教訓はなんでしょうか
一つ目は、分析結果を初めて運用にこぎつけるには、運用部門やシステム部門、経営層をはじめ、関連するすべての人々に説明し、納得してもらう必要があるということです。報告会でのやりとりだけでなく、普段から頻繁にコミュニケーションをとり、あらかじめ分析の最終結果とそれに対する評価だけでなく、運用案まで「握っておく」ことが重要だということです。
その上でも、困難に直面して苦い経験をすることは避けられないでしょう。二つ目には、それを価値創造のチャンスととらえて、強い使命感で乗り越えていく必要があるということです。
いちからロジスティック回帰モデルを作成しなければならない「苦い経験」に直面した時も、それでも運用部門の方々に納得してもらおうと創意工夫をした結果、新たな特徴量を生み出すことができたのです。
-これからのデータ活用領域でのチャレンジについて教えてください
まず、30年以上の分析歴から得た苦い経験と、それらに対する教訓を集約し、6か月程度で習得できるような実践訓練プログラムを組んで、とりわけ、これから分析の実践・運用に取り組まれる方々と共有していきたいと思います。さらにプログラムの内容をまとめ、自身22年ぶりにClementine(SPSS Modelerの旧名)に関する書籍として出版することにもチャレンジしたいです。
さらに将来的には、教訓としてきたものを標準化、AIに取り込んで自動化できる範囲を拡大する支援を進めていければと思っています。そうしていくことで、AIとうまく付き合っていく方法が進化していくのだと思っています。
インタビューのお礼と感想
木暮様、お話をいただきありがとうございます。
さて皆様、いかがでしたか?
私も過去にサービスを提供する部署におりましたので、ビジネスオーナーから受ける高い要望やヒリヒリするプレッシャーを思い出して聞いていました。それを創意工夫のチャンスと捉えるという木暮様のポジティブな意見は今後、データサイエンティストやコンサルタントを目指される皆様にぜひ参考にしてほしいです。そしてそのためにも目の前のステークホルダーをデータ活用で満足させる使命感が必要だというご意見もまた私自身肝に銘じていきたいと思いました。
さて次回はDNPの福島様に「データ分析はチーム戦。個々がミス最小化の責任を持つ」を伺います。
→これまでのSPSS Modelerブログ連載のバックナンバーはこちらから
→SPSS Modelerノードリファレンス(機能解説)はこちらから
→ SPSS Modeler 逆引きストリーム集(データ加工)
坂本 康輔
日本アイ・ビー・エム株式会社
テクノロジー事業本部 watsonx事業部
Data & AI 第一テクニカルセールス
データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む
Women in Data Science Tokyo @ IBM 2024 開催レポート
Data Science and AI, IBM Data and AI
こんにちは。IBM西戸です。 今年で5回目のWomen in Data Science (WiDS) Tokyo @ IBM が2024年6月14日に初の会場とオンラインのハイブリッド開催されました。会場は2024年2月 ...続きを読む
法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティー」 | インサイド・PwDA+7(後編)
Data Science and AI, IBM Sustainability Software
日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 前編での法務・AI ...続きを読む