SPSS Modeler ヒモトク
データ分析者達の教訓 #18- データの向こうにある社会的背景や因果関係を洞察せよ
2024年06月10日
カテゴリー Data Science and AI | SPSS Modeler ヒモトク | アナリティクス | データサイエンス
記事をシェアする:
こんにちは。IBM Data&AIでデータサイエンスTech Salesをしている西牧です。
このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を進める上で忘れられない教訓をインタビュー形式で伺い、これからデータ分析に取り組む皆様に参考にしていただくことを目的にしています。
今回インタビューをお願いしたデータ分析者は
KINTOテクノロジーズの西口様です。
西口様は1999年に世の中にデータマイニングというワードが登場した時点で、SPSS Modelerを駆使されていた大ベテラン。当時所属されていた流通企業では長く中心的なデータ分析者だったためデータベースマーケティングの世界では著名なお方です。
現在はトヨタ自動車グループのデータ活用をする仕事に就かれ活躍の領域を拡げられている西口様に、念願が叶い、この連載ブログでインタビューさせていただきました。
西口 浩司 様
KINTOテクノロジーズ株式会社
開発・編成部
データ分析部
分析Gマネージャ
-日頃のデータ活用業務について教えてください
私は、KINTOテクノロジーズ株式会社でデータ分析部門の立ち上げから現在までマネージャとして携わっています。
KINTOテクノロジーズ株式会社は、2021年に創業したテック企業で、グローバルトヨタファイナンシャルサービス(KINTOを含む)のデジタルビジネスのテクノロジー面からのサポートを行っています。また、トヨタ自動車グループ関連のデジタルビジネス推進もサポートしています。
データ分析部門は、WEBサイトやアプリからのユーザー行動データ収集の仕組みづくりから始まり、分析基盤の構築により分析のスピードと質を向上させています。そのデータを活用して、データ・アナリシスとデータ・サイエンスを通じてビジネスサイドと協力し、信頼関係を築きながらビジネスゴールの実現と価値向上を目指しています。
-データ活用業務で味わった苦い経験と教訓を教えてください
以前所属していた流通企業での苦い経験が2つあります。1つ目は社会的背景の読み取りに起因するものです。
1989(平成元)年に3%で消費税が導入されてから、1997(平成9)年に5%、2014(平成26)年に8%、そして2019(令和元)年10月から10%と税率が引き上げられてきました。1997年のときは駆け込み需要もあり、その後の冷え込みを抑えるため小売業界は躍起になって消費税還元を謳うセールを行いました。ところが、2014年の8%に引き上げられたときは、消費税還元を謳うセールの宣伝・広告は禁止されました。
通販において、顧客をそのプラットフォームに維持・優良化のための指標としてRFMは非常に有効なものです。RFMは最新購入日のR、ある期間内での購入頻度のF、購入金額のMという3軸で管理する手法です。2014年の増税後のセール禁止が、顧客の購買間隔を空けてしまい、頻度・金額減少をもたらしました。
ここでRFMの本質を体現しました。Rはすぐに変化して回復させることは難しくないですが、取りこぼしたFとMはしばらくしてから変化が見え、ボディーブローのように効いてきます。気づいたときのリカバリーは大変です。RFMのなかでもRが先行指標になるということと、購買間隔は空かないようにキープあるいは短くしていくことが顧客維持・優良化のキーであるという顧客メカニズムを学びました。また、イレギュラーな社会現象が生じるときにはその顧客メカニズムとも突き合わせていくつものシナリオを考えて対応策をあらかじめ準備しておかなければならないということも教訓となっています。
もう一つの苦い経験は、分析した結果を未来の予測に当てはめたときの期待値が大外れしたことです。事前に行ったパイロット実験で得られた係数と本番での係数に大きなずれが生じてしまったのです。それゆえに多くの商品の在庫を出してしまうことになりました。
パイロット実験と本番での顧客の質や実施したタイミング、インセンティブなどの相違について考慮はしたもののその複雑な因果関係を読み切ることができませんでした。この時からパイロット実験と本番の違いについては深く考える癖がつきました。これは機械学習モデルを作る上でも役立っています。現在携わっているタスクでもインバランスなデータが対象になることが多いのですが、全体の精度を示す評価値だけでなく、歪な学習が行われていないかを確認するために個々のデータのチェックも怠らないようにしています。
-これからのデータ活用領域でのチャレンジについて教えてください
これまでの経験と技術の進化からいずれ機械学習は自動化されると思っていましたが、生成AIの登場によりこの未来の到来は想像以上に目の前に迫っています。その時に必要なのはモデルの精度を高めるための特徴量を消費者行動の中から見つけ出す洞察力と、最終的なモデルが適切に作られているかを判断する力です。これらのスキルを伸ばしていくためには座学だけでは難しく、経験は必要不可欠だと考えています。したがって上記のような教訓を業務を通してメンバーにも伝えていくように努めています。
また、生成AIの効果をデータ分析で最大限に活用するためには、マスタデータマネジメント(MDM)が重要です。テーブルの各項目名を適切に管理することで、AIの解釈力が向上し、正確な答えを導き出す可能性が高まります。SPSS Modelerを使う際にもCRISP-DMの考え方が重要視されています。ビジネスとデータの意義をしっかりと理解し、価値を損なわないようにMDMを実践することで、高度な技術をさらに活かせると考えています。
インタビューのお礼と感想
西口様、お話をいただきありがとうございます。
皆様、いかがでしたか?
西口様に限らず、日本を代表するデータサイエンティストの皆様は共通して「予測モデルの精度」よりも「施策の精度」や「施策に展開するためのストーリー」を強調されます。今回のインタビューを通じて、データ活用は業務全体を理解して推進するものであり生成AIが台頭する今後もますます、データを読み解く力と施策に展開する力が不可欠になるのだと認識をいたしました。
次回はAITの西村様に「ちゃぶ台返しを受けないため「最初に」現場と握っておく」を伺います。
→これまでのSPSS Modelerブログ連載のバックナンバーはこちらから
→SPSS Modelerノードリファレンス(機能解説)はこちらから
→ SPSS Modeler 逆引きストリーム集(データ加工)
西牧 洋一郎
日本アイ・ビー・エム株式会社
テクノロジー事業本部 データ・AI・オートメーション事業部
Data & AI 第一テクニカルセールス
著書に「実践IBM SPSS Modeler 顧客価値を引き上げるアナリティクス」(東京図書)
共著書に「実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用」(東京図書)
データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む
データ分析者達の教訓 #21- 異常検知には異常を識別する「データと対象への理解」が必要
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの宮園です。IBM Data&AIでデータサイエンスTech Salesをしています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、デー ...続きを読む
【予約開始】「SPSS秋のユーザーイベント2024」が11月27日にオンサイト開催
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
本年6月800名を超える方々にオンライン参加いただいたSPSS春のユーザーイベントに続き、『秋のSPSSユーザーイベント』を11月27日に雅叙園東京ホテルにて現地開催する運びとなりました。 このイベントは ...続きを読む