SPSS Modeler ヒモトク

データ分析者達の教訓 #14- データから導かれる「あたりまえ」を丁寧に見つめ直す

記事をシェアする:

 

皆さん、はじめまして。

昨年末にIBM にJoinし、Data&AIでデータサイエンスTech Salesをしている宮園と申します。

 

このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を進める上で忘れられない教訓をインタビュー形式で伺い、これからデータ分析に取り組む皆様に参考にしていただくことを目的にしています。

 

今回インタビューをお願いしたデータ分析者は

今回はデータ活用領域でIBMとパートナーシップを結び、私たちやお客様を長年サポートしてくださっている日立ソリューションズ東日本の澤田様です。お客様から絶大な信頼を得る澤田様がご経験を踏まえた教訓を明かしてくださいます。

 

 

澤田 美樹子 様

株式会社日立ソリューションズ東日本
産業ソリューション事業部
ビジネスソリューション本部
アナリティクスソリューション部

 

-日頃のデータ活用業務について教えてください

私は現在、アナリティクス技術(データ分析、機械学習、AI)をビジネスで役立つ形に実装したソリューションを提供する部門に所属し、案件の推進と社内のデータサイエンティスト人財の育成を行っています。

以前、というか古い話になりますが、「ビッグデータ」や「データサイエンティスト」という言葉が登場する前の2000年代前半から、確率論を用いた定量的リスク分析や需要予測の案件に従事し、アナリストやプロジェクトマネージャを担当してきました。

担当しているお客様の業種・業務は様々です。食品安全、石油、 医薬、輸送機器製造、プラント建設など、日々、業種の異なるお客様とプロジェクトをご一緒しています。

今まで一貫していることは、お客様の意思決定と業務課題解決の支援をデータに基づいて実施する、ということです。

 

-データ活用業務で味わった苦い経験を教えてください

1点目はExcelファイルの誤りに気づかずに後続の分析を進めた結果、報告会の直前に間違いに気づいたことです。

分析プロジェクトは複数のフェーズで進められることが多く、かつフェーズ2を別の体制で実施することがあります。当社のチームはフェーズ2から参画しました。

皆さんがご存じ通り、Excelは基礎的な集計や可視化には便利なツールですが、セル参照の間違えや固有値の埋め込みは要注意です。フェーズ1で作成されたファイルのそのような情報に気づかず分析を進めたことで、分析結果が間違ったものになり、報告会の直前に急遽、訂正したのでした。

2点目はサービス事業を行う企業の顧客分析プロジェクトで、担当者様から「意外な分析結果」を期待されたことです。提案時に私から「意外な結果はそう出るものではありません。」とご説明していました。しかしマーケティングのプロである担当者様は、ご自身の経験と知見を超えるような潜在顧客の定義が分析の結果から導き出されることを期待していました。

分析の結果、いただいたコメントは「当たり前の結果でしたね。」であり、ご期待には添えませんでした。

 

-その苦い経験から得られた教訓はなんでしょうか

1点目の例では、前任者から引き継いだデータや分析プロセスは、開始前に丁寧に確認することです。また、そこで意図がわからない集計の仕方や誤りを発見した場合は、関係者にヒアリングして内容を確認することです。

お客様にとってはフェーズ1で実施済の分析でも、私たちにとっては初めてであり、それを理解する時間を確保することが、その後の手戻り防止に繋がります。その必要性をお客様と合意するようにしています。

2点目の例では、提案時やプロジェクト開始時に「意外な結果は滅多に出ません。」とご説明することと、当たり前の結果が出たとしても、「今まで定性的にわかっていたことを、定量的に裏付ける」ことの意義を説明し、合意した上で分析を開始することです。実際に2点目の例でも、定量的な裏付けができた点は担当者様にご納得いただき、プロジェクトを終了しました。

 

 

-これからのデータ活用領域でのチャレンジについて教えてください

生成AIの登場により、データサイエンティストの生産性は上がるでしょう。一方で、経営課題や業務課題を解決するために、お客様がデータサイエンスに期待する目的や要求事項を正しく理解して、その後の施策に繋がる評価指標を設定し、必要な分析技術を適用する、という役割は変わらないと考えています。

また、分析結果を見て「何か変だ」と気づく感覚を養うことや、そう指摘するお客様の真意をくみ取るという行動も変わりません。

そのような役割を担うデータサイエンティスト人財を引き続き育成するとともに、データインテグレーションや分析基盤構築も含めて経営課題や業務課題の解決に寄与するソリューションを提供していきます。

 

インタビューのお礼と感想

澤田様、お話をいただきありがとうございます。

さて皆様、いかがでしたでしょうか?私はたくさんの気づきをいただきました。

Excelの落とし穴に痛い目にあったこと、私何度もあります(笑)。

Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)という通り、インプットデータを疑って適切に扱うことは、注意しすぎてもし過ぎることはないですよね。

また、時間をかけて分析したレポートをビジネスオーナーから「全部知っていた」と言われた経験をお持ちの方、存外多いのではないでしょうか?

実際にデータからのけぞる結果がオンパレードすることは不健全で、インタビューのように「あたりまえ」を定量的に見つめ直すことに価値があり、裏付けられた事実を持って施策や意思決定ができるのだと私自身も改めて考えさせられました。

さらに「何か変だ」をデータから気付けるデータサイエンティストになれるよう精進しようと思います。

 

次回は本田技研工業の小川様に「データ分析は手段と割り切り情熱をもって目標に進め」を伺います。

 

→SPSS Modelerの詳細についてはこちら

→これまでのSPSS Modelerブログ連載のバックナンバーはこちらから

→SPSS Modelerノードリファレンス(機能解説)はこちらから

→ SPSS Modeler 逆引きストリーム集(データ加工)

 

 

宮園 英駿 Hidetoshi Miyazono

日本アイ・ビー・エム株式会社
テクノロジー事業本部 watsonx事業部
Data & AI 第三テクニカルセールス
  

 

 

 

 

 

More SPSS Modeler ヒモトク stories

データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む


Women in Data Science Tokyo @ IBM 2024 開催レポート

Data Science and AI, IBM Data and AI

こんにちは。IBM西戸です。 今年で5回目のWomen in Data Science (WiDS) Tokyo @ IBM が2024年6月14日に初の会場とオンラインのハイブリッド開催されました。会場は2024年2月 ...続きを読む


法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティー」 | インサイド・PwDA+7(後編)

Data Science and AI, IBM Sustainability Software

日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 前編での法務・AI ...続きを読む