SPSS Modeler ヒモトク

身近な疑問をヒモトク#04-新規出店の売上予測は難問奇問!出店の成功確率を上げるデータサイエンス

記事をシェアする:

 

MAIの木村と申します。

弊社はデータ分析支援を通し、分析リテラシーを高め、業界の発展に広く貢献していくことをひとつの企業理念として、日々のビジネスに関するさまざまな課題を承り、データマイニング手法を用いて課題解決を支援するサービスを提供しています。

私はMAIに6年ほど在籍しているのですが、それ以前はコンビニエンス・ストア(CVS)業界に18年間、身を置いていました。

店舗勤務にはじまり様々な経験をした後に、出店に関わる部署に移籍。そこではSPSS Modelerを使い、売上予測やデータ分析を8年間担当しました。そこでIBMさんのイベントで講演をさせていただいた縁から、この「身近な疑問をヒモトク」の執筆機会を得た次第です。

さて、この記事では「実店舗の新規出店の難しさ」と「成功確率を上げる方法」を取り上げてみたいと思います。

新規出店という言葉を聞くと多くの人は、

「新規出店?だったらあそこのテナント募集しているところに出せばいいじゃない?」

という考えをお持ちになるのではないでしょうか。実はそのような考えで出店をすると大抵痛い目に合います。テナント募集している場所には何らかの理由があるので、

・その理由を確認する。

・きちんと周辺調査をする。

さらに自社の今までの出店の成功事例や失敗事例と比較してから、最終的に出店を判断することが重要です。そうすると出店の失敗は減り、成功確率は上がっていきます。

 

1.出店の難しさ

実店舗をお持ちのビジネスをされる方にとって重要な新規出店ですが望む場所に、望む数だけ出店できないものです。その最大のネックは足元の土地にあります。

すべての土地は、各自治体によって使い方が決められているからです。各自治体は都市計画図という土地の活用を示した計画図を作成しています。その中に用途地域というものがあり、土地の使い方が決められていて、業種業態によっては出店がかなわないのです。

いくらAIや機械学習ツールを使い、エリアマーケティングを行って出店エリア、出店ポイントを特定しても「出店ができない場所でした。」はこの世界のあるあるです。ですので出店を考えるときは、机上の計算だけでなく自治体関係も含め、必ず現地確認が必要です。なお、用途地域は見直される場合もあるため、今後は出店できるようになるかもしれませんので、定期的なチェックも抜かりなく行います。

 

都市計画サンプル図の出典

 

もう1つ簡単な例を示します。それは出店したい場所の土地の持ち主(地主)が複数いらっしゃる場合です。持ち主のなかで誰かが反対すると出店ができませんので、全員に賛成いただくべく担当者は持ち主達を説得します。

このように新規出店というのはいくつかの「難しさ」があるということを、知っていただけたのではないでしょうか。

ただ、そのような状況でも出店をしなければ会社の発展はありません。出店の担当者は会社の看板を背負い会社の売上を伸ばすため、出店業務を行っています。

ここからは出店後の店舗を分析することで、出店の成功確率を上げる方法を説明します。

 

2.出店のルール化

ルール化とは、簡単に言うと過去の出店の成功事例、失敗事例をまとめたアウトプットになります。出店のルールを作ることができれば、会社のノウハウになります。それは出店の担当者の助けにもなりますし、意思決定の根拠になります。さらに不採算店を作ってしまうリスクを減らすことにもつながります。

ここで、「店舗数が多いチェーンならルール化できるが、少ないところは無理でしょ」と思われるかもしれませんが、これはやり方次第だと思います。100店舗ぐらいまでの店舗数であれば1店舗ごとの状況把握ができていますので、成功・失敗の事例をまとめ易いです。追加データの収集コストも抑えられます。店舗数が少ない企業こそ、出店のルール化を作りながら、出店した店舗のデータを積み上げて欲しいと思います。データを積み上げていけば、将来的に売上予測やデータ分析ができるからです。

 

3.売上予測

「売上予測モデルは必須?」と「売上予測モデルの苦労する点」の2つに分けて解説します。

 

売上予測モデルは必須?

私は、売上予測モデルの必要性はケースバイケースだと思っており、十分な調査データと店舗データ、さらに社内に浸透させる力があればチャレンジしてもいいと考えています。

CVS業界は国内で56,000店舗(https://www.jfa-fc.or.jp/particle/320.html)もあり、物件調査もしっかりと行っていましたので、売上予測を作るのに必要なデータが十分にありました。それに加え、フランチャイズビジネスであることからも売上予測という客観的な評価が必要でした。

しかし、例えばすべての店舗が直営店で店舗数がそれほど多くない企業の場合、売上予測モデルは必須でなくても、自社の出店のルール化が作成できれば十分だと思います。重要なことは失敗しない出店をすることであり、売上予測モデルというのはデータが積み上がってきたところでチャレンジすればいいからです。

 

売上予測モデルの苦労する点

次に売上予測モデルの苦労する点についてです。まず私見になりますが、売上予測モデルに必要なデータを記述します。

商圏データ・・・GIS(地理情報システム)から得られる国勢などのデータ

交通量データ・・・人・車などの交通量

競合店データ・・・競合店位置関係、スペックなど

自店の店舗データ・・・売場面積、視認性、スペックなど

これらの調査データを使うのですが、売上予測モデルの苦労する点は、これらの調査データをチェックするところです。

調査データはPOSデータや位置情報データのように機械的に蓄積されるものではなく、担当者がインプットするので、誤った値が入るケースがあります(故意的なのかは別にして)。

このため調査データの中身の確認は必須です。誤った値が入力されていた場合、担当者にヒアリングしてデータ修正を行わなければなりません。データが整備できていなければこの後のモデル構築に悪影響を及ぼすからです。この地道な作業がとても大変です。

担当者たちの感覚の違いや運用の非統一からも誤った値が入力されることがあります。その場合は今後の入力ミスを減らすためのルール化やシステム化、現場へのアナウンスや教育も必要になります。これらの苦労する点を乗り越えて、モデル構築作業に入ることができます。

モデル構築作業では、一般的なデータ分析と同様にデータ前処理、特徴量エンジニアリングを行いながらモデル構築を進めます。

売上予測に使用するモデルは、一般的にはハフモデルや回帰分析が多いと思います。選ばれる理由としては、ニューラルネットワークやXGBoostのような高精度モデルよりも、モデルの解釈性に優れているのでユーザー理解が得やすいからだと思います。私も最終的には回帰分析を使用しました。

モデル構築を進めていくと必ず「精度」が求められます。ここは各企業により求められる精度の着地点が異なってくると思いますが、私の場合は「精度」と「解釈性」の両方を重要視していました。

もう一つ売上予測モデルを運用するのに重要なことがあります。売上予測モデルは完璧なツールとして運用するのではなく、出店のルール化と同様に、出店の成功確率を上げるツールの一つとして考えることです。その理由として、売上予測モデルは過去の出店の実績から作られるものであり、これから出店する未来のデータは含まれていないからです。

 

4.失敗談

最後に私の売上予測モデル構築の失敗談を少しだけ。

売上予測を担当して3年目の時に私はモデル構築に失敗しました。私自身2度目のモデル構築でしたので、さらに精度を上げようという気持ちが強く出ていました。これが後の失敗に繋がります。

失敗の原因はモデルのコンセプトを精度に偏って作ったこと、モデル検証期間を甘く見積もったことになります。当時は1回目よりもさらに統計的な前処理や、多くの変数を構築して精度アップを試みていました。背景には「前回は1からモデル構築を経験しているので、今回も大丈夫だろう」と高を括っていたところにあります。

いざ新しいモデルのリリース時期が近付いてきたときに、精度検証を行った結果、トレーニングデータとテストデータの精度に大きな乖離が発生し過学習していることがわかりました。リリース時期が近付いていたため、モデルを修正することができませんでした。この影響で売上予測モデルのリリースは遅れ、社内関係者に迷惑を掛けることになりました。私はこの経験から、「精度」に偏ったモデル構築の難しさを学びました。

その後もモデルの構築運用を行い、転職して今に至るわけですが、この時の失敗は良い経験となり、現在の業務においても脈々と生きつづけています。

 

いかがでしたでしょうか。私の経験が皆様のデータ活用のお取り組みに何かしらお役に立てれば幸いです。

 

次回の連載、第5回目はAITの西村さんが「コロナ禍の教育現場。データでリモート授業をサポートできないか?」を執筆。5月20日に公開予定です。また、並行連載中の「ブログで学ぶSPSS Modeler」はIBM河田さんが「LightGBMや地図表示!拡張ノードでPythonやRの機能を取り込む」を紹介してくださいます。5月7日を予定しています。どちらもお楽しみに。

 

SPSS Modelerの詳細についてはこちら

これまでのSPSS Modeler ブログ連載のバックナンバーはこちらから

 

 

 

 

木村 秀貴

株式会社MAI

データサイエンス部長

 

 

 

 

More SPSS Modeler ヒモトク stories

データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む


Women in Data Science Tokyo @ IBM 2024 開催レポート

Data Science and AI, IBM Data and AI

こんにちは。IBM西戸です。 今年で5回目のWomen in Data Science (WiDS) Tokyo @ IBM が2024年6月14日に初の会場とオンラインのハイブリッド開催されました。会場は2024年2月 ...続きを読む


法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティー」 | インサイド・PwDA+7(後編)

Data Science and AI, IBM Sustainability Software

日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 前編での法務・AI ...続きを読む