畠 慎一郎 氏
スマート・アナリティクス株式会社
代表取締役
スマート・アナリティクス
著書に「SPSS超入門」「武器としてのデータ分析力」
「文系ビジネスパーソンのためのデータ分析入門」
SPSS Modeler ヒモトク
【リレー連載】わたしの推しノード – 顧客データ分析の頼れる助さん&格さん「RFM集計ノード」「RFM分析ノード」
2020年06月12日
カテゴリー Data Science and AI | IBM Data and AI | SPSS Modeler ヒモトク | アナリティクス
記事をシェアする:
みなさん、こんにちは。スマート・アナリティクスの畠と申します。
私は、2015年までSPSS社、IBM社にてSPSS製品のマーケティング担当を10年以上担当させていただきました。現在はスマート・アナリティクスという会社にてデータ分析を多くの皆さんにご利用・活用いただくための活動を行っています。
SPSS時代の大先輩、牧野さんからのリレーを引き継いだ今回の連載。私の推しノードとして顧客データ分析の際に非常に便利なRFMノードについてご紹介をしたいと思います。そもそもRFMって何だ?という方のためにRFM分析の基本のご紹介と共にModelerを利用したRFM分析について解説をしていきましょう。
顧客分析のセオリー
ビジネスにおける主要なデータ分析のテーマの一つは、「顧客:お客様」に関するものであると思います。昨今では、多くの企業が高度なAIを使って顧客一人ひとりに合わせた購入スコアを算出したり、プロモーションのターゲットのための分析をしたりと顧客データを利用して多くの分析がなされていることと思います。
もちろん、これらの取り組みは、データの利活用において大切なことでしょうし、重要なことです。
しかしながら、どんなデータの分析においても、はじめにやるべきことは、「データを知る」、「顧客の実態を基礎的な集計から眺める」ということです。特に優良顧客分析を行う際には、RFM分析は必須の分析となります。なぜならば優良顧客の特定の際には、金額や来店頻度、来店間隔などから、優良顧客の定義をする必要があるからです。この投稿ではID付POSデータを例にとってRFM分析を簡単に行う方法を紹介してみます。
さて、顧客分析の全体の流れについて先に触れます。はじめにやるべきことは、デシル分析やRFM分析です。そこで優良顧客の特定を第1段階で行います。その後、優良顧客といっても多くの場合、いくつかのパターンがありますので、優良顧客のクラスタリングを実施しセグメントを特定、さらには収益性を確認していきます。そして最終的に優良顧客がどのような顧客などかについて特定を行い、打ち手を策定していきます。その後は、また打ち手の評価と、優良顧客のセグメント移動について把握していくという流れになります。
そもそもRFM分析とは
それでは顧客分析の第一歩でもあるRFM分析を紹介していきましょう。
RFM分析は、それぞれ、次の頭文字をとったものです。
・R:Recency(直近購入度)
・F:Frequency(購入頻度)
・M:Monetary(購入金額)
RFM分析は、顧客を先のRecency(直近購入度)、Frequency(購入頻度)、Monetary(購入金額)という3つの指標で分類する手法です。デシル分析は相対的な購入金額グループを作りますが、購入金額を絶対的に仕分けした上、直近度、頻度を加えたものがRFMです。それぞれの指標について、何個に分類するかは自由に決定することができますが、多くの場合、5つもしくは3つくらいのランクに分け、顧客一人ひとりにスコアを算出します。
例えば、それぞれRecency(直近購入度)、Frequency(購入頻度)、Monetary(購入金額)を5つの区分で作成する場合、ランクが5個ずつ作成され、「111」〜「555」までのパターンが作成されます。つまり5×5×5の125のパターンが作成され、それぞれの顧客にスコアとしてつけることができるわけです。3つのランクに分けるのであれば、27通りですね。スコアを算出した後は、デシル分析同様、それぞれのスコア、例えば555スコアの購入金額、購入点数、来店頻度、購入回数などの値や平均値などを算出し、他のスコアと比較したりしながら把握を進めていきます。
変換前のデータ
変換後のデータ
先述の通り、優良顧客の分析をする際には、M(購入金額)の高い、「5」の顧客だけを抽出して、その顧客を中心にまた分析を進めれば良いわけです。
もちろん、企業によっては、M(購入金額)ではなく、F(頻度)やR(直近度)を使って優良顧客とする場合もあるでしょう。このあたりの定義は企業やビジネスモデルによって異なります。大切なことは、これらの作業を行うことにより、自社にとって「良いお客様」とはだれなのか?という議論が起こることと思います。これこそ、データドリブンの経営や営業、マーケティングの第一歩です。データを元に自社を振り返り、意思決定に活かすわけです。
SPSS Modelerで簡単に実行RFM分析
顧客データ分析の基本として、多くの参考書やWebサイトにも紹介がされているRFM分析。基本、基礎と言われているにも関わらず、システム上、データ分析上、このスコアを作っていくことは少々手間です。それをわずか2つの操作で実現してくれるのがSPSS Modelerです。
SPSS Modelerでは、RFMに関するノードが2つ準備されています。
一つがレコード設定ノードとしての「RFM集計」、そしてもう一つが、フィールド設定ノードの「RFM分析」ノードの2つです。
RFM分析ノードを利用するためには、データとしては以下の3つの変数が必要になります。
RFMは、顧客それぞれの状況を把握するためのものですので、まずは顧客を識別するIDなどの変数が必要です。それに加えて、基準点からの直近購入日を特定するための購入日などの時系列の変数、あとは金額を計算するための変数があればOKです。RFM集計・RFM分析ノードの使い方について順を追って紹介していきましょう。
まずSPSS ModelerにPOSデータなどのデータを読み込みます。その後、データ型ノードなどからまずはRFM集計ノードを結合します。設定のダイアログは以下になります。
ここではいくつかの設定を行いますが、重要なことは中間部の「ID」「日付」「値」の部分です。IDには「顧客ID」を、日付には「購入時間がわかる変数」、値は、「購入金額」のデータを選択します。また、上部のリーセンシ基準日には、今日時点の日付か、指定の日付を選択します。この日付を軸として、直近購入日を設定します。このノードを作成するとそれぞれの顧客のR,F,Mの各値を計算してくれます。RFM集計ノードの設定が終了したら、その後にRFM分析ノードをつなげます。
RFM分析ノードでは、RFMそれぞれの指標について設定をしていきます。まず上部では、リーセンシ、フリクエンシー、マネタリーをRFM集計ノードで作成された変数を選択していきます。
「ビン」数には、それぞれの指標を何等分するのかを決めていきます。また重みについて、RFMのそれぞれの表示順を制御します。マネタリーを最初に表示したい場合には、重みを「100」に設定し、他の変数の重みを「10」「1」にします。
設定は大きく言えば、2ステップだけ。RFM集計ノードで、個人の識別、時間、購入日のデータを揃え、その後、RFM分析ノードで何分割するのか、スコア表示の順番を制御するだけです。とってもかんたんにRFMスコアを作ることができます。
テーブルに出力すれば、各IDのRFMスコアを見ることができます。このようにとってもかんたんにRFMスコアを出すことが出来る点がModelerの優れた点であると思います。
RFMスコアを作成した後には、Mスコア5の顧客だけを利用したセグメンテーションや、記述統計などを利用し、各スコアでの各種比較なども可能になります。
顧客分析の基礎集計として使えるRFM
さて、今回は顧客分析の基礎集計として使える「RFM集計ノード」、「RFM分析ノード」についてご紹介してきました。顧客データ分析の助さん&格さんと例えたくなる理由はお分りいただけたでしょうか。「データ分割ノード」などで代用できる作業ではありますが、ID、タイムスタンプ、購入金額のデータがあればすぐさまRFM分析が出来る心強い助っ人です。皆様も一度、このノードを利用してみてはいかがでしょうか?
牧野さんから引き継いだリレーブログ。次回推しノード#10は同じく大先輩のIBMソフトウェアサービス西澤さんが「SMOTEノード」をご紹介いたします。お楽しみに。
→これまでのSPSS Modelerブログ連載のバックナンバーはこちら
→SPSS Modelerノードリファレンス(機能解説)はこちら
→SPSS Modeler 逆引きストリーム集(データ加工)はこちら
データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む
データ分析者達の教訓 #21- 異常検知には異常を識別する「データと対象への理解」が必要
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの宮園です。IBM Data&AIでデータサイエンスTech Salesをしています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、デー ...続きを読む
【予約開始】「SPSS秋のユーザーイベント2024」が11月27日にオンサイト開催
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
本年6月800名を超える方々にオンライン参加いただいたSPSS春のユーザーイベントに続き、『秋のSPSSユーザーイベント』を11月27日に雅叙園東京ホテルにて現地開催する運びとなりました。 このイベントは ...続きを読む