SPSS Statistics

SPSS Forecastingの魅力

記事をシェアする:

井上 哲浩 氏

慶應義塾大学大学院 経営管理研究科 教授

自社ブランドの売上を予測したい、と思うマネージャーは少なくないでしょう。しかし売上予測は容易ではありません。予測のためにどんな統計モデルや機械学習のモデルがあり、どのように予測モデルを特定化し推定すれば良いのか、課題は山積みです。そんなマネージャーにとって待望の製品が、SPSS Forecastingです。そしてSPSS Forecastingの中でも、本稿で特に取り上げたいプロシージャーが「時系列モデラー」です。

時系列モデラーは、プルダウン・メニューでは、「分析」から「時系列」そして「モデルの作成」で起動します。シンタックスでは、TSMODELです。この時系列モデラーで特筆すべきは、「エキスパートモデラー」機能です。その卓越した機能を紹介するために、まず時系列モデルを簡単に紹介しましょう。

時系列モデルには、線形か積形モデルに大別されます。ただし、積形モデルでも、対数変換すれば下記のように線形モデルになるため、この類型化はそれほど重要ではありません。
ここで、ytはt期の売上、Ttはt期のトレンド、Stはt期の季節性、Ctはt期の周期性、α、β、γはパラメーターです。
column04_fig01

むしろ重要な類型化は、計量経済学の2分野を構成するといっても過言ではない、同時方程式系計量経済モデルと時系列系計量経済モデルという 類型化です。同時方程式系計量経済モデルは、下記のように連立方程式体系や多変量体系と呼ばれるシステムを構築し予測を行うことを目的としています。
ここで、ytはt期の売上、x1tやz2tはある変数x1やz2のt期の値、μは切片項、βはパラメーターです。売上を予測するのに用いられる変数x1t、x2t、x3tが、また別の変数により説明される構造(例えば、x1tがx2tとz2tにより、またx3tがx2tとz3t-1により、それぞれ説明される構造)になっており、連立方程式体系や多変量体系をなしています。
column04_fig02

他方、時系列系経済モデルは、下記のように、自己回帰と呼ばれる売上そのものの過去の値(1期前の売上yt-1と2期前の売上yt-2)そしてある外生変数(z3t)により予測されるモデルを考えます。

同時方程式系計量経済モデルと時系列系計量経済モデルという2つのアプローチの優劣を付けることは非常に困難です。売上予測の精度や適合度という見地からすれば、小生の経験からは、やや時系列系計量経済モデルの方が優れている感があります。しかしながら、モデルの操作性や政策そして戦略への示唆を行うという見地からすれば、これまた小生の経験からは、やや同時方程式系計量経済モデルの方が優れている感があります。ただ時系列系計量経済モデルも、上式にて包含されている外生変数(z3t)を考慮することにより、戦略示唆に関する優劣は、ほぼ差異がなくなりつつあります。従って、問題は、モデルの操作性です。
column04_fig03

モデルの操作性は、モデルをいかに特定化するか、と言い換えることもできます。時系列系計量経済モデルを特定化する際に、2つのことを特定化しなければなりません。1つ目は次数の特定化です。先の式では、1期前の売上と2期前の売上を用いました。しかしながら、1期前の売上を用いずに、2期前と4期前のみを用いたり、1期前から6期前までの売上全てを用いたりすることもできます。したがって、モデルに包含される次数の組合せ数は、星の数ほどあることになります。「エキスパートモデラー」機能は、この全ての次数の組合せから、R2、平均2乗誤差、BIC情報量規準などに基づき、最善の次数を自動的に識別します。

時系列系計量経済モデルにおいて特定化しなければならないもう一つのことは、外生変数に関することです。外生変数の数は業界や競争環境、そして経営課題などにより変動しますが、多ければ1000を超えることも予想できます。1000個の全ての外生変数をモデルに包含することは通常できませんので、どの外生変数を包含するべきかを決める必要があります。外生変数が5つ場合を考えましょう。モデルに包含する外生変数の組合せは、1つ目を包含するかしないか、2つ目を包含するかしないか、・・・となり、2の5乗の32通りあります。そして外生変数の数が増加すればする程、幾何級数的に組合せ数は増加します。更に問題を複雑にするのは、外生変数に関しても次数を決定しなければなりません。先の例では、外生変数(z3t)の次数はt- 1とあり、予測目的の売上から1期遅れた効果を考えています。しかしながら、外生変数の効果は、1期前効果のみとは限らず、同時期の効果をもつものもあれば、3期前の効果のものもあります。したがって、外生変数に関する特定化は、包含するかしないかとその次数に関する複雑な問題です。ところが、「エキスパートモデラー」機能は、自己回帰の次数同様に、R2、平均2乗誤差、BIC情報量規準などに基づき、包含すべき外生変数の識別そしてその外生変数の最善の次数を自動的に識別します。

「エキスパートモデラー」機能は、卓越した機能をもつプロシージャーです。端的に言えば、優れた外生変数を伴う時系列系計量経済モデルの複雑な側面を自動的に識別し最善のモデルを導出する、マネージャー必須のプロシージャーではないでしょうか。そしてTSMODELシンタックスを用いれば、更なる複雑な問題にも対応できる、点を述べて、本稿の筆をおきます。

関連製品

  • IBM SPSS Forecasting:包括的な時系列分析(複数の曲線当てはめ、平滑化モデル、自己回帰関数の推定手法を含む)によって予測を改善できます。エキスパートモデラーを使用すると、試行錯誤をしなくても、使用中の時系列や独立変数に最も適しているのはARIMAと指数平滑モデルのどちらであるのかを自動的に判断してくれます。
More SPSS Statistics stories

データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む


データ分析者達の教訓 #21- 異常検知には異常を識別する「データと対象への理解」が必要

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

皆さんこんにちは。IBMの宮園です。IBM Data&AIでデータサイエンスTech Salesをしています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、デー ...続きを読む


【予約開始】「SPSS秋のユーザーイベント2024」が11月27日にオンサイト開催

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

  本年6月800名を超える方々にオンライン参加いただいたSPSS春のユーザーイベントに続き、『秋のSPSSユーザーイベント』を11月27日に雅叙園東京ホテルにて現地開催する運びとなりました。 このイベントは ...続きを読む