SPSS Modeler ヒモトク

ブログで学ぶSPSS_Modeler #10- 異常検知の自動化！CADSの設定を動画でご紹介

2022年10月05日

カテゴリー Data Science and AI | SPSS Modeler ヒモトク | アナリティクス | データサイエンス

記事をシェアする:

こんにちは！IBM斉藤です。今回はSPSS Modelerで作成したストリームをCollaboration and Deployment Services （以下CADS）で実行するための設定を動画にてご紹介します。

利用環境：

SPSS Modeler v18.4 Mac版
Collaboration and Deployment Services v8.4 ( Windows Serverに構築

図1 接続イメージ

はじめに　想定シナリオのご説明

今回の異常検知では、時系列データを用いて、過去のデータから異常値の有無を判定します。例えば24時間稼働の工場で、製造数の計画に基づきMT_002ラインで1時間あたりに消費された電力が正常の範囲内であったか確認します。（95%予測区間。範囲の設定方法は、本記事でご説明申し上げます。）

この時、実際に消費した電力が上振れしている場合は、過去データをもとに分析した結果、なんらかの理由で無駄に電力を使っていると判断できます。製造機器の摩耗や劣化で消費電力が増えてしまっている場合、故障となる予備軍を早めに見つけ出すことに繋がります。

下振れしている場合は、過去のデータに比べなんらかの電気系統で通電のエラーがあったなど、電力系統がうまく機能していなかった可能性も考えられます。大規模障害が実際に発生する前に故障予備軍となる不具合を早めに見つけメンテナンスするなどができると考えます。

図2 　MT_002の95%予測区間グラフ

SPSS Modeler ストリームの解説

SPSS Modelerの[可変長ファイル]ノードでcsvを読み込み、[ストリーミング時系列分析]で95%の範囲（区画）を算出し、上振れまたは下振れしている場合は[フィールド作成(MT_002異常フラグ)]ノードで異常フラグをつけて[条件抽出(生成)]ノードで異常フラグがついているものだけを抽出し、終端の[フラットファイル]ノードにcsvで出力します。

CADSではどの枝のストリームを実行するか選ぶことができますが、このストリームでは終端は[フラットファイル]ノードのみとしています。

図3　異常検知のストリーム

このModeler フローでは、過去の時系列のデータを見て分析を行うため、分析を行う上で一定のデータ件数が必要となります。1周期分のデータを常に外部システムから、エクスポートするのがよいと思われます。（1周期分：1年、1ヶ月など。新しいデータが追加されたら、古いデータは削除するなどして読み込みデータの肥大化を防ぐ工夫も考慮ください。）