SPSS Modeler ヒモトク
身近な疑問をヒモトク#02-気象予報士が解説!業務活用の前に押さえておきたい気象データの誤解
2022年02月07日
カテゴリー Data Science and AI | SPSS Modeler ヒモトク | アナリティクス | データサイエンス
記事をシェアする:
皆さん、こんにちは!IBMの西川です。 The Weather Company Asia Pacific Forecast Centerの気象予報士として勤務しております。なぜIBMに気象予報士が?という方は、こちらの紹介記事をぜひご覧ください。以前は自衛官だった私の経歴を含めてインタビューをしていただきました。
さて「身近な疑問をヒモトク」シリーズ第2回では、業務活用の前に押さえておきたい気象データの誤解を解説したいと思います。
この記事を読んでいる皆さんは、
- 気象データを正しく利用したい。
- 気象データをビジネス課題解決に利用したいけど、気象の知識がなくてどう使えばわからない。
- 気象データの利活用について相談できる人が近くにいない。
といった悩みをお持ちではないでしょうか。
気象は、消費者の行動だけでなく、農作物やエネルギーの生産など、さまざまな分野に影響を与えています。ビジネス課題解決のために、自社の顧客データや売上データを利用したデータ分析などはよく行われています。
しかし、インターネットで検索してみても気象データをビジネスに活用した事例はあまり多くないかもしれません。その一方で、気象データと各企業が持つデータをあわせて分析し毎日の意思決定や業務プロセスを改善・効率化、生産性の向上に取り組んでいる企業は日々増えています。
例えば 気象ビジネス推進コンソーシアム(外部サイト)の事例にある様に気象データを利用して、ビジネス課題の解決に取り組みたいですよね?
とはいえ、ただ闇雲に気象データを利用するだけではいい結果は得られません。そこで、今回は気象データを正しくビジネス課題解決に活用できるように、誤解されやすいポイントを気象予報士目線で解説していきたいと思いますので、ぜひ最後までご覧ください。
1 降水確率100%は大雨になるという誤解
皆さんは降水確率という言葉を正しく理解できていますでしょうか。
もしかしたら、
「降水確率が100%のときは大雨になるんでしょ?」
「降水確率が30%のときは、ぱらっと雨が降る感じ?」
というように理解しているかもしれません。
結論から言いますと、降水確率と降水量に関係はありません。
降水確率とは、
“予報区内で一定の時間内に降水量にして1mm以上の雨または雪の降る確率(%)の平均値で、0、10、20、・・・100%で表現する”
と気象庁では定義されています。
具体的に降水確率60%という場合、例えば、東京で午前6時から12時の間に60%という予報が100回発表されたとき、そのうちの60回は1mm以上の雨が降るという意味です。
確かに、降水確率が100%に近い場合は、大雨になるというイメージを持つ人がいるかもしれませんが、このように降水確率は降水量を予報するものではないので、注意しましょう。
加えて降水確率を示す時の降水量は1mm以上の降水を対象にしていることもあわせて理解しておきましょう。
例えば、朝の天気予報で降水確率が0%となっていたのに雨が降ったとします。
多くの人は
「天気予報外れてるじゃん!」
と思うかもしれませんが、
その降水量が0.5mmだった場合は、降水があったとはカウントされないので、この予報は間違っていなかった、ということになります。
2 最低気温は真夜中の12時に出るものという誤解
「最低気温というと、なんだか夜に観測されていそう。」
と理解している人もいるのではないでしょうか。
実は、これも誤解です。
日本においては1日の区切りは午前0時(24時)です。(この区切りを日界と言います。)
気象条件によって異なりますが、一般的に晴れている場合の多くは朝の6時ごろに観測します。
天気予報で、明日の予想最低気温という場合は前日21時から当日9時の値を掲載していることが多いです。
一方で観測記録における最低気温は0時から24時における最も低い気温を指します。
天気予報と観測記録では最低気温の定義が異なる場合があることも理解しておきましょう。
なお、海外の最低気温を利用する場合は注意が必要です。
例えば、アメリカでは日界を日の出と定義しています。
そのため、任意の日の最低気温は当日の朝6時ごろではなく、翌日の朝6時頃の気温を示している場合があります。
3 風速は地表付近で観測されたものという誤解
「風速は地表面で観測された値でしょ?そんなの知っているよ」
と理解しているあなた、残念ながら違います。風速は地表付近で観測されるものではありません。しかも、観測地点によって風速を観測している高さは異なるのです。
これはなぜかというと、
気象庁が出している気象観測の手引き(外部サイト)のなかには、
“風は地物の影響を受けやすいので、風向・風速計は、普通、平らで開けた場所に設置する。測器感部と建物や木々などの障害物との距離は、障害物の高さの少なくとも10倍以上あることが望ましい。”
と記載されているのみで、高さの決まりはありません。
しかしながら摩擦の影響で風速が減衰するため、地表付近で観測されることはありません。
では、いったい気象庁の観測地点で観測されている風速は地表からどのくらいの高さなのか調べるにはどうすればいいのか。
気象庁が開示している地域気象観測所一覧(外部サイト)に記載されているので、確認してみてください。
参考に、東京にある風速計の高さを見てみましょう。
表にある赤丸内に示されているように、35.3mの高さの風速を測っています。結構高いですよね。
ちなみ他の観測所も見てみると、概ね10m前後に設定されています。これは世界気象機関(WMO)が風速計の設置基準を10mとしているためです。これにならい、The Weather Companyが提供する風速も地表から10mの高さを基準にしています。
4 観測値は記録方法は統一されているという誤解
皆さんのなかで気象庁にある過去の気象データを使ったことがある人はいると思います。私自身も利用することがあります。無料にも関わらず、とっても使いやすいですよね。
ところがこの気象データ、観測値の記録方法は昔から変わっていないと思いますか。
残念ながら答えは「NO」です。
例えば降水量の最小単位について、アメダスにおける観測では2008年3月25日までは0.1mmだったのですが、2008年3月26日以降は0.5mmとなっています。
つまり、過去0.2mmと観測されていた降水量は、現在は0mmとしてカウントされることになるのです。
したがって、2008年前後の降水量データを利用するときはこのことに留意する必要があります。
また、アメダスの降水量データにおいて降水量がない場合と最小単位未満の降水(0.5mm未満の降水)があった場合はいずれも0.0mmとしてカウントされます。
つまり、降水量が0.0mmと表記されている場合は、実際に降水がある可能性もあるということです。
気象台等での観測の場合は降水がない場合は”-”という表記、最小単位未満の降水があった場合は0.0mmと表記されていますので、気象データを正しく利用するために理解しておきましょう。ここでは記事の都合上割愛しますが、気温・風・日照時間・雪の観測について最小単位や統計方法の変更がある時期を境に変更されています。
詳しくは気象庁のHP(外部サイト)をご確認ください。
5 民間気象会社でピンポイント予報ができるのは独自に観測機器を設置しているからという誤解
民間気象会社の天気予報アプリでは、よくピンポイント予報が実装されていて、今いるエリアの天気予報がわかります。
これは各気象会社が観測地点を持っているからなのでしょうか。
答えは「NO」です。
気象予報は観測値や過去の統計値などをある方程式に代入し、その結果を地球を模した格子モデルに当てはめていきます。その格子モデルにあるひとつひとつの格子点ごとに予測値が計算されます。求める任意のポイントは近くの格子点の値を内挿して算出されているのです。
すなわち、決して観測機器を設置しているわけではないということなのです。ちなみに、The Weather Companyでは、1kmメッシュという非常に細かい粒度で予報データを提供しています。
まとめ
ここまで読んでいただきありがとうございました。
この記事では気象データをビジネスに活用するうえで押さえておきたい5つの誤解を解説してきました。
・降水確率が高いほど降水量が多いわけではない。
・最低気温は通常朝6時ごろに観測される。
・風向風速の値は地表面ではなく、地表から概ね10m程度の高さの値
・気象要素によっては観測値はある期間を境に統計方法が変更されている。
・民間気象会社がピンポイント予報ができるのは、観測機器を多く設置しているからではない。
ということを理解していただけたと思います。
すでに利用されている人も多いかと思いますが、
過去の気象データは気象庁HP(外部サイト)に無料で公開されています。
データの取得も簡単なので、データ分析初心者でも簡単に始めることができます。
しかし、気象庁が持つ観測点は限られているため、自分が取得したい地点のデータは得られない、または距離が離れているという可能性があります。
また、一度に多くの項目や期間を取得するには時間がかかる上、一度にリクエストできるデータ量は限られています。
加えて、気象庁のHPからは海外の気象データを取得することはできません。
The Weather Companyの提供する気象データであれば、全世界の過去の気象データを4kmメッシュで取得でき、最大30年以上前のデータも取得可能です。
また、15日間先の気象予報も1kmメッシュ、1時間単位で取得可能で、第三者機関から世界一の予報精度という評価をいただいています。
・特定地点の観測データが欲しい
・一度に長期間の過去データを取得したい
・海外の気象データが欲しい
という人はThe Weather Companyの気象データセットをぜひ検討してみてください。
次回の身近な疑問をヒモトク#03はIBM盛武さんが「What-if」について執筆されます。3月22日に公開予定です。また、並行連載中のブログで学ぶSPSS Modeler#03はIBM山下さんが「名寄せ」を題材にしてくださいます。3月7日を予定しています。どちらもお楽しみに。
→これまでのSPSS Modeler ブログ連載のバックナンバーはこちらから
西川 貴久
日本アイ・ビー・エム株式会社
The Weather Company Asia Pacific Forecast Center
Senior Meteorologist
データ分析者達の教訓 #22- 予測モデルはビジネスの文脈で語られ初めてインパクトを持つ
Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...
皆さんこんにちは。IBMの坂本です。 SPSSを含むデータサイエンス製品の技術を担当しています。 このリレー連載ブログはSPSS Modelerの実際のユーザーで第一線で活躍するデータ分析者に、データ活用を ...続きを読む
Women in Data Science Tokyo @ IBM 2024 開催レポート
Data Science and AI, IBM Data and AI
こんにちは。IBM西戸です。 今年で5回目のWomen in Data Science (WiDS) Tokyo @ IBM が2024年6月14日に初の会場とオンラインのハイブリッド開催されました。会場は2024年2月 ...続きを読む
法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティー」 | インサイド・PwDA+7(後編)
Data Science and AI, IBM Sustainability Software
日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 前編での法務・AI ...続きを読む