Client Engineering
Kaggle形式分析コンペ @日立 協創の森から(データサイエンティスト技術交流会)
2023年03月23日
記事をシェアする:
「悔しい…。最初は軽い気持ちで参加したけれど、やっぱりコンペが始まったらすっかり本気になっていた。次の機会に絶対リベンジしたい!」
「レベル高すぎますよ! これで勝てないなんて…。まあでも、普段とはまったく違うやり方を体験できたのは、自分の今後のキャリアにも良い影響を与えてくれると思います。」
「合格発表を待っているような気分だったけど、自分たちが優勝との発表を聞いて一気に疲れが吹き飛びました。やったー!」
あなたがデータサイエンスに興味を持っていれば、おそらくは「Kaggle(カグル)」というAIコンペティション(競技会)、あるいはデータ分析のプラットフォームの名前は聞いたことがあるだろう。もしかしたら、すでにユーザー登録を済ませこれまでに何度か競技会に参加しているかも。いやひょっとしたら、世界ランキングに名を連ねているという人も中にはいるかも…?
なにしろ、Kaggleは世界で最も有名で、登録ユーザー数もすでに1000万人は優に超えているという、世界最大のAI競技会プラットフォームだ。
そのKaggleと同様の分析コンペティション形式を用いた、日立製作所と日本IBMの技術交流会が、日立の研究開発拠点「協創の森」で先日行われた。
2社の本格的な技術交流会は今回がまだ2回目で、「両社が共に学び合うこと」を目的としていることから、今回は直接的な「日立vs IBM」という形式を避け、両社から2名ずつ、計4名からなるデータサイエンティストとデータ・エンジニアから成る3つのチームの対抗戦として約7時間のスプリント競技会の形式で実施された。
実行準備チーム内では「混成チームとしてしまうと和気あいあいとし過ぎてしまうのではないか。勝負に身が入らないのでは技術交流にならないのではないか?」という声もあったというが、冒頭で紹介した声をお読みいただけば、それが懸念であったことは明らかだろう。
実際の分析コンペティションは、以下の要領で行われた。
Kaggle形式分析コンペ課題概要
インターネットに接続され、サイバーフィジカルシステム(CPS)を実装する、浄水工場に対してのサイバー攻撃判別システムの構築。具体的には下記3要件を満たすモデルの構築。
- サイバー攻撃をリアルタイム判別
- 複数種類の攻撃について発生検知
- サイバー攻撃の種類を判別できる
上記課題にあるCPSとは、「物理世界(フィジカル空間)で収集されたビッグデータを、仮想世界(サイバー空間)に蓄積して分析・予測・分類などを行い、物理世界へフィードバックして活用・価値創造を行う」こと。そして今回の「サイバー攻撃判別モデル」作成に使用されるデータは、研究用に収集されたものだ。
そしてこの課題の真の目的は「より安全・堅牢なCPSの実現」に貢献することだ。課題の「浄水工場」は一例であり、自動運転や交通機関の運行最適化など、実社会においてCPS実装が暮らしの中のさまざまな場面で進む中、「より安全・堅牢なCPSの実現」が意味するのは「より安全・堅牢な現実世界」に他ならない。
「悪意ある攻撃の迅速な検知・判別」は、以下観点から私たちの日常生活を守るのである。
- サイバー攻撃をリアルタイム判別 → 攻撃を即座に判別し、社会への影響を未然に防ぐ
- 複数種類の攻撃について発生検知 → 多様な攻撃についても判別できる
- サイバー攻撃の種類を判別できる → アラートを受けた管理者の適切な判断を支援する
Kaggle形式分析コンペの様子と最終結果
「それでは皆さん、作業をスタートしてください。」
今回のコンペティションにおけるルールや使用できるデータ種別や取り扱い可能範囲など、攻撃判別モデル構築上のレギュレーション説明の後、上記の掛け声でスプリント競技会はスタートした。
合計12名のデータスペシャリストたちは、3チームそれぞれがチーム戦略とその進め方について言葉を交わし手短に打ち合わせを行うと、すぐに作業を進めていった。
スプリントの多くの時間が黙々と作業に充てられる中、時おりどよめきや歓声が上がる。それは決まって、それぞれのチームがその時点におけるサイバー攻撃判別モデルを途中経過として提出し、それが採点されスコアとともにチームの順位が発表されるときだ。
「えー、どうしてこれしか精度が上がらないんだ!?」
「やっぱりオーバーフィッティングだったってことだよね、この結果は。」
「きたーっ!」
一通りの盛り上がりの後、すぐにチームは作業へと戻っていく。
予測結果提出と採点スコア表示が何度か繰り返されながら、各チームはモデル精度向上施策を積み上げていき、ついにワーク終了と最終提出期限の17時となった。
そして最終順位が発表され、表彰式、優勝チームによる解法発表、交流会総評の言葉でこの日の共創イベントは幕を閉じた。
参加者&主催チームのコメント
ここからは、表彰式前後に聞いた参加者の声とランダムに、そして今回の日立製作所と日本IBMの技術交流会を企画したチームの言葉を紹介する。
参加者Aさん(IBM): 私が参加しているIBMのプロジェクトでは、データサイエンティストは1〜2名ということが多いんです。なので今日のように、こうして4人でチームを組み、それぞれのアプローチや取り組み方の違いを直接目にして会話できる機会はとても貴重だし、なによりも楽しかったです!
参加者Bさん(日立): 私はAさんと逆で、参画しているプロジェクトにデータサイエンティストが多数いて、自分の役割がはっきりしないと感じることもあったんです。でも今回、役割分担を明確にして取り組むことの意義と強みを明確に感じることができました。この経験は業務にも活かせそうです。
参加者Cさん(IBM): 別の会社のデータサイエンティストと一緒に分析作業を行うことなんてめったにないことで、それ自体が貴重な経験でした。今回は短期決戦でしたが今後はもう少し長い期間でのコンペにして、より多面的な戦術とそれを可能にする深いコミュニケーションが取れたらもっと良い技術研鑽になりそうな気もしています。とはいえ、今日の経験はモチベーションアップに間違いなくつながりましたね。またこういう機会があれば参加したいです!
参加者Dさん(日立): 普段、限られた顔ぶれの中で仕事をしていると、どうしても「常識が狭くなっていく」感覚がありました。そんな中で新しい人たちと新しいアプローチで共同作業をすることが、自分の世界が拡がるのを感じました。またキャリアについても、自社内で考えたり相談したりするだけではなく、今後は「仲間」として社外の人にも相談できるようになりました。これは自分にとってはとても心強いことです。
企画チームEさん(IBM): 一口に「データサイエンティスト」と言っても、人それぞれでその強みは異なります。そしてまた、IBMには出身国や業務経験が多様なデータサイエンティストが揃っており、それもあってアプローチの取り方も本当に多様です。その多様性が自分たちの個性であり強みであることを、参加者は今日それを改めて実感できたんじゃないかと思います。また、次回が楽しみです。
企画チームFさん(日立): 日立グループには数千人のデータサイエンティストがいますが、それでもグループの全社員数から見れば、まだまだマイノリティであり、社内におけるプレゼンスを上げていく必要があると感じています。今日のような取り組みが社内外に伝わっていくことで、「社会課題解決」にデータサイエンティストがどれだけ重要な役割を担っているか、それをもっと知ってもらえるといいですね。
最後に、今回の企画の後援者である日本IBM テクノロジー事業本部 クライアント・エンジニアリンング事業部担当 執行役員 村澤 賢一のメッセージを紹介する。今後同様の企画に興味をお持ちの方は、ぜひご連絡いただきたい。
交流会の企画自体も今日の課題設定も、本当にとても良かった。参加者関係者すべての人にとってよい1日になったのではないでしょうか。
現代に残された社会課題の多くは、業界内外を問わずに手をつなぎ共創していかなくては取り組めない規模となっています。その中でも、データサイエンティストは「OT」と呼ばれる現場の設備・機器からのデータを、「IT」のど真ん中で受け止め、柔らかくつなぎ合わせていく実践者たちであり、彼らの活躍がそのまま社会生活の質としなやかさに直結するものです。
今日は、私たちIBM Client Engineering事業部のデータサイエンティストたちが日立様の胸をお借りさせていただき、とても良い経験ができました。そして今後も、日立様との2社間に閉じることなく、共に正面から社会課題に立ち向かおうという同じ志を持つ企業の方たちと、より広く強く柔軟に手をつないでいきたいと考えています。技術交流や研鑽会にご興味をお持ちの方にはぜひお気軽に連絡いただきたいですね。
TEXT 八木橋パチ
問い合わせ情報
この記事を読んだあなたへのおすすめ
企業の垣根を越えて:生成AI活用アイデアソンをトヨタファイナンス様とIBMが共同開催
Client Engineering
トヨタファイナンス株式会社IT本部イノベーション開発部部長の松原様の呼びかけにより4社のITベンダーが参加した生成AIアイデアソンが10月7日に開催し、成功裏に幕を閉じました。 ~トヨタファイ ...続きを読む
「第2回ベジロジサミット」レポート後編 | ベジロジシステム討論会
IBM Partner Ecosystem, IBM Sustainability Software
ベジロジ倉庫とベジロジトラック、そしてキャベツ食べ比べを中心にご紹介した「第2回ベジロジサミット」レポート前編に続き、ここからは第二部、場所を屋内に移して開催されたベジロジシステム討論会の様子をご紹介します。 目次 前編 ...続きを読む
「第2回ベジロジサミット」レポート前編 | レタスの食べ比べとベジロジ倉庫・トラック
IBM Partner Ecosystem, IBM Sustainability Software
「佐久地域は葉洋菜類の一大産地であり、産地の生産を守ることは日本の食を守ることです。主体的に取り組んでいきます。ただ、青果物の取り組みは特に困難な要素が多く、物流業界でも取り組みが進んでいない分野です。そんな中で、持ち前 ...続きを読む