IBM Storage

個人情報との戦い

記事をシェアする:

コンプラ対策、機密情報管理、GDPR…データ検索に苦悩するエンジニア

「個人情報を含んだ画像と動画って、どうやって探せばいいのォォォォ〜!」

出典:エドヴァルド・ムンク「叫び」

#名画で学ぶストレージ

#情シスあるある

今回解説するのは私、「たけだ」です。

料理とロボットガジェットが大好きなストレージ名画ギャラリーのオーナー。Myダッチオーブンで作った本格料理の味は芸術の域。

一言:「芸術を理解するAIロボットを創りたいわ」

大切なのに、どこにあるのかわからない個人情報

コンプライアンス的に重要なデータやGDPRにかかわる個人情報、そして企業の機密情報など、セキュアな情報が増え続けているにも関わらず、実はどこにどの情報があるのか把握しきれていない…?しーっ!そんなこと言っちゃ、監査で引っかかっちゃいますよー!

「データが増えすぎて、何がどこにあるのかわからない」のは、データサイエンティストや情シス部のみなさんの隠された共通の悩み。このエドヴァルド・ムンクの名画「叫び」は、まさしく「機密情報を守り、監査対策に追われ、GDPR対応まで求められるエンジニアの叫び」を描いたものです。深刻だけど、日々増え続ける大量のデータや非構造化データをきちんと管理するのなんて無理ゲーと感じている方は多いのではないでしょうか。

 

データが大量すぎて、必要なデータが見つからない…

あふれかえるデータの中から個人情報やセキュア情報が含まれているもの、そして本来の業務である分析に必要なデータを探し出す方法としては、ファイルの作成日や最終更新日時、ファイルの保管場所などを条件に検索するのが一般的。ただ、データのシステム属性だけに頼った検索では、「欲しいと思うデータの検索条件」をピンポイントで設定できるとは限りません。非構造化データをOCRでテキスト化して検索をかける手段もありますが、今ひとつ正確性に欠けます。あぁ、こうして瞬く間に帰社の時間。最終的には精度の低いデータ結果を「えいや!」で出すしかなさそうです。

専用ツールでデータ管理すれば、安心♪

IBMの「IBM Spectrum Discover」は、データにタグを付けてカタログ化できる製品です。タグにはメタデータを利用できるので、大量かつ分散してしまいがちなセキュアデータや個人情報、コンプライアンス上重要なデータなどの効率的な管理を実現します。

IBMのストレージはもちろん 業界シェアトップのAmazon Web Services (AWS)をはじめとして主流ストレージシステムに対応しているため、幅広く活用できるのが嬉しいポイント。さらに仮想ストレージとしてシンプルにデプロイできて、データの自動インデックスなど、システム運用やデータ最適化も可能です。また、わかりやすいダッシュボードによる操作、見やすいレポートの提供などで、大量のデータと格闘する毎日をサポートします。

監査に必要なデータやGDPR対応のための個人情報、自社の機密情報など「重要なのに分散してしまいがちなデータ」には、タグを付与してラクラク管理。AIで画像を分析・抽出したデータにタグを付けることもできますよ。タグの使い方は無限大、あなた次第♪ビックデータを扱うデータサイエンティストや情シス部のみなさん、簡単データ管理で本来のデータ分析業務に集中できる環境を手に入れてくださいな♪


Chie Takeda

More IBM Storage stories

実用規模のワークロードで量子回路の深さを削減するフラクショナル・ゲート

フラクショナル・ゲートは、実用規模の実験の効率を向上するのに役立つ新しいタイプの量子論理ゲートです。     IBM® は、IBM Quantum Heron™ QPUに新しい種類の量子論理ゲートを導 […]

さらに読む

量子スピン鎖の大規模シミュレーションを行う量子アルゴリズム

Stony Brook大学の研究者は、計算能力の限界を押し進めて実用規模のスピン鎖シミュレーションを可能にするために、さまざまな量子シミュレーション手法を組み合わせて改良しています。   量子計算の起こりがいつ […]

さらに読む

基底状態問題について量子優位性の発見に役立つ評価指標

さまざまな計算手法の基底状態問題を解く能力を評価するのに役立つ指標を定義する論文が、新たに Scienceで発表されました。     量子優位性の発見は、今日の量子計算研究において重要な側面になってい […]

さらに読む