IBM Cloud Blog

クラウドネイティブ環境の運用監視に「Instana」はどう効くのか? 日鉄ソリューションズ様が大規模コンテナ環境で実践中!

記事をシェアする:

企業のデジタル変革を加速する各種のサービスをアジリティー高く開発し、マイクロサービスなどで効率的に運用していくための基盤として、コンテナ技術の普及が進んでいます。そのコンテナやマイクロサービスなどで構成されるクラウドネイティブ環境では、高頻度のサービス・リリースや障害からの自動復旧などによって頻繁かつ動的に構成が変わり、多数のサービスが相互連携することでシステム全体の動作状況が極めて複雑化します。「この環境をしっかりと監視して安定運用していくためには、従来と同じツール/アプローチでは難しい」と考えた日鉄ソリューションズ株式会社様(以下、NSSOL)は、コンテナ技術を駆使した同社の大規模開発プラットフォーム「Tetralink(テトラリンク)」の監視基盤として「IBM Observability by Instana APM」の活用を決断。1,500以上のコンテナが稼働するTetralinkの運用監視の効率化を実現しました。同社はどのような理由でInstanaを選び、活用によりどういった効果を得ているのかを選定/活用のご担当者に伺いました。

<目次>

クラウドネイティブ環境のメリットがもたらす新たな“監視”の課題
複雑なクラウドネイティブ環境を自律的に理解して監視を行うInstanaを選定
大規模開発プラットフォームの監視ツールとしてInstanaを採用
Instanaによる監視基盤を構築。新旧並行稼働で大規模バージョンアップもスムーズに
1,500超のコンテナが動くプラットフォームの運用監視をInstanaで効率化。見えてきた魅力とは?
クラウドネイティブ環境のダッシュボードに。仮想マシンや基幹システムの監視でも有効

クラウドネイティブ環境のメリットがもたらす新たな“監視”の課題

多くの企業がデジタル変革(DX)推進の一環としてコンテナ技術やマイクロサービス・アーキテクチャーの活用を進めるのに伴い、これらの技術を用いたクラウドネイティブ環境の“監視”をいかに行うかが大きな課題として浮上しています。

NSSOLの競争力の源泉として先端技術の研究/調査を行い、その成果を事業部門を通じて顧客への提案や開発プロジェクトにフィードバックしているシステム研究開発センターの相原 慎司氏は、クラウドネイティブ環境における監視の課題は、同環境がもたらすメリットとのトレードオフとして生じるものだと説明します。

相原 慎司

相原 慎司氏

日鉄ソリューションズ 技術本部 システム研究開発センター サービス&システムデザイン研究部(当時)
(現:流通・サービスソリューション事業本部 アドバンストテクノロジー部)

「一般に、クラウドネイティブのメリットは大きく3つ挙げられます。1つはCI/CD(継続的インテグレーション/継続的デリバリー)を駆使した頻繁なサービス・リリースにより、ビジネス・アイデアを素早く試しながらアジリティーの高い開発が行えること。2つ目は、システムの負荷に応じてオートスケールしたり、障害から自動復旧したりする能力を備えていること。3つ目は、マイクロサービス・アーキテクチャーなどのAPIを介した連携によってサービス間が疎結合されることで変更が容易となり、開発スピードを高められることです」(相原氏)

これらのメリットとのトレードオフとして、クラウドネイティブ環境では従来型システムの運用監視とは異なる課題が生じるのです。

「従来型のシステムでは、運用担当者がシステムの構成やコンポーネント間の通信経路をきちんと理解したうえで管理やトラブルシューティングを行います。一方、クラウドネイティブなシステムでは高頻度のサービス・リリースや自動復旧によって構成が頻繁に変わり、マイクロサービス間で相互にさまざまな通信が行われて通信フローが複雑化することで、人がシステムの状況を把握しきれなくなります。そのため、ツールによる支援がなければ運用が成り立たなくなるのです」(相原氏)

また、この課題に対して、従来から利用されてきた監視ツールは大きく機能が不足していると相原氏は付け加えます。

「従来の監視ツールは、エージェントをインストールした後、監視用の構成や設定を手作業で行うものが大半です。そのようなツールをクラウドネイティブな環境に適用した場合、頻繁に発生する構成変更や設定変更の都度、手作業で構成や設定を修正して適用しなければなりません。監視担当者が設定変更にかかりきりとなり、やがてはそこがボトルネックとなってアジリティーや運用コストの面で問題が生じるでしょう」(相原氏)

さらに言えば、従来の監視ツールはCPUやメモリー使用率のモニタリングは行えるものの、マイクロサービス間の通信状況を捕捉する機能を備えたものはほとんどありません。各サービスのメトリクスは見られても、サービスをまたいだリクエスト処理で障害が発生した際、どこが問題なのかを通信経路を遡ってトラブルシュートすることはできないのです。

複雑なクラウドネイティブ環境を自律的に理解して監視を行うInstanaを選定

システム研究開発センターでは、今後これらの課題に対応したクラウドネイティブ環境向けの監視ツールがNSSOLの開発業務でも必要になると考え、次のような要件を掲げてツールの選定を行いました。

要件1:頻繁に構成変更が生じるシステムに対して、できるだけ監視用の構成や設定の負担を抑えながら迅速に対応できること
要件2:マイクロサービスのように複雑な通信処理を行うサービスに対して、サービス間の呼び出しがどのような経路で行われたかを追跡するなど、トラブルシュートに役立つ機能を備えていること

クラウドネイティブに対応した主要な監視ツールを比較検討した末、最も優れたツールとして選んだのが、複雑なシステム環境についての“可観測性(Observability)”を提供するIBM Observability by Instana APMです。

他のツールと比較してInstanaが優れている点の1つは、刻一刻と変わるクラウドネイティブなシステムの構成を自律的に理解し、監視用エージェントを配布するだけで必要なセンサーを自動的に構成して適切な監視設定を適用してくれる点だと相原氏は説明します。

「例えば、KubernetesやRed Hat OpenShiftによるコンテナ環境全体の構成や、サーバー上で動作しているミドルウェアなどを自動的に把握し、それぞれに必要な監視設定を適用してシステム環境全体を適切にモニタリングできるようにしてくれます」(相原氏)

取得したデータの分析/可視化機能が優れていることも特徴です。例えば、KubernetesやOpenShiftによるコンテナ環境は、クラスターのノード単位、ネームスペースという論理的な単位、そしてポッドやコンテナなど、内部に複数のレイヤーを持ちます。「Instanaは、それらのレイヤーを認識して、人が理解しやすいかたちで構成情報を表示してくれます。リソース使用量や分析結果もレイヤーごとにまとめて表示してくれるので、キャパシティー管理に使うことも可能です」と相原氏は話します。

また、Instanaはマイクロサービス間の通信を捕捉する分散トレーシング機能を実装しており、マイクロサービスの複雑な動作状況を正確に捉えることができます。同機能で取得したデータと、コンテナ/ミドルウェアの監視で取得したデータを関連付けて障害の原因を推測する機能まで備えており、トラブルシューティングを強力に支援してくれるのです。

大規模開発プラットフォームの監視ツールとしてInstanaを採用

戸坂 央氏

戸坂 央氏

日鉄ソリューションズ
技術本部
生産技術部
アーキテクチャ&テクノロジーセンター

こうしてシステム研究センターが選定したInstanaを、実際に大規模なクラウドネイティブ環境の監視で活用しているのがTetralinkです。

Tetralinkは、顧客の開発プロジェクトを担当するNSSOLの各事業部門を支援するために、開発環境や開発支援ツールの提供などを行うアーキテクチャ&テクノロジーセンター(以下、ATEC)が2020年より提供を開始した社内向けの開発プラットフォームです。ATECの戸坂 央氏は、「アジャイル開発など、近年需要が高まっているアジリティーの高い開発をより促進していくために、セルフサービス型のプラットフォームとしてコンテナ基盤やIaaS環境を提供しています。コンテナ基盤としてOpenShiftを採用し、新型コロナ禍で需要が高まっているリモート/在宅開発や分散開発の促進に役立つ各種の開発ツール群をOpenShiftのWebコンソールでカタログとして公開しています」とTetralinkの特徴を説明します。

なお、コンテナ管理基盤にOpenShiftを採用した理由は、「長期にわたってセキュリティー・アップデートが提供されている」「エンタープライズ向けコンテナ管理基盤のデファクト・スタンダードであり、サポートや品質の面で安心して使える」ことに加えて、「コンテナ活用のハードルを下げるため」だと戸坂氏は話します。

「コンテナ技術は今後、ますます重要な技術になると予想されますが、現状は当社の多くの開発者にとっても馴染みが薄いのが実情です。OpenShiftは開発者がセルフサービスで使えるWebコンソールを備えており、CLIで使うKubernetesと比べてハードルが低く、コンテナ技術を現場に浸透させるうえで強みになると考えました」(戸坂氏)

Tetralinkでは、このOpenShiftとIaaS環境上で多くのコンテナや各種開発ツール、インスタンスが実行されています。この巨大な開発プラットフォームを安定的かつ効率的に運用していくためには、それぞれのコンテナがどのように動作しているのかを正確に可視化し、効率的な運用を支援してくれる監視ツールが不可欠です。ATECは、Tetralinkの構築に際して最適な監視ツールの提案をシステム研究開発センターに打診。推奨ツールとして紹介されたInstanaの導入を決めると、同センターの支援を受けてInstanaによるTetralinkの監視基盤をオンプレミスに構築しました。

TetralinkにおけるInstanaの利用構成

Instanaによる監視基盤を構築。新旧並行稼働で大規模バージョンアップもスムーズに

千葉 尚彬氏

千葉 尚彬氏

日鉄ソリューションズ
技術本部
システム研究開発センター サービス&システムデザイン研究部

Instanaの導入を支援したシステム研究開発センターの千葉 尚彬氏は、Tetralinkへの適用に際して行った工夫を2つ挙げます。

「1つは、Instana社のサポートと綿密なやり取りを行ったことです。今回はプロジェクト要件に合わせて当社でも事例の少ないオンプレミス構成を実現する必要がありました。そのため、一般的なSaaSプラットフォームと組み合わせる場合と比べて考慮すべき点が増え、難易度も上がります。そこでサポートと綿密なやり取りを行い、疑問点/課題点を1つずつ着実に解決していくことで、遅延なく構築を完了することができました」(千葉氏)

もう1つの工夫はバージョンアップへの対応です。InstanaはTetralinkの監視の要であることから、バージョンアップ時には極力ダウンタイムを抑え、トラブルが起きた際には迅速に元に戻せることが必要でした。そこで、新旧バージョンで動く2台の監視サーバーを並行稼働させながら切り替える方法をとりますが、この中で複数のサーバーに監視データを送るInstanaのマルチプルバックエンド機能が大きな効果を発揮します。

「この機能により、旧バージョンの監視サーバーに監視データを送ってTetralinkの監視を行いながら、新バージョンの監視サーバーの構築/テストを別途進めることが可能となりました。新バージョンによる監視サーバーの信頼性を切り替え前から十分なテストで確認しつつ、実際の切り替え時に問題が生じた際は旧バージョンの監視サーバーに即座に切り戻すのです。このアプローチで大きなバージョンアップも無事に成功させることができました」(千葉氏)

1,500超のコンテナが動くプラットフォームの運用監視をInstanaで効率化。見えてきた魅力とは?

町田 幸祐氏

町田 幸祐氏

日鉄ソリューションズ
技術本部
生産技術部
アーキテクチャ&テクノロジーセンター

Tetralinkは現在、160件以上の顧客向け開発プロジェクトを支えており、1,500以上のコンテナ、50以上の管理用サーバーが稼働する大規模なプラットフォームですが、その全てをInstanaの管理対象とすることで効率的な運用監視を実現しているとATECの町田 幸祐氏は話します。

「Tetralinkでは大量のコンテナを実行していますが、OpenShiftのクラスターを構成するノード群の状態や、各プロジェクトにおけるポッド、サービスなどのリソースの基本情報をはじめとするさまざまな情報をInstanaが自動的に取得して可視化してくれるため、運用監視が効率的に行えます」(町田氏)

Instana画面イメージ

また、これらの情報の中から重要なアラートや異常値を検出した際には管理者に通知されるほか、コンテナが特定のログを出力した際に異常ケースとして通知するといったログ・パターンに基づくアラートも設定することが可能です。

設定のしやすさも監視業務の効率化に寄与しています。Tetralinkのように巨大で複雑なプラットフォームでは、クラスターの規模が拡大したり、新たに管理用サーバーを立ち上げたりといった具合に構成が頻繁に変化します。その環境の全体をInstanaで監視していれば、「新たにサーバーを立ち上げた際にはInstanaのエージェントを配布する」という定型的な作業で監視を開始できるため、規模や構成、監視対象の変化に対応しやすいというメリットが得られます。

さらに、監視用の画面が直感的な操作で扱えること、機能強化のために頻繁に行われるバージョンアップが容易であることのほか、仮想マシンのインスタンス管理にも対応しており、インスタンスに直接ログインしなくてもInstana上で基本的なメトリクスを全て見られることも大きな利点だと町田氏は話します。

「コンテナと仮想マシンの両方に対して『エージェントを入れてデータを取る』という同じ仕組みで運用監視を行い、同じ画面でアクセスして、同じAPIでデータを取得できるので、コンテナと仮想マシンが混在したプラットフォームであってもInstana 1つで一気通貫して管理できることも大きな魅力です」(町田氏)

クラウドネイティブ環境のダッシュボードに。仮想マシンや基幹システムの監視でも有効

このようにさまざまな機能を備えたInstanaをダッシュボードとして使うことで、稼働しているコンテナの状態や仮想マシンのリソース使用状況などの情報をInstanaが自動的に収集してわかりやすく可視化してくれるので、コンテナ基盤全体の状況を容易に把握できるようになります。

また、充実したAPIを生かした活用法もあると町田氏はアドバイスします。

「InstanaはGUIでさまざまな情報を見られるだけでなく、APIも大変充実しています。その特徴を生かし、Instanaを情報ソースにして何らかのレポーティングを行う場合や、Instanaに対して定型的な設定変更作業などを行う場合に、APIを使ってそれらの作業を自動化することで、さらなる効率化を図ることができます」(町田氏)

一方、相原氏は「まだコンテナは導入していないが、多くの仮想マシンを運用している」という企業にも活用を勧めたいと話します。

「すでにInstanaを導入されているお客様の中には、仮想マシンで組んだシステムの監視に使われているところもあります。仮想マシンによるシステム環境も、規模が大きくなれば構成の把握が難しくなります。そこで、Instanaを使って仮想マシン上のサーバーで動くミドルウェアの情報を自動的に取得して監視を行わせるのです。この機能は従来型の基幹システムに対しても有効です」(相原氏)

NSSOLでは、今後もTetralinkでの活用を通じてInstanaのノウハウを研究/蓄積し、その成果をInstanaとともに各業界のお客様にも提供していく考えです。

NSSOL、Tetralinkは日鉄ソリューションズ株式会社の登録商標です。

関連リンク


More IBM Cloud Blog stories

セキュリティー・ロードマップ

IBM Cloud Blog

統合脅威管理、耐量子暗号化、半導体イノベーションにより、分散されているマルチクラウド環境が保護されます。 2023 安全な基盤モデルを活用した統合脅威管理により、価値の高い資産を保護 2023年には、統合された脅威管理と ...続きを読む


量子ロードマップ

IBM Cloud Blog

コンピューティングの未来はクォンタム・セントリックです。 2023 量子コンピューティングの並列化を導入 2023年は、Qiskit Runtimeに並列化を導入し、量子ワークフローの速度が向上する年になります。 お客様 ...続きを読む


ハイブリッドクラウド・ロードマップ

IBM Cloud Blog

コンポーザブルなアプリケーション、サービス、インフラストラクチャーにより、企業は複数のクラウドにまたがるダイナミックで信頼性の高い仮想コンピューティング環境の作成が可能になり、開発と運用をシンプルに行えるようになります。 ...続きを読む