監視への一元化されたアプローチが必要な理由

監視 (オブザーバビリティとも呼ばれる) には、ソースからのデータを経時的に収集および分析して、その正常性やパフォーマンスを追跡することが含まれます。 変化は時間の経過とともに発生するため、実質的にすべての監視データは時系列データです。つまり、タイムスタンプがあります。 したがって、データの監視について話すときは、デフォルトで時系列データについて話していることになります。

1 つの組織内に複数のチームがあり、それぞれが独自の監視ソリューションを持っていることがよくあります。 たとえば、監視データをリレーショナル データベースに格納するものもあれば、この種の時系列データにより適したもの (時系列データベース) を使用するものもあります。 同じ組織内であっても、一部のチームが他のチームよりも効果的なツールを使用しているという事実は、組織のサイロの問題を物語っています。

これらは通常、組織構造と、組織内で投資承認がどのように行われるかを反映しています。 ただし、この確立された方法では、調達と展開のコストから余分なオーバーヘッドが発生し、データ自体を操作するときに非効率性が生じる可能性があります。

監視データを使用するチームまたは役割ごとに要件が異なるため、データ自体が資産になります。 しかし、関係者はデータから価値を得るためにデータを分析する必要があります。 製造工場の原材料などのデータを他の用途に再利用および転用することから得られる追加の洞察は、さらに多くの価値を生み出します。 あるチームが独自のソリューションにデータを保存すると、その組織内の他のすべてのチームの機能が制限されます。

収集されたデータを最大限に活用しながら、すべての監視データ ユーザーのニーズにタイムリーに対応するために、エンジニアリング チームは、「サービスとしてのメトリクス」モデルを使用した集中型の監視アプローチを採用しています。

サービスとしてのメトリクス (MaaS) は、組織のデータ管理へのアプローチであり、企業が監視データを中央の場所に保存して、さまざまな利害関係者が簡単にアクセスできるようにします。 組織全体に監視データをプロビジョニングする標準モデルを使用すると、さまざまなチームが共通のインフラストラクチャを使用して、収集されたデータから最大の価値を引き出すことができます。 このアプローチは、サイロやベンダー ロックインを回避し、より優れた投資収益率 (ROI) を提供し、人々を解放してより価値の高いタスクに取り組めるようにします。

データ利害関係者の監視

MaaS ソリューションを構築するには、利害関係者が誰で、モニタリング データをどのように使用しているかを理解することが重要です。 通常、この種のデータを扱う主要なグループを少なくとも 3 つ特定できます。

ITオペレーション

これらのユーザーは、本番環境の安定性、可用性、および信頼性に関心があります。 そのため、リソースの消費を可視化し、システムの正常性とステータスを監視し、診断データを使用して迅速な復旧を行うことが重要です。 監視データはさまざまなソースから取得され、基盤となるコンピューティングおよびネットワーク インフラストラクチャが機能し、そこで実行されているアプリケーションのニーズに対応していることを確認します。

IT 運用の監視に関する主な懸念事項には、リソースの状態と次の状態が含まれますが、これらに限定されません。

  • 物理デバイス、オペレーティング システム、および仮想マシン
  • コンテナ化されたサービスのコンテナとオーケストレーション
  • ネットワークとメッシュ サービス

アプリケーション開発者

このユーザー グループは、主に俊敏性とパフォーマンスに重点を置いています。 これらの分野で洞察を得るために、開発者は、システム間およびシステム内の可観測性、トレース、およびエンドツーエンドのエクスペリエンスに関連する詳細なデータを必要とします。

アプリ開発者の懸念事項には、次のようなものがあります。

  • アプリケーションとその依存関係の効率性
  • 新しいコードが利用可能になるまでにかかる時間
  • 問題の根本原因を見つけて、機能状態を復元する速度

コードを制御することで、開発者はアプリケーションのカスタム メトリックを簡単に公開し、イベントをプッシュし、ログを生成し、遅延をトレースして、観察のニーズを満たすことができます。 公開されると、開発者はそのデータを取り込み、視覚化し、分析し、保存する方法を必要とします。これには、高性能の書き込みと読み取りが必要です。 開発者はこのデータを使用して、変更の失敗率を最小限に抑えた効果的なソリューションを構築します。

ビジネスマネージャー

このグループの人々は、利益と成長に影響を与える傾向を発見し、効率と有効性を改善する機会を見つけようとします。 これを達成するために、ビジネス マネージャーとデータ エンジニアは、トランザクションのダイナミクスと成功率、ユーザー アクティビティ、ビジネス成果を、他のビジネス ディメンションと相関させて監視することに依存しています。

成功の測定は、重要業績評価指標 (KPI) に依存します。KPI は、関係者に物事がどの程度うまく機能しているかを知らせ、より良い結果を達成する方法を明らかにすることさえできます。 フィード KPI への入力を生成するには、測定値と複数のデータ ソースにわたって相関、集計、合計、および操作を実行する高度な分析が必要です。 さまざまな要因を組み合わせてデータを処理することは、ビジネス指標に影響を与えるシステムの複雑さを反映し、より全体像を示します。

全体的な目標は、ビジネスの成長を前向きに保ち、サービス レベル アグリーメント (SLA) とサービス レベル目標 (SLO) を抑えることです。

Metrics as a Service オファリングの構築

これらの各役割には、データの監視に関するさまざまな要件がありますが、アプリケーションをサポートするインフラストラクチャから、実際のアプリケーションの機能、それらのアプリケーションのエンド ユーザーの結果まで、それらの組み合わせのニーズがどのようにスペクトル全体をカバーしているかがわかります。 すべてが関連しているため、各グループの監視データが他のグループに影響を与えるのは当然です。

この相互接続性こそが、MaaS ソリューションが理にかなっている理由です。 このモデルの魅力の 1 つは、監視に関連するコストを、企業が収益化できる情報への投資に変えることです。

これは、サイロ化された、コストがサンクされた監視ソリューションに対する、焦点を絞った予算承認の古いモデルからの大きな飛躍を表しています。 Metrics as a Service モデルは、これらのさまざまなグループすべてに影響を与えるため、その可能性を最大限に引き出すには、ポイント ソリューションで効果的に実装することはできません。 専用の時系列プラットフォームのスケーラビリティ、パフォーマンス、および機能が必要です。

Metrics as a Service ソリューションは、データ収集から始まります。 あらゆるソースからデータを収集でき、プッシュとプルの両方の方法をサポートできる必要があります。 Telegraf のようなオープン ソースのデータ収集エージェントには何百ものプラグインがあるため、事実上あらゆるデータ ソースを処理できます。

Telegraf は軽量のツールであるため、従来のインフラストラクチャだけでなく、エッジ デバイスやコンテナーや仮想マシンでも実行できます。 この柔軟性により、監視関係者のさまざまなニーズに最適です。

収集されたデータはどこかに移動する必要があり、このデータを保存するために使用する最適なツールは時系列データベースです。 InfluxDB のような専用の時系列データベースは、セルフマネージド クラウドやフル マネージド クラウドなど、複数の展開オプションを提供します。 Telegraf とシームレスに統合して、効率的で耐久性があり信頼できるデータ パイプラインを作成します。

同様に重要な点として、InfluxDB は Telegraf を使用して幅広い宛先ソースにデータを出力できます。また、HTTP エンドポイントを公開して、データベース内に格納されたデータに幅広いユーザーがアクセスできるようにします。

これら 2 つのツールを使用すると、各グループは独自の Telegraf インスタンスをセットアップして、必要なデータを収集し、それを InfluxDB インスタンスの個別のデータ バケットに送信できます。 このアプローチにより、各グループは InfluxDB プラットフォーム内に分離されたデータ パイプラインを作成できますが、すべてが InfluxDB に格納されるため、ユーザーはアクセスできる任意のバケットからデータをクエリできます。

データから価値を生み出す

Metrics as a Service モデルは、データの集中化を超えた変化をもたらします。 監視データを、戦術的および状況に応じた意思決定プロセスから、組織の戦略計画レベルに移行します。 この変化は、管理者、プロバイダー、および消費者が監視データを表示する方法に根本的に影響を与えます。

  • キング: これは、ビジネス パフォーマンスへの影響に基づいて、データの価値を定量化する機能です。 この分野での潜在的な成果は、IT をプロフィット センターに変える機会です。
  • 説明責任: リクエストを監視するための ROI アプローチに合わせて、データ消費の可視性を追加しました。

利害関係者は、監視データをよりよく理解し、そこから洞察と価値を引き出すために、監視データを処理、分析、視覚化する必要があります。 InfluxDB は、SQL や Flux lang (InfluxDB のネイティブ スクリプト言語) など、データをクエリするための複数のオプションを提供します。

InfluxDB にはネイティブのダッシュボード ツールと視覚化ツールがありますが、ユーザーは、Grafana などのツールとサードパーティの統合を利用して視覚化を作成することもできます。 このプラットフォームは、ユーザーがデータをきめ細かく制御し、プラットフォームの機能を他のアプリケーションやシステムに拡張する柔軟性を提供する RESTful API も提供します。

結論

これは、時系列プラットフォームを使用して Metrics as a Service ソリューションを構築する場合の氷山の一角にすぎません。 しかし、幅広いフレームワークとして、このアプローチは業種やユースケース全体に当てはまります。 専用の時系列プラットフォームを活用して重要な時系列データを処理すると、データから価値を生み出すプロセスが簡素化されるため、すべての利害関係者にメリットがあります。

さらに、InfluxDB などのオープン ソースに基づくプラットフォームは、組織全体で監視ソリューションを統合する費用対効果の高い方法を提供します。 InfluxDB のようなプラットフォームの柔軟性は、データを一元化するプロセスを簡素化し、部門間のコラボレーションとイノベーションを促進し、データ アクセスを民主化して、主要な利害関係者が組織に利益をもたらす意思決定に必要な情報を入手できるようにします。

グループ スケッチで作成。

Leave a Comment

Your email address will not be published. Required fields are marked *