Dbt Labs がセマンティック レイヤーを起動してメトリクス定義を一元化

  • Dbt Labs は、アナリストが企業データをレビューする方法を合理化するための新しいツールを立ち上げています。
  • セマンティック レイヤーは、重要な企業指標を再定義することを避けるために、一元化された場所を作成します。
  • 42 億ドルのスタートアップである Dbt Labs は、静かにデータの世界で最も影響力のある企業の 1 つになりました。

42 億ドル規模のスタートアップ Dbt Labs は、Snowflake や Databricks などのツールを使用して企業がデータを分析する方法を再構築する重要な触媒の 1 つに静かに成長しました。

開発者ツールキットではすでにどこにでもあり、「カルトのような」支持を誇っている Dbt Labs は、ユーザーの行動から収集しているすべてのデータを理解しようとする企業にとって、ミッション クリティカルなツールになることを目指しています。 同社は現在、セマンティック レイヤーと Python プログラミング言語のサポートという 2 つの新しい開発者ツールを使用して、企業が自社のデータを分析する方法にさらに溶け込もうとしています。

「企業がデータを使用する長期的な方法は、変化に向かっていると思います。それは驚くべきことではありません。それが真実でなければ、現代のデータ スタックには興味深いものは何もないでしょう」と、Dbt Labs の CEO である Tristan Handy は Insider に語った。 「長い間、企業としての私たちの見解は、データを分析するための唯一の正しい方法は存在しないというものでした。実際、それはモデリング層に対する私たちの見解とは大きく異なります。」

同社はまた、ライバルの Databricks と Snowflake の両方が投資し、データの相互運用性の将来の重要な部分と見なしている数少ない企業の 1 つです。

Dbt のセマンティック レイヤーは、企業がビジネスのパフォーマンスを追跡するために必要なメトリック定義の中央リポジトリを作成します。 これらの定義は、収益、特定の製品の顧客数、またはその他の重要なデータにまで及びます。 社内の誰かがそれを必要とするたびに各メトリックを再構築するのではなく、レポートなど、あらゆる形式で使用するときに、アクセスするすべての人が主要なメトリックの同じ定義を使用するように成文化します。

Dbt の Semantic Layer のような製品は、組織のさまざまな部分でさまざまなバリエーションの主要な企業指標を使用する可能性がある潜在的な混乱の層を取り除きます。 1 日のアクティブ ユーザー数などの重要な指標の会社のコード化されたバージョンを使用していない場合、予測が不正確になったり、機械学習ツールが混乱したりする可能性があります。

セマンティック層

Dbt ラボ



業界関係者は、Dbt が LookML (Google が所有する Looker 独自のデータ分析ツールで使用されるプログラミング言語) の柔軟性とパワーを備えているが、Looker 以外のものを含むすべてのビジネス インテリジェンス ツールに適用可能であると見なすことがよくあります。 多くの場合、Dbt を LookML の「抽象化」バージョンと呼びます。これにより、メトリクスを管理するためのメカニズムを必要とするユーザーが Google の分析プラットフォームに閉じ込められます。

「ビジネス インテリジェンス エクスペリエンスと緊密に結合されていないセマンティック レイヤーを使用したいと思う人はいません」と Handy 氏は述べています。 「そして、ユーザーのいないセマンティック レイヤーとの統合を望むビジネス インテリジェンス ツールはありません。古典的な両面市場の問題: このコールド スタートをどのように克服するかです。」

Snowflake と Databricks が未来を賭ける静かなジャガーノート

Dbt は、最新のデータ分析において最も影響力のある企業の 1 つにゆっくりと成長し、分析チームがデータをより使いやすい形式にすばやく変換するのに役立つレイヤーとして機能しています。 これは非常に人気のあるツールになり、企業が Salesforce 開発者を雇うのと同じように、エンジニアリング組織内で「分析エンジニア」と呼ばれるまったく新しい役割を生み出しました。

また、Dbt のようなツールは、Snowflake や BigQuery などのデータ ウェアハウス製品に移動するデータが増えるにつれて、ますます価値が高くなります。 業界の人々は、これらのツール、特に Snowflake が、元の製品ではなく、分析作業が行われるデータの中心的なソースになると考えています。

インサイダーは、Dbt Labs、Fivetran、Hugging Face などの企業による分析および機械学習分野での猛烈なペースの開発により、データの所有権が Salesforce などの企業から離れ、Snowflake や Databricks などの集中型データ ツールが好まれるようになったと述べています。

ただし、Dbt は従来、データ アナリストが使用する標準言語である SQL プログラミング言語に重点を置いてきました。 Python を採用することで、データ サイエンスと機械学習のコミュニティにさらに溶け込む機会が得られます。 これは、Databricks の台頭と、Snowpark などの新しいツールと Streamlit の 8 億ドルでの買収による Snowflake の Python への急速な投資の両方に続くものです。

「長い間、この種の言語間機能を提供するデータ プラットフォームに関する動きはあまり見られませんでした」と Handy 氏は述べています。 「Databricks、Snowflakes、および BigQuery の組み合わせが SQL ベースの環境と非 SQL ベースの環境を提供するのはごく最近のことです。これらのプラットフォームのいずれで SQL を使用するか Python を使用するかに関係なく、同じデータを読み書きしています。」

セマンティック レイヤーは本日から利用可能になり、開発ツールの Hex、ビジネス インテリジェンス ツールの Thoughtspot、データ パイプライン管理のスタートアップ Fivetran を含む 14 のパートナーに直接プラグインされる、と同社は述べています。

Leave a Comment

Your email address will not be published. Required fields are marked *