コモディティ化されたデータ サイエンティストにならないでください


ユニークで目立つ (Photo by Ricardo Gomez Angel on Unsplash)

コモディティとは、同じ種類の他の商品と交換可能な商業で使用される基本的な商品です。 商品は、他の商品やサービスの生産におけるインプットとして最も頻繁に使用されます。 […] 特定の商品の品質は多少異なる場合がありますが、生産者間で実質的に均一です。

—インベストペディア

穀物は商品です。 牛肉は商品です。 天然ガス、石油、金もコモディティです。

あなたは、データ サイエンティストとして、商品であるべきではありません。

データサイエンティストは皆同じですか? 組織が埋めようとしている穴に、すべて同じ形状のペグが収まるか? 彼らは単に交換可能な暖かい体ですか?

もちろん違います。 データ サイエンティストは、さまざまな設定でさまざまなタスクを実行し、さまざまな技術的スキルと非技術的スキルのセットを使用して、役割の要件を満たすことができます。

少なくとも、その したほうがいい 場合があります。 しかし、ますます多くのデータ サイエンティストが、データ サイエンスの状況を、スキルに関してチェックすべきボックスのリストと見なすようになり、あらゆる意図と目的のために、同様のスキルを持つ個人が雇用主の注目を集めようと競い合っています。

✔️ 基本的な Python プログラミング スキル
✔️ Python の科学計算エコシステムの概要
✔️ ニューラル ネットワークと import tensorflow as tf
✔️ 自然言語処理の基本と HuggingFace Transformers のインポート
✔️ コンピュータ ビジョンの基礎に関する実用的な知識
✔️ SQL、または少なくともその方法 SELECT * FROM Customers WHERE Country='Canada';
✔️ MLOps を扱ったことがあるかどうかに関係なく、MLOps とは何かについての知識

よし、これで他のみんなと同じスキルセットを手に入れたぞ。

それはあなたが目立つ方法ではありません。 さらに重要なことは、それはあなたの仕事のやり方ではありません。 この場合、各組織がデータ サイエンティストに同じものを必要とする場合、特定の個人のスキルに関係なく、スタックから次のものを取得するだけです。

誤解しないでください。私たちは皆、独自のブランドのデータ サイエンス スキルを開発するための強固な基盤を構築する必要があります。 しかし、上に挙げたスキルについて中級者から専門家レベルの知識を持っていたとしても (それ自体が印象的であることは間違いありません)、紙の上では他の人より際立っているわけではありません。

あなたは基本を学びました。 チェックボックスをオンにしました。 その上に構築する時が来ました。

データ サイエンティストの採用を担当する組織や個人は、自分が何を求めているのかを知らないことがよくあります。 なにか! データ サイエンティストが目立つ時が来ました。そのためには、「s」という言葉を使用する必要があります。 専門化.

あなたがデータ サイエンスを始めたのは、好奇心があり、論理的に考え、興味深い問題に取り組みたいからだと思います。 これらの特性のいずれも、他の人が持っているのと同じ一連のスキルと専門知識を習得する必要があることを示唆するものではありません。 データ サイエンティストの生来の特徴はすべて「個性的」であり、データ サイエンティストになるための一般的な道筋とその過程で獲得するスキルは「適合性」を囁きます。

長期的な雇用適性を保証するためには、大勢の中で目立つ必要があり、自分自身を際立たせる必要があり、そのためには自分の個性を主張する必要があります。 一般化されたデータ サイエンティストの時代は、最初から存在していたとしても終わりです。

アップスキル。 集中。 特化する。 これらは、データ サイエンス ゲームの寿命を延ばすための鍵です。

ユニコーンは存在しません。 絶滅危惧種を目指そう。

そうです、絶滅危惧種です。 周囲の人が持っていない技術的および非技術的なスキルをあなたが持っている場合、あなたは絶滅危惧種です。 動物界では、これは種の長期生存にとって有益ではないかもしれませんが、雇用可能なデータサイエンティストとしては確かに有益です.

では、どうすれば絶滅危惧種になれるのでしょうか。 技術的または非技術的、またはその両方の専門的なスキル セットを開発します。

最近では、レパートリーに追加できるテクニカル スキルが非常に多くあります。 しかし、これがあなたが信じているかもしれない難しいプロセスである必要がないことを示すために、そうします。

まず、ニッチという意味でのテクニカルスキルについて考えてみたいと思います。 あなたはすでに (おそらく) データ サイエンス スキルの展望を広く浅くカバーしています。 深さと狭さの二重レンズを通して考える時が来ました。

「ニッチな」技術的スキルの獲得にアプローチするには、2 つの基本的な方法が考えられます。

新しくてピカピカ

最新の技術的な whatzit に必要なスキルを習得するときは、早すぎることと遅すぎることのバランスを取る必要があります。 昨日登場した新しいツールの専門家を探している人はいませんが、誰もがそれを使用すると、あなたのスキルは絶滅危惧種にはなりません。

最近開発されたオープン ソース ツールのうち、まだ普及はしていないが将来性があるツールを探すことをお勧めします。 1 階に足を踏み入れて何らかの貢献をすることは、そのツールとの差別化を図るのに最適な方法です。

試行錯誤済み (ただし主流ではない)

これがスローバーンです。 このツールはしばらく前から出回っていますが、おそらく享受できるはずの成功をまだ達成していません. JAX はその好例だと思います。 JAX は数年前から存在しており、他の同様のツールよりもレベルが低いため、この利点を求める人々の支持を得ており、その人気は高まり続けています。 ここに専門知識を加えると、特に上記のすべてに精通している場合は、TensorFlow や PyTorch の群集とは一線を画すでしょう。

ほら、それは必ずしも他のことを知らないということではなく、それらを知っているということです そして何か他のもの.

非技術的スキルに関しては、区別できる 2 つの方法は非常に明白だと思います。以下でこれらを見ていきます。

コミュニケーション

コミュニケーションはデータサイエンスの鍵です。 ここで新たに報告することはありません。 しかし、実際にどのようなコミュニケーションが含まれるかは変化します。 3 年前には、「同時オンライン会議環境で同時に複数の同僚とアイデアを効果的に伝達する」スキルがどれほど切望されていたか想像できますか?

最近では自分自身を際立たせるために、独自のブランドの賛同を求めることもできます。プロジェクトの結果を伝えるために使用するアーティファクトと、その周りに構築するストーリーを作成することに時間を費やしてください。 これは、新しいデータ サイエンティストに常に強調されることですが、多くの場合、ピカピカの新しいツールまたは手法が優先されます。 チームの結果とビジョンを他の利害関係者に効果的に売り込むために、他の人が注目するチームの一員であることは何も悪いことではありません。

ドメインの専門知識

これは非常に簡単です。 機械学習のスキルを金融業界に活かしたいですか? 金融業界をもっと知ろう!

これは業界の領域を超えています。 自然言語処理を技術的な側面から攻撃している人々が多すぎて、言語学をしっかりと理解していないことがわかります。 NLP で自分を際立たせることに興味がありますか? いくつかの言語テキストを拾います。 コンピューター ビジョンについても同じことが言えます。色相、補間、ガウス ノイズなどについて知らない場合は、学習することで目立ちます。 それはあなたが入りたい場所に入るのを助けるだけです.

すべてのデータ サイエンティストが X、Y、および Z を知る必要があるという考えは忘れましょう。スキルのアルファベットには他にもたくさんの文字があるため、E、J、または少しの M を自分で学習してください。

そして、いつも…

コモディティ化されたデータ サイエンティストにならないでください
著者による画像

マシュー・メイヨー (@mattmayo13) はデータ サイエンティストであり、重要なオンライン データ サイエンスおよび機械学習リソースである KDnuggets の編集長です。 彼の関心は、自然言語処理、アルゴリズムの設計と最適化、教師なし学習、ニューラル ネットワーク、および機械学習への自動化アプローチにあります。 Matthew は、コンピューター サイエンスの修士号とデータ マイニングの卒業証書を取得しています。 彼は kdnuggets の editor1 で連絡できます[dot]コム。

Leave a Comment

Your email address will not be published. Required fields are marked *