ミシガン州立大学の研究者が、単一細胞の遺伝子発現を大規模に分析するためのディープ ラーニング モデルをサポートする Python ライブラリ「DANCE」を開発

ソース: https://www.biorxiv.org/content/biorxiv/early/2022/10/24/2022.10.19.512741.full.pdf

単一モダリティ プロファイリング (RNA、タンパク質、およびオープン クロマチン) からマルチモーダル プロファイリングおよび空間トランスクリプトミクスまで、単一細胞を分析する技術は近年急速に進歩しています。 このように、コンピュータによるアプローチ、特に機械学習に基づくアプローチの急増は、この主題の急速な拡大によって促進されています。

研究者は、現在のアプローチの多様性と複雑さのために、元の記事に示されている結果を再現することは困難であると述べています. ハイパーパラメータの微調整、プログラミング言語間の非互換性、および公開されているコードベースの欠如はすべて、重大な障害をもたらします。 ほとんどの既存の研究は、限られたデータセットと不十分な方法論との比較でのパフォーマンスのみを報告しているため、方法を完全に評価するには体系的なベンチマーク手順が必要です。

最近の研究の一環として、ミシガン州立大学、ワシントン大学、浙江工科大学、スタンフォード大学、ジョンソン & ジョンソンの研究者が、単一細胞分析の進歩を加速するために設計されたディープラーニング ライブラリおよびベンチマークである DANCE を紹介しています。

DANCE は、単一細胞データを大規模に分析するための包括的なツール セットを提供し、開発者が深層学習モデルをより簡単かつ効率的に作成できるようにします。 さらに、単一細胞解析のさまざまな計算モデルのパフォーマンスを比較するためのベンチマークとして使用できます。 DANCE には現在、3 つのモジュール、8 つのタスク、32 のモデル、および 21 のデータセットのサポートが含まれています。

現在、DANCE は以下を提供しています。

  1. シングルモダリティ分析。
  2. マルチモダリティ分析
  3. 空間トランスクリプトミクス解析

オートエンコーダーと GNN は広く使用されている深層学習フレームワークであり、全面的にサポートされ、適用可能です。 彼らの論文によると、DANCE は単一細胞分析のための最初の包括的なベンチマーク プラットフォームです。

この作業では、研究者は新しいコンポーネントを使用しています。 彼らは、タスク固有の標準ベンチマーク データセットをコンパイルし、単一のパラメーター調整ですぐに利用できるようにすることから作業を開始しました。 ベースラインの古典的および深層学習アルゴリズムは、すべてのタスクに実装されています。 収集されたすべてのベンチマーク データセットは、元の調査と同じかそれ以上の結果が得られるまでベースラインを微調整するために使用されます。 エンド ユーザーは、事前にすべてのスーパー パラメーターをラップした 1 つのコマンド ラインを実行するだけで、微調整されたモデルの規定のパフォーマンスを取得できます。

チームは、バックボーンとして PyTorch ジオメトリック (PSG) フレームワークを使用しました。 さらに、ベースラインを適合予測スコア フレームワークに変換して標準化します。 タスクごとに、実装されているすべてのアルゴリズムが、収集されたすべての標準ベンチマークでグリッド検索を介して微調整され、最適なモデルが取得されます。 関連するスーパーパラメータは、ユーザーが再現できるように 1 つのコマンド ラインに保存されます。

チームは、彼らの研究が DANCE プラットフォームから単一細胞コミュニティ全体に利益をもたらすと信じています。 エンド ユーザーは、モデルの実装と微調整に多くの時間と労力を費やす必要はありません。 代わりに、結果を再現するために必要なことは、コマンド ラインを実行することだけです。 さらに、研究者は、ディープラーニングベースのモデルを迅速にトレーニングするためのグラフィックス プロセッシング ユニット (GPU) のサポートも提供します。

現在の DANCE には、前処理とグラフ作成のための統一されたツール セットがありません。 チームは将来的にこれに取り組む予定です。 また、DANCE は SaaS サービスとして利用できるようになるため、ユーザーは自分のデバイスの処理能力とストレージ容量だけに頼る必要がなくなるとも述べています。

This Article is written as a research summary article by Marktechpost Staff based on the research paper 'DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis'. All Credit For This Research Goes To Researchers on This Project. Check out the paper, code and tool.
Please Don't Forget To Join Our ML Subreddit


Tanushree Shenwai は MarktechPost のコンサルティングインターンです。 彼女は現在、ブバネーシュワルのインド工科大学 (IIT) で学士号を取得しようとしています。 彼女はデータ サイエンスの愛好家であり、さまざまな分野での人工知能の適用範囲に強い関心を持っています。 彼女は、テクノロジーの新しい進歩とその実際のアプリケーションを探求することに情熱を注いでいます。


Leave a Comment

Your email address will not be published. Required fields are marked *