最新の人工知能研究は、変形性関節症の重症度が変化する変形性膝関節症の X 線画像を DeepFake で生成できる敵対的生成ニューラル ネットワークを提示

深層学習の最近の進歩は、医学の分野にも影響を与えています。 しかし、最近のプライバシーに関する懸念と法的枠組みにより、医療データの共有と取得が妨げられています。 このような法的制限により、特にデータ集約型の技術とパートナーシップである深層学習の将来の進歩の可能性が制限されます。 ただし、医療目的で正確な合成データを生成することで、プライバシーに関する懸念を軽減し、ディープ ラーニング パイプラインを改善できます。 この論文では、さまざまな程度の変形性関節症を伴う膝関節の X 線の正確な画像を持つことができる生成的敵対的ニューラル ネットワークを紹介します。 研究者は、トレーニング用に 5,556 枚の本物の写真と 320,000 枚の人工 (DeepFake) X 線画像を提供します。

15 人の医療専門家の助けを借りて、彼らは私たちのモデルの医学的精度を評価し、変形性関節症の重症度を分類するタスクに対する増強の効果を調べました。 医療専門家向けに、実際の写真 30 枚と DeepFake の写真 30 枚を使用してアンケートを作成しました。 その結果、反対のディープフェイクよりも多くのディープフェイクが本物と見なされることがよくありました。 この結果は、DeepFake のリアリズムが医療専門家を欺くのに十分であることを示していました。 最後に、限られた実際のデータと転移学習を使用して、DeepFakes は変形性関節症の重症度を分類するという課題で分類精度を高めました。 さらに、彼らは同じ分類ジョブのすべての本物のトレーニング データを DeepFakes に置き換えました。真の変形性関節症の X 線を分類する精度は、ベースラインからわずか 3.79% しか低下しませんでした。

早期発見は、臨床経過を遅らせ、潜在的に患者の可動性と生活の質を向上させる可能性があります。 医療専門家は、人工ニューラル ネットワークと同様に、早期診断にかなりの困難を抱えています。 2 つの敵対的生成ニューラル ネットワークの助けを借りて、彼らはこの調査のために、さまざまなケルグレンおよびローレンス段階で無数の変形性膝関節症の X 線を作成することができました。 研究者は最初に深層学習における匿名性と拡張効果を実証し、次に研究者は 15 人の医療専門家と共にシステムを検証しました。 生成された DeepFake X 線画像は、研究者や一般の人々の間で自由に共有できます。

KL01 WGAN と KL234 WGAN の写真は、初期のトレーニングから厳選されたモデルまでさまざまです。

人体解剖学の X 線写真で、KL01 WGAN と KL234 WGAN のニューラル ネットワークがトレーニングされました。 トレーニングが進むにつれて、テクスチャの変更が改善される一方で、重要な構造の変更が減少し始めていることに気付きました。 指数単位の活性化とバッチ正規化を備えたアップサンプリングと 2D 畳み込みモジュールは、ジェネレーター ブロックを構築するために使用される主要なビルディング ブロックでした。 過剰適合を防ぐためのドロップアウト レイヤーにより、ディスクリミネーター ブロックは、KL01 および KL234 クラスからの 30 枚の本物の DeepFake 写真と 30 枚の偽の DeepFake 写真の独自の分析になりました。 OA の程度は、本物の画像と人工的な画像の両方について専門家によって評価されました。 その結果、実際の写真よりも多くの偽の写真が互いに取り違えられていることがわかりました。 KL01 と KL234 の間の OA 重症度は、バイナリ分類タスクを使用して予測されました。

出典: https://www.nature.com/articles/s41598-022-23081-4

DeepFake 拡張セットの場合、研究者は損失が減少し、結果として検証精度が向上したことを確認しました。 テストスコアが最も高い +200% Fakes の増強効果が最も効果的でした。 全体として、増幅効果と匿名化効果の両方が、変形性膝関節症の分類における有益な下流の結果の可能性を示唆しています。 ディープ ニューラル ネットワークは、医学的に正確な変形性膝関節症の X 線写真を生成できる可能性があります。 リンクされた増幅効果と置換による匿名性は、この研究で初めて得られました。

限られたデータで転移学習の分類精度を高めるため、実際の学習データに DeepFake 画像を追加しました。 このような転移学習戦略は、データが頻繁に不足し、収集が困難な医療分野で広く使用されています。 GPU メモリのオーバーフローを防ぐために、210 x 210 の画像サイズが採用されました。 変形性関節症の重症度の 2 つのモデルで利用できる写真の数を増やすために、彼らは KL クラス (KL01 と KL234) を組み合わせました。 初期の KL グレードは、KL グレードの組み合わせの結果、ラベル ノイズが少なくなりました。

X 線の焦点とテクスチャの透明度に大きなギャップがあるとジェネレータが混乱するため、焦点フィルタリングを使用して、焦点の合ったテクスチャと焦点の合っていないテクスチャが 1 つの画像に結合されるのを防ぎました。 DeepFake 画像と実際の写真を区別するために、専門家の支援が必要でした。 KL 格付け契約タスクで見られるかなりの標準偏差も、この効果の存在を反映しています。 一部の写真は他の写真よりも優れた臨床的属性を示していたため、医療専門家の評価は偏っていました。 ランドマークの作成と検出は、ランドマーク ラベルをさらに統合することでメリットが得られる可能性があります。

両方の膝関節を含む 4130 X 線を使用して画像を作成し、ケルグレンとローレンスのシステムを使用してグレーディングしました。 KL には、0 年生で 3253 枚、1 年生で 1495 枚、2 年生で 2175 枚、3 年生で 1086 枚、4 年生で 251 枚の写真がありました。 この調査の目的は、DeepFake の写真がどれほど現実的であるかを調査することでした。 彼らは無作為に 15 枚の KL01 と 15 枚の KL234 の写真を生成し、医療専門家に KL スコアに基づいてそれらを判断するよう依頼しました。

画像は 315 315 ピクセルにサイズ変更され、ランダムな順序で調査に含まれました。 彼らはバランスのとれた精度の指標79を使用して、バランスの取れていない応答に対処しました。 研究チームは、ImageNet で事前トレーニングされた VGG1664 アーキテクチャの単純なバリエーションを採用し、さらに 22 エポックのトレーニングを受けました。設計の最後の 3 ブロックのみがトレーニング可能で、残りは凍結されています。 各データセットを生成するために、彼らは実際のデータから始め、徐々に DeepFake データを追加しました。 Python 言語の「random」パッケージを使用して、実際の写真がランダムに選択されました。


チェックアウト データセット. この研究のすべての功績は、このプロジェクトの研究者に帰属します。 また、忘れずに参加してください 私たちのRedditページ不協和音チャンネルでは、最新の AI 研究ニュース、クールな AI プロジェクトなどを共有しています。

Prezja, F.、Paloneva, J.、Pölönen, I. ら。 生成的敵対的ニューラル ネットワークからの DeepFake 変形性膝関節症 X 線は、医療専門家を欺き、自動分類に増強の可能性を提供します。 サイレップ 12、18573(2022)。 https://doi.org/10.1038/s41598-022-23081-4


Ashish kumar は MarktechPost のコンサルティングインターンです。 彼は現在、カンプールのインド工科大学 (IIT) で Btech を目指しています。 彼は、テクノロジーの新しい進歩とその実際のアプリケーションを探求することに情熱を注いでいます。


Leave a Comment

Your email address will not be published. Required fields are marked *