2022 年に知っておくべき 15 の最も人気のある R ライブラリ

今日、多くの人が機械学習タスクに Python を選択していますが、R は開発者のツールキットに欠かせないものです。 クリーンなコード、関数を連鎖する機能、およびパイプ演算子により、R は多くの場合、単純なタスクを非常に簡単に行うことができます。 また、予測やモデリングなどの複雑なタスクにも適しています。

全体として、現在の R はこれまで以上に強力であり、サポートされるライブラリのリストは拡大し続けています。

2022年にリリースされる機械学習用Rライブラリ15個はこちら!

高速トピックス

このパッケージは、フィッティング トピック モデルのデータ カウントと非負行列因数分解のアルゴリズムを実装します。 メソッドは、確率的潜在セマンティック インデックスとポアソン非負行列因数分解の間の関係を利用します。

fastTopics は、モデルを比較、注釈付け、視覚化するためのツールを提供します。 「構造プロット」を作成し、主要な機能を識別します。

ここでドキュメントを確認してください。

メトリカ

このパッケージは 80 を超える関数をコンパイルし、DNDC、APSIM、DSSAT などの回帰および分類ポイント予測モデルの予測パフォーマンスを評価するように設計されています。

Metrica は、カスタマイズ可能な形式 (ggplot) で提供されるモデルのパフォーマンスを評価するためのいくつかの基本的な視覚化関数と共に、予測値と観測値の間のさまざまな機能の幅広いエラー メトリック、インデックス、および係数を備えたツールボックスを提供します。

ここでドキュメントを確認してください。

SparseVFC (ベクトル場学習のためのスパース ベクトル場コンセンサス)

SparseVFC パッケージは、堅牢なベクトル フィールド学習のためのスパース ベクトル フィールド コンセンサス (SparseVFC) アルゴリズムを実装します。 これは、https://github.com/jiayi-ma/VFC の MATLAB 関数から大部分が翻訳されています。

ここでドキュメントを確認してください。

h2oparsnip パッケージに基づいて、agua を使用すると、ユーザーは tidymodels 構文を使用して H2O 経由でモデルを適合、最適化、および評価できます。 ただし、ほとんどのユーザーは、新しいパースニップ計算エンジン「h2o」を介して機能を使用する必要があります。

モデルをフィッティングしている間、データは h2o サーバーに直接渡されます。 データはチューニングのために 1 回渡され、h2o.grid() に処理の指示が与えられます。

ここでドキュメントを確認してください。

AIを開く

OpenAI は、OpenAI API エンドポイントの R ラッパーです。 このパッケージには、エンジン、補完、編集、ファイル、微調整、埋め込み、および従来の検索、分類、回答のエンドポイントが含まれます。

OpenAI API を使用するには、API キーを提供する必要があります。 まず、このページで OpenAI API にサインアップします。 サインアップしてログインしたら、このページを開いて[個人]をクリックし、ドロップダウン メニューで[API キーの表示]を選択する必要があります。 次に、緑色のテキスト「コピー」をクリックしてキーをコピーできます。

ここでドキュメントを確認してください。

webmorphR

顔刺激に焦点を当てた webmorphR は、画像刺激の構築をより一貫性のあるものにすることを目指しています。

研究で使用される刺激は倫理上の理由から共有できませんが、webmorphR では刺激を作成するためのレシピを共有できるため、新しい顔への一般化が促進されます。

ここでドキュメントを確認してください。

見積もり

「cito」は、標準の R 構文を使用してニューラル ネットワークを構築およびトレーニングできるようにすることを目的としています。 これにより、モデル作成プロセス全体とトレーニングを 1 行のコードで実行できます。 さらに、すべてのジェネリック R メソッドは、作成されたオブジェクトで使用できます。

cito は、R で利用可能な「torch」フレームワークに基づいています。R にネイティブであるため、このパッケージに Python をインストールする必要はありません。

ここでドキュメントを確認してください。

であること

etree の目標は、構造化された混合タイプのデータを使用した分類と回帰のモデルである Energy Trees の使いやすい実装を提供することです。 パッケージは現在、構造化された共変量として関数とグラフをカバーしています。

ここでドキュメントを確認してください。

マイルドスム

このパッケージは、サポート ベクター マシン (SVM) ベースの分類子をトレーニングすることにより、データから学習する簡単な方法を提供します。 さらに、複数のインスタンス データ フレームを作成および出力するための便利な関数が含まれています。

ここでドキュメントを確認してください。

aorsf

ディシジョン ツリーは、トレーニング データを 2 つの新しいサブセットに分割して、新しいサブセット間よりも新しいサブセット内の類似性を高めることによって作成されます。 分割プロセスは、停止基準が満たされるまで、結果として得られるデータのサブセットに対して繰り返されます。

ここでドキュメントを確認してください。

キャリブレーションバンド

バイナリ結果予測のキャリブレーションを評価するための R パッケージ。 Timo Dimitriadis (ハイデルベルク大学)、Alexander Henzi (ベルン大学)、Marius Puke (ホーエンハイム大学) の共著。

バイナリ結果予測の正直なキャリブレーション評価は、単調関数の信頼帯を使用して確率分類器のキャリブレーションを評価する関数を提供します。 また、逆適合度検定の構築も容易になり、その棄却により、十分に較正されたモデルの求められている結論が可能になります。

ここでドキュメントを確認してください。

整理タグ

tidytags の目的は、Twitter データの収集をよりアクセスしやすく堅牢にすることです。 tidytags は、Twitter Archiving Google Sheet (TAGS) によって収集されたツイート データを取得し、rtweet R パッケージを介して Twitter から追加のメタデータを取得し、Twitter からのデータの体系的かつ柔軟な分析を容易にする追加機能を提供します。 TAGS は Google スプレッドシートに基づいています。 TAGS トラッカーは、事前定義された検索条件と収集頻度に基づいて、Twitter からツイートを継続的に収集します。

ここでドキュメントを確認してください。

ムリム

現在 R パッケージとして実装されているこのソフトウェアは、機械学習をもたらし、さまざまなデータ型 (連続、バイナリ、多項式、序数) に対して汎用性の高い欠損データ ソリューションを提供します。 一言で言えば、mlim は、多くの理由で、他の利用可能な欠損データ代入ソフトウェアよりも優れていると期待されています。

mlim の高いパフォーマンスは、主に ELNET アルゴリズムの微調整によるものです。これは、多くの場合、標準的な統計手順や調整されていない機械学習アルゴリズムよりも優れており、非常によく一般化されています。

ここでドキュメントを確認してください。

カーネルシェイプ

「kernelshap」パッケージは、Covert and Lee (2021) で説明されているカーネル SHAP アルゴリズムの多次元改良を実装しています。 このパッケージを使用すると、反復サンプリング (2021 年の Covert and Lee のように) または 2 つのハイブリッドを使用して、カーネル SHAP 値を正確に計算できます。 サンプリングが行われるとすぐに、収束と標準誤差が得られるまでアルゴリズムが繰り返されます。

ここでドキュメントを確認してください。

サーベックス

このパッケージは、DALEX に基づいて、モデルに依存しない生存モデルの説明を提供します。 説明可能な機械学習に慣れていないユーザーは、説明モデル分析を参照できます。これには、survex に含まれるほとんどのメソッドが、EMA で説明され、DALEX で実装されていますが、関数出力を持つモデルに拡張されています。

ここでドキュメントを確認してください。

Leave a Comment

Your email address will not be published. Required fields are marked *