プログラマーを支援するコードを生成できる 5 つの AI ツール

自然言語処理 (NLP) における最新の進歩の 1 つは、膨大な量のデータを含む膨大なデータセットを使用して構築された大規模言語モデル (LLM) の出現です。 Google の BERT や OpenAI の GPT-2 および GPT-3 など、利用可能な LLM がいくつかあります。 これらのモデルを使用すると、簡単なエッセイから実際の財務モデルまで、これらのモデルを使用してすべてを生成できます。

OpenAI、Hugging Face、Cohere、AI21 Labs などの AI スタートアップは、数十億のパラメーターを使用してモデルをトレーニングすることにより、LLM の限界を押し広げています。

高品質のコードを生成できる大規模な言語モデルに基づく 5 つの AI ベースのコード ジェネレーターを次に示します。

1.OpenAIコーデックス

OpenAI Codex は、GitHub Copilot を強化する GPT-3 に基づくモデルです。これは、VS Code、Neovim、JetBrains などの主流の開発環境内でコードを生成する GitHub のツールであり、GitHub Codespaces を使用したクラウド内でもコードを生成します。 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、さらには BASH など、少なくとも 12 の言語でコードを記述できると主張しています。 このモデルは、GitHub リポジトリなどのパブリック ドメインで利用可能な数十億行のコードでトレーニングされています。

OpenAI は、ツールと統合を構築するために、開発者やプラットフォーム企業がプライベート ベータ版を通じてモデルを利用できるようにしました。

2.タブニン

Tabnine はエンド ツー エンドのコード ジェネレーターではありませんが、統合開発環境 (IDE) のオートコンプリート機能を強化します。 ウォータールー大学の学生だった Jacob Jackson によって Rust で開発された Tabnine は、本格的な AI ベースのコード補完ツールに進化しました。

Tabnine は、VS Code、IntelliJ、Android Studio、さらには Vim などの一般的な IDE を含む、20 を超える言語と 15 のエディターをサポートしています。 3 人の開発者のチームで年間 432 ドルの価格で利用できます。

3.CodeT5

CodeT5 は、SalesForce の研究者によって構築されたオープン ソースのプログラミング言語モデルです。 これは、Google の T5 (Text-to-Text Transfer Transformer) フレームワークに基づいています。 CodeT5 をトレーニングするために、チームは、一般にアクセス可能な GitHub リポジトリから、ユーザー コメントを含む 835 万を超えるコード インスタンスを調達しました。 これらのデータセットの大部分は、BigQuery からの 2 つの C および C# データセットに加えて、Ruby、JavaScript、Go、Python、PHP、C、および C# を含む CodeSearchNet データセットから派生したものです。

CodeT5 は、ソフトウェア プログラミングに 3 つの機能をもたらす可能性があります。

  • テキストからコードへの生成: 自然言語記述に基づいてコードを生成する
  • オートコンプリート コード: ターゲット関数名を指定して、コードの関数全体を完成させます
  • コードの要約: 自然言語記述で関数の要約を生成する

4.ポリコード

Polycoder は、OpenAI の Codex に代わるオープン ソースです。 カーネギー メロン大学の研究者によって開発されたこのモデルは、12 のプログラミング言語で書かれた 249 GB のコードベースでトレーニングされた OpenAI の GPT-2 に基づいています。 PolyCoder の作成者によると、このプログラムは、Codex を含む他のどのモデルよりも高い精度で C を記述することができます。

ほとんどのコード ジェネレーターはオープン ソースではありませんが、Polycoder は最初のオープン ソース コード生成モデルの 1 つです。

5.コグラム

ベルリンを拠点とする Y-Combinator のスタートアップである Cogram は、SQL クエリと Jupyter Notebook を使用するデータ サイエンティストと Python プログラマーを対象としたコード生成ツールです。 データ サイエンティストは英語でクエリを作成できます。このクエリは、ツールによって結合とグループ化を含む複雑な SQL クエリに変換されます。 SQLite、PostgreSQL、MySQL、および Amazon Redshift をサポートしています。

Python と Julia の開発者は、Cogram を Jupyter Notebook と統合して、コードを自動生成できます。 このツールは、コメントに基づいて特定のタスクのコンテキスト コードを生成できます。 データ サイエンティストは、Matplotlib、Plotly、Seaborn などの主流の Python モジュールに基づいて視覚化を生成することもできます。

.

Leave a Comment

Your email address will not be published. Required fields are marked *