Google、ロボットにコーディングを開始してもらいたい、ロボットを訓練するための「Code as Policies」を開始

Google は、ロボットがコーディングを開始するのに役立つプログラムである Code as Policies を開発しました

プログラミングを学ぶのが難しい理由は何ですか? プログラミングの習得が難しいと考えられている主な理由は、主にコンピューターが理解する命令の複雑さにあります。 英語やその他の人間の言語でコンピューターに指示を与えることはできません。 しかし、Google のロボティクス研究者は、ロボットにコーディングを開始させることで、それを修正する方法を模索しています。 はい、正しくお読みください。Google は、自然言語命令に基づいて独自のプログラミング コードを記述できるロボット プログラム (Code as Policies) を開発しました。 block_target_color を #FF0000 から #FFFF00 に変更するためにロボットの構成ファイルに飛び込む必要はなく、「黄色のブロックを拾う」と入力するだけで、残りはロボットに任せることができます。

Code as Policies (または略して Cap) は、Google の Pathways Language Model (PaLM) から開発されたコーディング固有の言語モデルであり、自然言語の命令を解釈して実行可能なコードに変換します。 Google の研究者は、命令の例 (コードをレビューする人にコードが何をするかを説明するために開発者が書いたコード コメントとしてフォーマットされています) と対応するコードを与えることで、モデルをトレーニングしました。 そこから、新しい命令を受け取り、「API 呼び出しを再構成し、新しい関数を合成し、実行時に新しい動作を組み立てるためのフィードバック ループを表現する新しいコードを自律的に生成する」ことができた、と Google のエンジニアは今週公開されたブログ投稿で説明しました。言い換えれば、コメントのようなプロンプトが与えられた場合、何らかのロボット コードを思いつく可能性があります。

この可能性を探るために、Google はコードとしてのポリシー (CaP) を開発しました。これは、ロボットがコーディングを開始するのに役立つ、物理システムで実行される言語モデルによって生成されたプログラムのロボット中心の定式化です。 CaP は、言語モデルが汎用 Python コードの完全な表現を使用してさらに複雑なロボット タスクを完了できるようにすることで、以前の作業である PaLM-SayCan を拡張します。 Google の Code as Policies を使用すると、タスク固有のトレーニングを行わなくても、単一のシステムでさまざまな複雑で多様なロボット タスクを実行できます。

CaP を動かす AI システムは、もともとロボットの構成コードを生成するようには設計されていませんでした。 Google によると、同社の研究者は、少数ショット学習として知られる方法を使用してシステムをトレーニングしました。

AI システムに新しいタスクを実行するように教えるには、通常、タスクを実行する方法を示す多数の例を AI システムに提供する必要があります。 数ショット学習を使用すると、研究者は少数の例のみを使用して AI システムをトレーニングできるため、開発がスピードアップします。 Google の研究者は、自然言語の命令をロボットの構成コードに変換する方法の例を提供することで、CaP をトレーニングしました。

Cap は Python プログラミング言語でソフトウェアを作成します。 このツールは、新しいコードを生成するだけでなく、一般的なタスクを自動化するパッケージ化されたコードのコレクションであるソフトウェア ライブラリを利用することもできます。 Google によると、そのアプローチは、新しいタスク用にロボットを構成する既存のアプローチよりも効果的であることが証明されています。

「私たちの実験では、コードを出力すると、ロボットのタスクを直接学習して自然言語アクションを出力するよりも、一般化とタスクのパフォーマンスが向上することがわかりました」と Liang と Zeng は詳しく説明しています。

Google は、CaP のコードに加えて、さらなる調査をサポートするベンチマーク テスト ツールをリリースしました。 このベンチマーク ツールにより、研究者はさまざまな AI システムがロボット工学関連のタスクをどれだけうまく実行できるかをより簡単に比較できるようになります。

Leave a Comment

Your email address will not be published. Required fields are marked *