プロンプトエンジニアリング

OpenAI の ChatGPT コードインタプリタの探索: その機能の詳細

公開済み 2023 年 8 月 21 日

アーユシュ・ミタルミタル

OpenAI の自然言語処理 (NLP) の進歩は、コーディングアシスタントの GitHub Copilot や Bing 検索エンジンなど、数百万人が利用する製品を支える大規模言語モデル (LLM) の台頭によって特徴付けられます。これらのモデルは、情報を記憶し統合する独自の機能により、コードやテキスト生成などのタスクにおいて比類のないベンチマークを設定しました。

ChatGPT のコードインタプリタを理解する

ChatGPT コードインタープリターの重要性を理解するには、まずそれが何であり、どのように構築されたかを理解することが重要です。

基本的に、ChatGPT コードインタープリターは ChatGPT の機能を活用しますが、無数のプログラミング言語にわたるコードの理解、解釈、さらには生成の能力を強化します。この機能は、ChatGPT をテキストジェネレーターから開発者にとって貴重なツールに変換し、コードの理解、デバッグ、さらにはコード生成を支援します。

コーディングのための GPT のトレーニング: Codex アプローチ

両方 GitHubコパイロットや ChatGPTのコードインタープリターを利用するコーデックスモデル OpenAIによって開発されました。

特殊な GPT 言語モデルである Codex は、熟練した Python コード記述機能を備えたように設計されています。 GitHub から公的にソースされたコードでトレーニングされた Codex は、GitHub Copilot の機能を強化することでその可能性を示します。機能の正しさの尺度である docstring からプログラムを合成する能力を評価すると、Codex は両方を上回ります。 GPT-3 や GPT-J.

驚くべき観察は、サンプリングを繰り返すことで Codex の熟練度が向上するということです。問題ごとに最大 100 個のサンプルが利用されると、モデルの成功率は次のように増加します。 70.2% 。このような効率性は、それぞれを完全に評価する必要なく、ヒューリスティックなランキングを使用して正確なコードサンプルを選択できる可能性を示唆しています。

その機能を評価するために、モデルには、docstring のみに基づいてスタンドアロンの Python 関数を作成するというタスクが課されました。次に、単体テストを使用して、生成されたコードの精度を測定しました。言語理解、アルゴリズム、基本的な数学テストを含む 164 のオリジナルのプログラミング問題で構成されるデータセットで、12B のパラメータを持つコーデックスが解決されました 28.8% そのうちの XNUMX 回の試行で。

Codex モデルのデータのトレーニング - chatgpt コードインタープリター

コーデックスモデルのトレーニングデータ: https://arxiv.org/abs/2107.03374

正しく実装されたスタンドアロン関数を微調整することでモデルをさらに磨き上げることで、効率が向上し、Codex-S の解決が可能になりました。 37.7% 最初の試行での課題の数。ただし、プログラミングの実際の領域では、試行錯誤のアプローチが一般的です。この現実世界のシナリオを模倣して、Codex-S モデルは 100 回のチャンスが与えられた場合に正常に対処しました。 77.5% 課題について。

コードを生成する ChatGPT のような生成モデルは、通常、生成されたサンプルを参照ソリューションと比較することによって評価されます。この比較は正確であることも、BLEU スコアのような類似性尺度を使用することもできます。ただし、これらの一致ベースの指標では、コーディングの微妙な違いが理解できないことがよくあります。 BLEU に対する主な批判の XNUMX つは、コードのセマンティック特性を捕捉する点での BLEU の無力さです。

マッチングのみに依存するのではなく、機能的正確性という、より関連性の高い尺度が提案されています。これは、モデルによって生成されたコードが所定の単体テストのセットに合格する必要があることを意味します。開発者はコードの有効性と正確性を評価するために単体テストを使用することが多いため、この考え方は標準的なコーディング手法と一致しています。

このメトリクスは、精度だけでなく、生成されたコードの機能的な使いやすさも評価します。

当学校区の pass@k メトリクスは、機能の正確さの尺度として導入されます。これは本質的に、生成された「k」個のコードサンプルのいずれか XNUMX つが単体テストに合格した場合、問題は解決されたとみなされることを意味します。ただし、これを直接形式で使用する代わりに、不偏推定量を使用して pass@k を計算し、大きな分散を回避します。

ChatGPT のコード機能を評価するために、調査では HumanEval データセット。このデータセットは、単体テストを伴う手書きの Python 問題で構成されています。

https://github.com/openai/code-align-evals-data/blob/main/human_eval

未知のコードまたは信頼できないコードの実行に伴うリスクを考慮して、生成されたコードを安全にテストできるようにサンドボックス環境が設計されました。今回使用した環境は gバイザーリソースをエミュレートし、ホストシステムと実行中のコードの間に障壁を作成します。したがって、モデルが悪意のあるコードを生成したとしても、コードは封じ込められたままとなり、ホストやネットワークに害を及ぼすことはありません。

ChatGPT コードインタープリターの使用

OpenAI の ChatGPT は数多くの進化を遂げており、コードインタプリタは革新的な機能として際立っています。 GPT-4 モデル。従来のチャットインターフェイスとは異なり、コードインタープリターを使用すると、ユーザーは計算タスクに深く入り込み、人間と AI の会話と計算プロセスの間の境界線をシームレスに融合できます。

コードインタープリターの核心は、チャットボット内にコンピューターが埋め込まれているのと似ています。この動的機能は、TXT、PDF、JPEG などの一般的なタイプから CPP、PY、SQLite などのより特殊な形式に至るまで、多数のファイル形式をアップロードするための一時的なディスク領域をユーザーに提供します。この幅広いサポートにより、文書処理や画像操作など、さまざまなタスクにわたる汎用性が高まります。

堅牢で安全なフレームワーク内で動作するコードインタープリターには、300 を超えるプリインストールされたライブラリが装備されています。このサンドボックス環境は、セキュリティを確保しながら、十分な計算能力を提供します。興味深いことに、タスクを実行すると、ユーザーのリクエストを実行するための Python スクリプトをリアルタイムで作成します。たとえば、OCR を使用して画像ベースの PDF を検索可能な形式に変換するとします。ユーザーが行う必要があるのはドキュメントをアップロードすることだけで、残りは ChatGPT によって処理されます。

興味深い点は、アップロードのファイルサイズ制限です。最終的な仕様はまだ発表されていませんが、ユーザー実験によると、システムは 100MB を大幅に超えるファイルを効果的に処理できることが示唆されています。サイズに関係なく、これらのファイルは一時的なものであり、チャットセッションの終了後に破棄されることに注意することが重要です。

Code Interpreter の優れた点は、その技術的な優れた点だけではなく、そのアクセシビリティにもあります。 OpenAI は、GPT-4 モデルに付属する ChatGPT Plus の加入者にこの機能を提供します。したがって、この革新的なツールはテクノロジーエリートだけのものではなく、徐々に幅広いユーザーが利用できるようになりつつあります。

標準の ChatGPT モデルとコードインタープリターの違いは、相互作用パラダイムにあります。前者は主にテキスト応答を生成しますが、後者はコードを理解して実行し、直接的な結果を提供します。これにより、技術専門家にとって貴重な資産となるだけでなく、コーディングの知識のない人でも複雑な計算タスクを実行できるようになります。

ChatGPT コードインタープリターの機能は、ソフトウェア開発とデータサイエンスのいくつかの側面に革命を起こすことができます。

自動コード生成: ソフトウェアアプリケーションとデータ分析スクリプトの両方について、高レベルの説明が与えられると、システムはボイラープレート構造や複雑なコードスニペットを生成し、開発とデータ分析のプロセスを加速します。
コードレビューとデータ検証: ChatGPT のような AI 駆動ツールは、ソフトウェアコードベースの品質とセキュリティの強化に役立ちます。さらに、データサイエンスの分野では、このようなツールはデータ処理と変換スクリプトのレビューと検証に役立ち、正確さと効率を確保できます。
データ分析支援: データサイエンティストにとって、ChatGPT コードインタープリターは、予備的なデータ探索、視覚化、さらには基本的な統計テストのためのコードの生成に役立ち、データ分析ワークフローが容易になります。

ChatGPT とプロンプトエンジニアリングの複雑さをさらに詳しく知りたい場合は、Unite AI が包括的な詳細を提供します。ChatGPT: 高度なプロンプトエンジニアリング'。

ChatGPT コードインタープリターのセットアップ

コードインタープリターの統合により、プラットフォームはユーザークエリを解釈し、Python コードとして実行し、対話型チャット形式で結果を表示できます。この機能にアクセスするには、ユーザーは次の場所に移動できます。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、設定を変更し、ベータ機能セクションを調べて、コードインタープリターをアクティブ化します。

特徴的なのは、その透明なメカニズムです。ユーザーがタスクを要求すると、プラットフォームは処理過程の各ステップを明らかにし、コマンドがどのように解釈され実行されるかを明確に示します。重要なのは、プライバシーとセキュリティ上の理由から、コードインタープリターはインターネット接続なしで動作することです。

ChatGPT コードインタープリターの利点を探る

データの視覚化と分析

ChatGPT は従来のチャートの範囲を超え、従来のグラフィック表現と革新的なグラフィック表現の両方を提供します。これにより、ユーザーは最も有意義な洞察を提供する形式でデータを表示できるようになります。

ただし、生データを視覚化するだけではありません。 ChatGPT モデルは、データの処理と改良に優れています。強力ではありますが、ユーザーは注意が必要です。

金融アナリストは、株価を分析および視覚化するコードインタープリターの機能が特に便利であることがわかります。シームレスな統合により、ユーザーはデータセットをアップロードし、さまざまな形式で視覚化できます。この機能の重要性は、個人が複雑なデータ分析を実行できる場合に明らかです。

以下のビデオは、ChatGPT のコードインタプリタがどのように包括的なコードを作成したかを示しています。 TSLA 在庫分析。

重要なポイント:

テスラ株はボラティリティに直面しているが、成長期には回復力も見せている。
特定の日の取引高が多いことは、重要なイベントに対する市場の関心や反応が大きいことを示しています。
年初来 (YTD) のリターンが下降していることは、投資家が将来の投資を検討する際に、企業内部の要因と外部市場の状況の両方を分析する必要があることを示唆しています。

コンピュータービジョンとOCRの実装

コンピュータービジョンの重要な機能である顔検出は、古典的な手法でアプローチされました。 Haar カスケード分類器 OpenCVより。

下の画像は、古典的な Haar Cascade 分類器の使用法を示しています。

光学式文字認識 (OCR) として知られる画像からテキストを抽出するプロセスは、Tesseract を使用してシームレスに実現され、その後テキストは GPT-4 によって構造化され、理解力が向上しました。

次のビデオでは、Tesseract (OCR) が証明書イメージからテキストを抽出する方法をご覧ください。

コードインタープリターは、ビデオ、オーディオ、画像操作の分野で優れています。簡単なコマンドを使用して、GIF を特定の拡張機能を備えた MP4 に変換するなど、詳細な編集を行うことができます。ファイルをアップロードし、必要な変更を入力するだけで、魔法が起こるのを観察できます。

ChatGPT コードインタープリター内の Python 外部ライブラリ

ChatGPT コードインタープリターは、広範な Python ライブラリのセットを備えた動的プログラミングプラットフォームです。これらは、Seaborn によるデータの視覚化から、Torch による高度な機械学習まで、あらゆるものをカバーしています。しかし、それは静的なツールキット以上のものです。

これに触発されてチャットページコラコット・チャオヴァニッチより。

最新のものから始めて NLTKリリース、.whl ファイルをインタープリタにアップロードしました。次に、既存のパッケージの場所を分析して、適切なサイトパッケージディレクトリを見つけるように ChatGPT に指示しました。次の手順では、wheel ファイルを一時的な場所に解凍し、特定されたサイトパッケージディレクトリにファイルを移動します。しかし、これは行き詰まりでした。

回避策を求めて、「NLTK が Python 環境にインストールされ、インストール後にアクセスできることを確認してください。」と呼びかけました。

ChatGPT が応答し、解決策を提供しました。一時ディレクトリを sys.path に追加し、Python がその場所内で解凍された nltk パッケージからモジュールを識別してプルできるようにすることを提案しました。この戦術は驚異的に機能し、NLTK のインストールに成功しました。

.whl ファイルを使用することで、インストールには創意工夫と適応性が融合しました。 ChatGPT コードインタプリタは、初期の課題にもかかわらず、その多用途性とプログラマーのニーズに対応する取り組みを示し、初心者とベテランの両方に洗練されたコーディングエクスペリエンスを保証しました。

@DominikPeters による最近のツイートでは、通訳の機能を魅力的に紹介するユニークなデモンストレーションが紹介されています。 Peters は GPT-4 にパリの区に関するクイズを生成するようリクエストし、モデルは適切に機能する Web サイトを提供しました。実用的なクイズは、dominik-peters.de/gpt-arrondissement-quiz/ で実践的に体験できます。

GPT-4 にパリ区に関するクイズをコーディングするよう依頼したところ、そのまま使えました。 https://t.co/Uhv7tPLspq pic.twitter.com/3agFZllEEQ

— ドミニク・ピーターズ (@DominikPeters) 2023 年 4 月 30 日

ChatGPT コードインタープリターによる OpenAI の画期的な進歩は、プログラマーにとっても非コーダーにとっても同様に変革にほかなりません。開発者のデバッグ支援からパリ風クイズを難なくこなすまで、幅広いタスクを処理できるその多用途性は、デジタルエクスペリエンスを向上させる AI の無限の可能性を証明しています。これが私たちの詳細な調査のエッセンスを抽出したものです。

ツールを理解する: 同僚と友達になるのと同じように、コードインタプリタについて知りましょう。 GPT-4 から微調整された Codex をベースに設計されています。その習熟度は複数のプログラミング言語にまたがっており、あらゆるコーディングの冒険に理想的なパートナーとなります。

AI 革命を受け入れる：従来のコーディング手法は、地殻変動を迎えようとしています。 ChatGPT コードインタープリターのような AI 主導のツールを使用すると、バグの特定、コード生成、さらにはコードレビューなどのタスクを迅速化できます。

単なるコードを超えて: インタプリタの進出はテキストやコードに限定されません。単純な TXT ファイルから複雑な PY スクリプトまで、複数のファイル形式を処理できる機能は、さまざまなドメインにわたってその有用性を強調しています。

決して実験をやめないでください: NLTK ライブラリのインストールに関する調査は、コードインタープリタが体現する価値である永続性と適応性の重要性を反映しています。問題が発生しても、多くの場合、それを回避する方法があります。

AI の会話に参加する: パリ区クイズで示された現実世界のアプリケーションは、このツールが現実世界で非常に有用であることを強調しています。それを受け入れ、探求し、プロジェクトを拡大させてください。

上記の動画は以下を使用して作成されています第2世代やミッドジャーニー.

要約すると、ChatGPT コードインタープリターは単なるツールではありません。私たちがテクノロジーと関わる方法が変わりつつあります。イノベーターと愛好家の両方にとって、コーディングの可能性に満ちた世界が約束されます。

関連トピック：チャットポイント ChatGPT コードインタープリターデータの可視化大規模な言語モデル自然言語処理 OpenAI パイソン

次に

ソーシャルメディアに最適なChatGPTプロンプト20選（2025年XNUMX月）

お見逃しなく

Python の Langchain を使用したゼロから高度なプロンプトエンジニアリング

アーユシュ・ミタル

私は過去 50 年間、機械学習と深層学習の魅力的な世界に没頭してきました。私の情熱と専門知識により、特に AI/ML に重点を置いた XNUMX を超える多様なソフトウェアエンジニアリングプロジェクトに貢献してきました。私の継続的な好奇心は、私がさらに探求したいと思っている分野である自然言語処理にも引き寄せられました。

Unite.AI

OpenAI の ChatGPT コード インタプリタの探索: その機能の詳細

ChatGPT のコード インタプリタを理解する