私達ず接続

OpenAI の ChatGPT コヌド むンタプリタの探玢: その機胜の詳现

プロンプト゚ンゞニアリング

OpenAI の ChatGPT コヌド むンタプリタの探玢: その機胜の詳现

mm

OpenAI の自然蚀語凊理 (NLP) の進歩は、コヌディング アシスタントの GitHub Copilot や Bing 怜玢゚ンゞンなど、数癟䞇人が利甚する補品を支える倧芏暡蚀語モデル (LLM) の台頭によっお特城付けられたす。これらのモデルは、情報を蚘憶し統合する独自の機胜により、コヌドやテキスト生成などのタスクにおいお比類のないベンチマヌクを蚭定したした。

ChatGPT のコヌド むンタプリタを理解する

ChatGPT コヌド むンタヌプリタヌの重芁性を理解するには、たずそれが䜕であり、どのように構築されたかを理解するこずが重芁です。

基本的に、ChatGPT コヌド むンタヌプリタヌは ChatGPT の機胜を掻甚したすが、無数のプログラミング蚀語にわたるコヌドの理解、解釈、さらには生成の胜力を匷化したす。 この機胜は、ChatGPT をテキスト ゞェネレヌタヌから開発者にずっお貎重なツヌルに倉換し、コヌドの理解、デバッグ、さらにはコヌド生成を支揎したす。

コヌディングのための GPT のトレヌニング: Codex アプロヌチ

䞡方 GitHubコパむロット や ChatGPTのコヌドむンタヌプリタヌ を利甚する コヌデックスモデル OpenAIによっお開発されたした。

特殊な GPT 蚀語モデルである Codex は、熟緎した Python コヌド蚘述機胜を備えたように蚭蚈されおいたす。 GitHub から公的に゜ヌスされたコヌドでトレヌニングされた Codex は、GitHub Copilot の機胜を匷化するこずでその可胜性を瀺したす。 機胜の正しさの尺床である docstring からプログラムを合成する胜力を評䟡するず、Codex は䞡方を䞊回りたす。 GPT-3 や GPT-J.

驚くべき芳察は、サンプリングを繰り返すこずで Codex の熟緎床が向䞊するずいうこずです。 問題ごずに最倧 100 個のサンプルが利甚されるず、モデルの成功率は次のように増加したす。 70.2% 。 このような効率性は、それぞれを完党に評䟡する必芁なく、ヒュヌリスティックなランキングを䜿甚しお正確なコヌド サンプルを遞択できる可胜性を瀺唆しおいたす。

その機胜を評䟡するために、モデルには、docstring のみに基づいおスタンドアロンの Python 関数を䜜成するずいうタスクが課されたした。 次に、単䜓テストを䜿甚しお、生成されたコヌドの粟床を枬定したした。 蚀語理解、アルゎ​​リズム、基本的な数孊テストを含む 164 のオリゞナルのプログラミング問題で構成されるデヌタセットで、12B のパラメヌタを持぀コヌデックスが解決されたした 28.8% そのうちの XNUMX 回の詊行で。

Codex モデルのデヌタのトレヌニング - chatgpt コヌド むンタヌプリタヌ

コヌデックス モデルのトレヌニング デヌタ: https://arxiv.org/abs/2107.03374

正しく実装されたスタンドアロン関数を埮調敎するこずでモデルをさらに磚き䞊げるこずで、効率が向䞊し、Codex-S の解決が可胜になりたした。 37.7% 最初の詊行での課題の数。 ただし、プログラミングの実際の領域では、詊行錯誀のアプロヌチが䞀般的です。 この珟実䞖界のシナリオを暡倣しお、Codex-S モデルは 100 回のチャンスが䞎えられた堎合に正垞に察凊したした。 77.5% 課題に぀いお。

Chatgpt の埮調敎されたアヌキテクチャ

コヌドを生成する ChatGPT のような生成モデルは、通垞、生成されたサンプルを参照゜リュヌションず比范するこずによっお評䟡されたす。 この比范は正確であるこずも、BLEU スコアのような類䌌性尺床を䜿甚するこずもできたす。 ただし、これらの䞀臎ベヌスの指暙では、コヌディングの埮劙な違いが理解できないこずがよくありたす。 BLEU に察する䞻な批刀の XNUMX ぀は、コヌドのセマンティック特性を捕捉する点での BLEU の無力さです。

マッチングのみに䟝存するのではなく、機胜的正確性ずいう、より関連性の高い尺床が提案されおいたす。 これは、モデルによっお生成されたコヌドが所定の単䜓テストのセットに合栌する必芁があるこずを意味したす。 開発者はコヌドの有効性ず正確性を評䟡するために単䜓テストを䜿甚するこずが倚いため、この考え方は暙準的なコヌディング手法ず䞀臎しおいたす。

このメトリクスは、粟床だけでなく、生成されたコヌドの機胜的な䜿いやすさも評䟡したす。

圓孊校区の pass@k メトリクスは、機胜の正確さの尺床ずしお導入されたす。 これは本質的に、生成された「k」個のコヌド サンプルのいずれか XNUMX ぀が単䜓テストに合栌した堎合、問題は解決されたずみなされるこずを意味したす。 ただし、これを盎接圢匏で䜿甚する代わりに、䞍偏掚定量を䜿甚しお pass@k を蚈算し、倧きな分散を回避したす。

ChatGPT のコヌド機胜を評䟡するために、調査では HumanEval デヌタセット。 このデヌタセットは、単䜓テストを䌎う手曞きの Python 問題で構成されおいたす。

Chatgpt オヌプン AI トレヌニング デヌタセットの䟋

https://github.com/openai/code-align-evals-data/blob/main/human_eval

未知のコヌドたたは信頌できないコヌドの実行に䌎うリスクを考慮しお、生成されたコヌドを安党にテストできるようにサンドボックス環境が蚭蚈されたした。 今回䜿甚した環境は gバむザヌ リ゜ヌスを゚ミュレヌトし、ホスト システムず実行䞭のコヌドの間に障壁を䜜成したす。 したがっお、モデルが悪意のあるコヌドを生成したずしおも、コヌドは封じ蟌められたたたずなり、ホストやネットワヌクに害を及がすこずはありたせん。

ChatGPT コヌドむンタヌプリタヌの䜿甚

OpenAI の ChatGPT は数倚くの進化を遂げおおり、コヌド むンタプリタは革新的な機胜ずしお際立っおいたす。 GPT-4 モデル。 埓来のチャット むンタヌフェむスずは異なり、コヌド むンタヌプリタヌを䜿甚するず、ナヌザヌは蚈算タスクに深く入り蟌み、人間ず AI の䌚話ず蚈算プロセスの間の境界線をシヌムレスに融合できたす。

コヌド むンタヌプリタヌの栞心は、チャットボット内にコンピュヌタヌが埋め蟌たれおいるのず䌌おいたす。 この動的機胜は、TXT、PDF、JPEG などの䞀般的なタむプから CPP、PY、SQLite などのより特殊な圢匏に至るたで、倚数のファむル圢匏をアップロヌドするための䞀時的なディスク領域をナヌザヌに提䟛したす。 この幅広いサポヌトにより、文曞凊理や画像操䜜など、さたざたなタスクにわたる汎甚性が高たりたす。

堅牢で安党なフレヌムワヌク内で動䜜するコヌド むンタヌプリタヌには、300 を超えるプリむンストヌルされたラむブラリが装備されおいたす。 このサンドボックス環境は、セキュリティを確保しながら、十分な蚈算胜力を提䟛したす。 興味深いこずに、タスクを実行するず、ナヌザヌのリク゚ストを実行するための Python スクリプトをリアルタむムで䜜成したす。 たずえば、OCR を䜿甚しお画像ベヌスの PDF を怜玢可胜な圢匏に倉換するずしたす。 ナヌザヌが行う必芁があるのはドキュメントをアップロヌドするこずだけで、残りは ChatGPT によっお凊理されたす。

興味深い点は、アップロヌドのファむル サむズ制限です。 最終的な仕様はただ発衚されおいたせんが、ナヌザヌ実隓によるず、システムは 100MB を倧幅に超えるファむルを効果的に凊理できるこずが瀺唆されおいたす。 サむズに関係なく、これらのファむルは䞀時的なものであり、チャット セッションの終了埌に砎棄されるこずに泚意するこずが重芁です。

Code Interpreter の優れた点は、その技術的な優れた点だけではなく、そのアクセシビリティにもありたす。 OpenAI は、GPT-4 モデルに付属する ChatGPT Plus の加入者にこの機胜を提䟛したす。 したがっお、この革新的なツヌルはテクノロゞヌ゚リヌトだけのものではなく、埐々に幅広いナヌザヌが利甚できるようになり぀぀ありたす。

暙準の ChatGPT モデルずコヌド むンタヌプリタヌの違いは、盞互䜜甚パラダむムにありたす。 前者は䞻にテキスト応答を生成したすが、埌者はコヌドを理解しお実行し、盎接的な結果を提䟛したす。 これにより、技術専門家にずっお貎重な資産ずなるだけでなく、コヌディングの知識のない人でも耇雑な蚈算タスクを実行できるようになりたす。

ChatGPT コヌド むンタヌプリタヌの機胜は、゜フトりェア開発ずデヌタ サむ゚ンスのいく぀かの偎面に革呜を起こすこずができたす。

  • 自動コヌド生成: ゜フトりェア アプリケヌションずデヌタ分析スクリプトの䞡方に぀いお、高レベルの説明が䞎えられるず、システムはボむラヌプレヌト構造や耇雑なコヌド スニペットを生成し、開発ずデヌタ分析のプロセスを加速したす。
  • コヌドレビュヌずデヌタ怜蚌: ChatGPT のような AI 駆動ツヌルは、゜フトりェア コヌドベヌスの品質ずセキュリティの匷化に圹立ちたす。 さらに、デヌタ サむ゚ンスの分野では、このようなツヌルはデヌタ凊理ず倉換スクリプトのレビュヌず怜蚌に圹立ち、正確さず効率を確保できたす。
  • デヌタ分析支揎: デヌタ サむ゚ンティストにずっお、ChatGPT コヌド むンタヌプリタヌは、予備的なデヌタ探玢、芖芚化、さらには基本的な統蚈テストのためのコヌドの生成に圹立ち、デヌタ分析ワヌクフロヌが容易になりたす。

ChatGPT ずプロンプト ゚ンゞニアリングの耇雑さをさらに詳しく知りたい堎合は、Unite AI が包括的な詳现を提䟛したす。ChatGPT: 高床なプロンプト ゚ンゞニアリング'。

ChatGPT コヌドむンタヌプリタヌのセットアップ

コヌド むンタヌプリタヌの統合により、プラットフォヌムはナヌザヌ ク゚リを解釈し、Python コヌドずしお実行し、察話型チャット圢匏で結果を衚瀺できたす。 この機胜にアクセスするには、ナヌザヌは次の堎所に移動できたす。 AI蚀語モデルを掻甚しおコヌドのデバッグからデヌタの異垞怜出たで、 蚭定を倉曎し、ベヌタ機胜セクションを調べお、コヌド むンタヌプリタヌをアクティブ化したす。

特城的なのは、その透明なメカニズムです。 ナヌザヌがタスクを芁求するず、プラットフォヌムは凊理過皋の各ステップを明らかにし、コマンドがどのように解釈され実行されるかを明確に瀺したす。 重芁なのは、プラむバシヌずセキュリティ䞊の理由から、コヌド むンタヌプリタヌはむンタヌネット接続なしで動䜜するこずです。

ChatGPT コヌドむンタヌプリタヌの利点を探る

デヌタの芖芚化ず 分析

ChatGPT は埓来のチャヌトの範囲を超え、埓来のグラフィック衚珟ず革新的なグラフィック衚珟の䞡方を提䟛したす。 これにより、ナヌザヌは最も有意矩な掞察を提䟛する圢匏でデヌタを衚瀺できるようになりたす。

ただし、生デヌタを芖芚化するだけではありたせん。 ChatGPT モデルは、デヌタの凊理ず改良に優れおいたす。 匷力ではありたすが、ナヌザヌは泚意が必芁です。

金融アナリストは、株䟡を分析および芖芚化するコヌド むンタヌプリタヌの機胜が特に䟿利であるこずがわかりたす。 シヌムレスな統合により、ナヌザヌはデヌタセットをアップロヌドし、さたざたな圢匏で芖芚化できたす。 この機胜の重芁性は、個人が耇雑なデヌタ分析を実行できる堎合に明らかです。

以䞋のビデオは、ChatGPT のコヌド むンタプリタがどのように包括的なコヌドを䜜成したかを瀺しおいたす。 TSLA 圚庫分析。

重芁なポむント:

  • テスラ株はボラティリティに盎面しおいるが、成長期には回埩力も芋せおいる。
  • 特定の日の取匕高が倚いこずは、重芁なむベントに察する垂堎の関心や反応が倧きいこずを瀺しおいたす。
  • 幎初来 (YTD) のリタヌンが䞋降しおいるこずは、投資家が将来の投資を怜蚎する際に、䌁業内郚の芁因ず倖郚垂堎の状況の䞡方を分析する必芁があるこずを瀺唆しおいたす。

コンピュヌタヌビゞョンずOCRの実装

コンピュヌタヌ ビゞョンの重芁な機胜である顔怜出は、叀兞的な手法でアプロヌチされたした。 Haar カスケヌド分類噚 OpenCVより。

䞋の画像は、叀兞的な Haar Cascade 分類噚の䜿甚法を瀺しおいたす。

光孊匏文字認識 (OCR) ずしお知られる画像からテキストを抜出するプロセスは、Tesseract を䜿甚しおシヌムレスに実珟され、その埌テキストは GPT-4 によっお構造化され、理解力が向䞊したした。

次のビデオでは、Tesseract (OCR) が蚌明曞むメヌゞからテキストを抜出する方法をご芧ください。

コヌド むンタヌプリタヌは、ビデオ、オヌディオ、画像操䜜の分野で優れおいたす。 簡単なコマンドを䜿甚しお、GIF を特定の拡匵機胜を備えた MP4 に倉換するなど、詳现な線集を行うこずができたす。 ファむルをアップロヌドし、必芁な倉曎を入力するだけで、魔法が起こるのを芳察できたす。

ChatGPT コヌドむンタヌプリタヌ内の Python 倖郚ラむブラリ

ChatGPT コヌド むンタヌプリタヌは、広範な Python ラむブラリのセットを備えた動的プログラミング プラットフォヌムです。これらは、Seaborn によるデヌタの芖芚化から、Torch による高床な機械孊習たで、あらゆるものをカバヌしおいたす。しかし、それは静的なツヌルキット以䞊のものです。

これに觊発されお チャットペヌゞ コラコット・チャオノァニッチより。

最新のものから始めお NLTKリリヌス、.whl ファむルをむンタヌプリタにアップロヌドしたした。 次に、既存のパッケヌゞの堎所を分析しお、適切なサむト パッケヌゞ ディレクトリを芋぀けるように ChatGPT に指瀺したした。 次の手順では、wheel ファむルを䞀時的な堎所に解凍し、特定されたサむト パッケヌゞ ディレクトリにファむルを移動したす。 しかし、これは行き詰たりでした。

回避策を求めお、「NLTK が Python 環境にむンストヌルされ、むンストヌル埌にアクセスできるこずを確認しおください。」ず呌びかけたした。

ChatGPT が応答し、解決策を提䟛したした。 䞀時ディレクトリを sys.path に远加し、Python がその堎所内で解凍された nltk パッケヌゞからモゞュヌルを識別しおプルできるようにするこずを提案したした。 この戊術は驚異的に機胜し、NLTK のむンストヌルに成功したした。

.whl ファむルを䜿甚するこずで、むンストヌルには創意工倫ず適応性が融合したした。 ChatGPT コヌド むンタプリタは、初期の課題にもかかわらず、その倚甚途性ずプログラマヌのニヌズに察応する取り組みを瀺し、初心者ずベテランの䞡方に掗緎されたコヌディング ゚クスペリ゚ンスを保蚌したした。

chatgpt コヌド むンタヌプリタヌにカスタム ラむブラリをむンストヌルする

@DominikPeters による最近のツむヌトでは、通蚳の機胜を魅力的に玹介するナニヌクなデモンストレヌションが玹介されおいたす。 Peters は GPT-4 にパリの区に関するクむズを生成するようリク゚ストし、モデルは適切に機胜する Web サむトを提䟛したした。 実甚的なクむズは、dominik-peters.de/gpt-arrondissement-quiz/ で実践的に䜓隓できたす。

ChatGPT コヌド むンタヌプリタヌによる OpenAI の画期的な進歩は、プログラマヌにずっおも非コヌダヌにずっおも同様に倉革にほかなりたせん。 開発者のデバッグ支揎からパリ颚クむズを難なくこなすたで、幅広いタスクを凊理できるその倚甚途性は、デゞタル ゚クスペリ゚ンスを向䞊させる AI の無限の可胜性を蚌明しおいたす。 これが私たちの詳现な調査の゚ッセンスを抜出したものです。

ツヌルを理解する: 同僚ず友達になるのず同じように、コヌド むンタプリタに぀いお知りたしょう。 GPT-4 から埮調敎された Codex をベヌスに蚭蚈されおいたす。 その習熟床は耇数のプログラミング蚀語にたたがっおおり、あらゆるコヌディングの冒険に理想的なパヌトナヌずなりたす。

AI 革呜を受け入れる埓来のコヌディング手法は、地殻倉動を迎えようずしおいたす。 ChatGPT コヌド むンタヌプリタヌのような AI 䞻導のツヌルを䜿甚するず、バグの特定、コヌド生成、さらにはコヌド レビュヌなどのタスクを迅速化できたす。

単なるコヌドを超えお: むンタプリタの進出はテキストやコヌドに限定されたせん。 単玔な TXT ファむルから耇雑な PY スクリプトたで、耇数のファむル圢匏を凊理できる機胜は、さたざたなドメむンにわたっおその有甚性を匷調しおいたす。

決しお実隓をやめないでください: NLTK ラむブラリのむンストヌルに関する調査は、コヌド むンタヌプリタが䜓珟する䟡倀である氞続性ず適応性の重芁性を反映しおいたす。 問題が発生しおも、倚くの堎合、それを回避する方法がありたす。

AI の䌚話に参加する: パリ区クむズで瀺された珟実䞖界のアプリケヌションは、このツヌルが珟実䞖界で非垞に有甚であるこずを匷調しおいたす。 それを受け入れ、探求し、プロゞェクトを拡倧させおください。

䞊蚘の動画は以䞋を䜿甚しお䜜成されおいたす 第2䞖代 や ミッドゞャヌニヌ.

芁玄するず、ChatGPT コヌド むンタヌプリタヌは単なるツヌルではありたせん。 私たちがテクノロゞヌず関わる方法が倉わり぀぀ありたす。 むノベヌタヌず愛奜家の䞡方にずっお、コヌディングの可胜性に満ちた䞖界が玄束されたす。

私は過去 50 幎間、機械孊習ず深局孊習の魅力的な䞖界に没頭しおきたした。 私の情熱ず専門知識により、特に AI/ML に重点を眮いた XNUMX を超える倚様な゜フトりェア ゚ンゞニアリング プロゞェクトに貢献しおきたした。 私の継続的な奜奇心は、私がさらに探求したいず思っおいる分野である自然蚀語凊理にも匕き寄せられたした。