Prompt Engineering

Zkoumání ChatGPT Code Interpreter od OpenAI: Hluboký ponor do jeho schopností

Zveřejněno August 21, 2023

Aayush Mittal Mittal

Pokroky OpenAI ve zpracování přirozeného jazyka (NLP) jsou poznamenány vzestupem velkých jazykových modelů (LLM), které jsou základem produktů využívaných miliony lidí, včetně asistenta kódování GitHub Copilot a vyhledávače Bing. Tyto modely díky své jedinečné schopnosti zapamatovat si a sloučit informace nastavily bezkonkurenční měřítka v úkolech, jako je generování kódu a textu.

Pochopení interpretu kódu ChatGPT

Abychom pochopili význam interpretu kódu ChatGPT, je nezbytné nejprve pochopit, co to je a jak byl vytvořen.

ChatGPT Code Interpreter v podstatě využívá schopnosti ChatGPT, ale zavádí vylepšenou odbornost v porozumění, interpretaci a dokonce generování kódu v mnoha programovacích jazycích. Tato funkce transformuje ChatGPT z textového generátoru na neocenitelný nástroj pro vývojáře, který napomáhá porozumění kódu, ladění a dokonce i generování kódu.

Školení GPT pro kódování: Kodexový přístup

Oba GitHub Copilot si Interpret kódu ChatGPT využít Kodexový model vyvinutý společností OpenAI.

Codex, specializovaný jazykový model GPT, je navržen tak, aby měl zdatné možnosti psaní kódu v Pythonu. Codex, vyškolený na kódu z GitHubu, který pochází z veřejných zdrojů, předvádí svůj potenciál tím, že podporuje funkce v GitHub Copilot. Při hodnocení schopnosti syntetizovat programy z dokumentačních řetězců, což je měřítko funkční správnosti, Codex překonává oba GPT-3 si GPT-J.

Pozoruhodné je, že opakované vzorkování zvyšuje úroveň efektivity Codexu. Při použití až 100 vzorků na problém se míra úspěšnosti modelu zvyšuje na 70.2%. Taková účinnost naznačuje možnost použití heuristického hodnocení k výběru přesných vzorků kódu, aniž by bylo nutné provést úplné vyhodnocení každého.

Pro vyhodnocení jeho schopností byl model pověřen vytvořením samostatných funkcí Pythonu založených výhradně na dokumentačních řetězcích. Přesnost vygenerovaného kódu byla následně ověřena pomocí jednotkových testů. V datové sadě obsahující 164 originálních programovacích problémů, které zahrnují porozumění jazyku, algoritmy a základní matematické testy, byl Codex s 12 miliardami parametrů vyřešen. 28.8% z nich na jediný pokus.

Tréninková data pro Codex Model - interpret kódu chatgpt

Školicí data pro Codex Model: https://arxiv.org/abs/2107.03374

Dalším zdokonalováním modelu prostřednictvím jemného doladění správně implementovaných samostatných funkcí byla zvýšena jeho efektivita, což vedlo k řešení Codex-S 37.7% výzvy na první pokus. V praktické sféře programování je však běžný přístup pokus-omyl. Model Codex-S napodobující tento reálný scénář, když dostal 100 šancí, byl úspěšně vyřešen 77.5% z výzev.

Generativní modely, jako je ChatGPT, které produkují kód, se obvykle hodnotí porovnáním generovaných vzorků s referenčním řešením. Toto srovnání může být buď přesné, nebo může využívat míru podobnosti, jako je skóre BLEU. Tyto metriky založené na shodě však často nedokážou zachytit nuance kódování. Klíčovou kritikou BLEU je jeho neúčinnost při zachycování sémantických charakteristik kódu.

Namísto spoléhání se pouze na párování bylo navrženo relevantnější opatření: funkční správnost. To znamená, že kód vytvořený modelem by měl projít danou sadou jednotkových testů. Myšlenka je v souladu se standardními postupy kódování, protože vývojáři často používají testy jednotek k měření účinnosti a přesnosti svého kódu.

Tato metrika hodnotí nejen přesnost, ale i funkční použitelnost generovaného kódu.

Jedno pass@k metrika je zavedena jako měřítko funkční správnosti. V podstatě to znamená, že pokud některý z „k“ vygenerovaných vzorků kódu projde jednotkovými testy, problém je považován za vyřešený. Avšak místo pouhého použití v jeho přímé podobě se k výpočtu pass@k používá nestranný odhad, aby se předešlo velkým rozptylům.

Pro posouzení kódových schopností ChatGPT byl ve výzkumu využit HumanEval datový soubor. Tato datová sada se skládá z ručně psaných problémů Pythonu, z nichž každý je doprovázen jednotkovými testy.

Příklad datové sady pro trénování otevřené aplikace Chatgpt

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Vzhledem k rizikům spojeným se spouštěním neznámého nebo nedůvěryhodného kódu bylo vytvořeno prostředí sandbox, které bezpečně otestuje vygenerovaný kód. Toto prostředí se používá gVisor emulovat prostředky a vytvořit bariéru mezi hostitelským systémem a běžícím kódem. I když tedy model produkuje škodlivý kód, zůstává uzavřený a nemůže poškodit hostitele nebo síť.

Použití ChatGPT Code Interpreter

ChatGPT od OpenAI prošel řadou vývojů, přičemž interpret kódu vyniká jako revoluční funkce. Model GPT-4. Na rozdíl od tradičních chatovacích rozhraní umožňuje Code Interpreter uživatelům ponořit se hlouběji do výpočetních úloh a hladce prolnout hranice mezi konverzacemi mezi člověkem a AI a výpočetními procesy.

Ve svém jádru je Code Interpreter podobný tomu, že má počítač vestavěný do chatbota. Tato dynamická funkce nabízí uživatelům dočasný diskový prostor pro nahrání nepřeberného množství formátů souborů od běžných typů, jako jsou TXT, PDF a JPEG, až po specializovanější, jako jsou CPP, PY a SQLite. Tato šíře podpory umocňuje jeho všestrannost napříč různými úkoly, ať už jde o zpracování dokumentů nebo manipulaci s obrázky.

Interpreter kódu, který pracuje v robustním a bezpečném rámci, je vybaven více než 300 předinstalovanými knihovnami. Toto sandboxové prostředí zajišťuje zabezpečení a zároveň poskytuje značný výpočetní výkon. Zajímavé je, že při zadání úkolu v reálném čase vytvoří skript v Pythonu, který spustí požadavek uživatele. Vezměte si například převod PDF souboru s obrázky do prohledávatelného formátu pomocí OCR; uživatel stačí dokument nahrát a ChatGPT se postará o zbytek.

Zajímavostí byl limit velikosti nahrávaných souborů. Definitivní specifikace sice ještě nebyly oznámeny, ale uživatelské experimenty naznačují, že systém dokáže efektivně zpracovat soubory podstatně větší než 100 MB. Bez ohledu na velikost je důležité si uvědomit, že tyto soubory jsou dočasné a po skončení chatu jsou smazány.

Genialita Code Interpreteru nespočívá jen v jeho technické zdatnosti, ale také v jeho dostupnosti. OpenAI nabízí tuto funkci předplatitelům ChatGPT Plus, který je součástí modelu GPT-4. Tento transformační nástroj tak není určen pouze pro technologickou elitu, ale postupně se stává dostupným pro širší publikum.

Rozdíl mezi standardním modelem ChatGPT a interpretem kódu spočívá v jejich interakčních paradigmatech. Zatímco první primárně generuje textové odpovědi, druhý rozumí a spouští kód a nabízí přímé výsledky. Díky tomu je nejen cenným přínosem pro technické profesionály, ale také umožňuje těm, kteří nemají znalosti kódování, provádět složité výpočetní úkoly.

Schopnosti interpretu kódu ChatGPT mohou způsobit revoluci v několika aspektech vývoje softwaru a datové vědy:

Automatické generování kódu: Jak pro softwarové aplikace, tak pro skripty pro analýzu dat, může systém s popisem na vysoké úrovni vytvářet standardní struktury nebo složité úryvky kódu, což urychluje procesy vývoje a analýzy dat.
Kontrola kódu a validace dat: Nástroje řízené umělou inteligencí, jako je ChatGPT, mohou pomoci zlepšit kvalitu a bezpečnost softwarových kódových základen. Navíc v oblasti datové vědy mohou být tyto nástroje nápomocné při kontrole a ověřování skriptů pro zpracování a transformaci dat, což zajišťuje přesnost a efektivitu.
Pomoc s analýzou dat: Pro datové vědce může ChatGPT Code Interpreter pomoci při generování kódu pro předběžné prozkoumání dat, vizualizaci a dokonce i základní statistické testy, čímž usnadní pracovní tok analýzy dat.

Pokud se chcete dozvědět více o složitostech ChatGPT a prompt engineeringu, Unite AI nabízí komplexní rozbor v tomto tématu.ChatGPT: Advanced Prompt Engineering".

Nastavení tlumočníka kódů ChatGPT

Integrace Code Interpreter umožňuje platformě interpretovat uživatelské dotazy, spouštět je jako kód Pythonu a zobrazovat výsledky ve formátu interaktivního chatu. Pro přístup k této funkci mohou uživatelé přejít na ChatGPT nastavení, prozkoumejte sekci funkcí Beta a aktivujte interpreta kódu.

To, co jej odlišuje, je jeho transparentní mechanismus. Jakmile uživatelé vyzve k zadání úkolu, platforma odhalí každý krok cesty zpracování a nabídne jasné, jak jsou příkazy interpretovány a prováděny. Důležité je, že z důvodů ochrany soukromí a bezpečnosti funguje interpret kódu bez připojení k internetu.

Zkoumání výhod tlumočníka kódu ChatGPT

Vizualizace dat & Analýza

ChatGPT přesahuje rámec tradičních grafů a nabízí konvenční i inovativní grafické znázornění. Uživatelé tak mohou prohlížet svá data ve formátech, které poskytují nejsmysluplnější informace.

Nejde však jen o vizualizaci nezpracovaných dat. Model ChatGPT je zběhlý ve zpracování a zpřesňování dat. I když je výkonný, uživatelé by měli být opatrní.

Finanční analytici shledají schopnost Code Interpreteru analyzovat a vizualizovat kurzy akcií obzvláště užitečnou. Díky bezproblémové integraci mohou uživatelé nahrávat datové sady a vizualizovat je v různých formátech. Význam této funkce je zřejmý, když mohou jednotlivci provádět komplexní analýzy dat.

Níže uvedené video ukazuje, jak interpret kódu ChatGPT vytvořil komplexní TSLA analýza akcií.

Key Takeaways:

Akcie Tesly čelily volatilitě, ale také vykazovaly odolnost s obdobími růstu.
Vysoké objemy obchodů v určité dny naznačují významný zájem trhu nebo reakce na klíčové události.
Sestupná roční výnosnost (YTD) naznačuje, že investoři by měli při zvažování budoucích investic analyzovat jak interní faktory společnosti, tak vnější podmínky na trhu.

Implementace počítačového vidění a OCR

Detekce obličeje, základní funkce počítačového vidění, byla řešena klasickou technikou: the Klasifikátor Haar Cascade z OpenCV.

Obrázek níže ukazuje použití klasického klasifikátoru Haar Cascade.

Proces extrahování textu z obrázků, známý jako optické rozpoznávání znaků (OCR), byl bezproblémově dosažen pomocí Tesseract, přičemž text byl následně strukturován pomocí GPT-4, čímž se zlepšila srozumitelnost.

V následujícím videu se podívejte, jak Tesseract (OCR) extrahuje text z obrázku certifikátu.

Kódový interpret vyniká v oblasti manipulace s videem, zvukem a obrazem. S přímočarými příkazy mohou uživatelé dosáhnout detailních úprav, jako je převod GIF na MP4 se specifickými vylepšeními. Jednoduše nahrajte soubor, zadejte požadované úpravy a sledujte, jak se kouzlo děje.

Externí knihovna Pythonu uvnitř vašeho ChatGPT Code Interpreter

Interpretátor kódu ChatGPT je platforma pro dynamické programování vybavená rozsáhlou sadou knihoven Pythonu. Ty pokrývají vše od vizualizace dat pomocí Seabornu až po pokročilé strojové učení pomocí Torchu. Je to však víc než jen statická sada nástrojů.

Inspirováno tímto Stránka chatgpt od Korakot Chaovavanich.

Počínaje nejnovějšími vydání nltk, nahráli jsme soubor .whl do interpretu. Poté jsme pověřili ChatGPT, aby nalezl vhodný adresář site-packages analýzou umístění existujícího balíčku. Dalším krokem bylo rozbalení souboru wheel na dočasné místo a přesunutí souborů do identifikovaného adresáře site-packages. To však narazilo na problém.

Při hledání řešení jsme vyzvali: „Laskavě zajistěte, aby se NLTK nainstaloval v prostředí Pythonu a byl dostupný po instalaci.“

ChatGPT odpověděl a poskytl řešení. Navrhlo přidání dočasného adresáře do sys.path, což Pythonu umožní identifikovat a stáhnout moduly z rozbaleného balíčku nltk v tomto umístění. Tato taktika dělala zázraky a vedla k úspěšné instalaci NLTK.

Díky použití souborů .whl prokázala instalace kombinaci vynalézavosti a přizpůsobivosti. Interpret kódu ChatGPT navzdory počátečním problémům prokázal svou všestrannost a odhodlání vyhovět potřebám kodérů a zajistil tak jak začátečníkům, tak i zkušeným programátorům propracovaný zážitek z programování.

Nedávný tweet uživatele @DominikPeters zdůraznil fascinující ukázku schopností tlumočníka a unikátní demonstraci. Peters požádal GPT-4 o vytvoření kvízu o pařížských obvodech a model mu poskytl dobře fungující webové stránky. Fungující kvíz je k dispozici pro praktické vyzkoušení na adrese dominik-peters.de/gpt-arrondissement-quiz/.

Požádal jsem GPT-4, aby mi kódoval kvíz Paris arrondissements, fungovalo to hned po vybalení. https://t.co/Uhv7tPLspq pic.twitter.com/3agFZllEEQ

— Dominik Peters (@DominikPeters) 30. dubna 2023

Balil

Průlom OpenAI s interpretem kódu ChatGPT je pro kodéry i neprodekovače naprosto transformační. Jeho všestrannost při zvládání široké škály úkolů – od pomoci vývojářům s laděním až po bezproblémové vytváření pařížských kvízů – svědčí o neomezeném potenciálu umělé inteligence ve vylepšování našich digitálních zážitků. Zde je stručná esence našeho hlubokého ponoru:

Pochopte svůj nástrojStejně jako byste se spřátelili s kolegou, seznamte se s Code Interpreterem. Je navržen na bázi Codexu, který je vyladěn z GPT-4. Jeho znalost sahá do několika programovacích jazyků, což z něj činí ideálního společníka pro všechna vaše programátorská dobrodružství.

Přijměte revoluci AI: Tradiční postupy kódování brzy zaznamenají seismický posun. S nástroji řízenými umělou inteligencí, jako je ChatGPT Code Interpreter, lze urychlit úkoly, jako je identifikace chyb, generování kódu a dokonce i revize kódu.

Beyond Just CodeMožnosti Interpretera se neomezují pouze na text nebo kód. Jeho schopnost pracovat s různými formáty souborů, od jednoduchých souborů TXT až po složité PY skripty, podtrhuje jeho užitečnost v různých oblastech.

Nikdy nepřestávejte experimentovatNáš průzkum s instalací knihovny NLTK odráží důležitost perzistence a přizpůsobivosti, hodnot, které ztělesňuje Code Interpreter. Pokud se vyskytne nějaký problém, často existuje způsob, jak ho obejít.

Připojte se ke konverzaci o AI: Aplikace v reálném světě, jak ukázal kvíz Paris arrondissements, podtrhují nesmírnou užitečnost tohoto nástroje v reálném světě. Přijměte ji, prozkoumejte ji a nechte ji rozšířit vaše projekty.

Výše uvedené video je vytvořeno pomocí Leden-2 si Střední cesta.

Abychom to shrnuli, interpret kódu ChatGPT je víc než jen nástroj; mění způsob, jakým se spojujeme s technologiemi. Pro inovátory i nadšence slibuje svět plný programátorského potenciálu.

Nahoru Další

20 nejlepších výzev ChatGPT pro sociální média (září 2025)

Nenechte si ujít

Od nuly k pokročilému rychlému inženýrství s Langchainem v Pythonu

Aayush Mittal

Posledních pět let jsem strávil ponořením se do fascinujícího světa strojového učení a hlubokého učení. Moje vášeň a odborné znalosti mě vedly k tomu, abych se podílel na více než 50 různých projektech softwarového inženýrství se zvláštním zaměřením na AI/ML. Moje neustálá zvědavost mě také přivedla ke zpracování přirozeného jazyka, což je obor, který bych rád dále prozkoumal.

Unite.AI