Rýchle inžinierstvo

Skúmanie prekladača kódu ChatGPT od OpenAI: Hlboký ponor do jeho schopností

Aktualizované on Augusta 21, 2023

Pokroky OpenAI v spracovaní prirodzeného jazyka (NLP) sú poznačené vzostupom veľkých jazykových modelov (LLM), ktoré podporujú produkty využívané miliónmi ľudí, vrátane asistenta kódovania GitHub Copilot a vyhľadávacieho nástroja Bing. Tieto modely vďaka svojej jedinečnej schopnosti zapamätať si a zlúčiť informácie nastavili bezkonkurenčné štandardy v úlohách, ako je generovanie kódu a textu.

Pochopenie tlmočníka kódu ChatGPT

Aby ste pochopili význam tlmočníka kódu ChatGPT, je nevyhnutné najprv pochopiť, čo to je a ako bol vytvorený.

Interpret kódov ChatGPT v podstate využíva možnosti ChatGPT, ale prináša rozšírenú odbornosť v porozumení, interpretácii a dokonca aj pri generovaní kódu v nespočetnom množstve programovacích jazykov. Táto funkcia transformuje ChatGPT z textového generátora na neoceniteľný nástroj pre vývojárov, ktorý pomáha pochopiť kód, ladiť a dokonca aj generovať kód.

Školenie GPT pre kódovanie: Kódexový prístup

Oba GitHub Copilot a Interpret kódu ChatGPT využiť Kódexový model vyvinuté spoločnosťou OpenAI.

Codex, špecializovaný jazykový model GPT, je navrhnutý tak, aby mal zdatné možnosti písania kódu v Pythone. Kódex, ktorý je vyškolený na kóde z GitHub z verejných zdrojov, predvádza svoj potenciál tým, že podporuje funkcie v GitHub Copilot. Keď sa hodnotí schopnosť syntetizovať programy z dokumentačných reťazcov, čo je miera funkčnej správnosti, Codex prekonáva oba GPT-3 a GPT-J.

Pozoruhodným postrehom je, že opakované vzorkovanie zvyšuje odbornosť Codexu. Keď sa použije až 100 vzoriek na problém, miera úspešnosti modelu sa zvýši na 70.2%. Takáto efektívnosť naznačuje možnosť použitia heuristického hodnotenia na výber presných vzoriek kódu bez toho, aby bolo potrebné úplné vyhodnotenie každého z nich.

Na vyhodnotenie svojich schopností bol model poverený vytvorením samostatných funkcií Pythonu založených výlučne na dokumentoch. Presnosť vygenerovaného kódu sa potom merala pomocou jednotkových testov. V súbore údajov, ktorý obsahuje 164 pôvodných programovacích problémov, ktoré zahŕňajú porozumenie jazyka, algoritmy a základné matematické testy, kódex s 12B parametrami vyriešil 28.8% z nich na jeden pokus.

Tréningové údaje pre Codex Model - interpret kódu chatgpt

Školiace údaje pre model Codex: https://arxiv.org/abs/2107.03374

Ďalším zdokonaľovaním modelu pomocou jemného doladenia správne implementovaných samostatných funkcií sa zvýšila jeho efektívnosť, čo viedlo k vyriešeniu Codex-S 37.7% výzvy na prvý pokus. V praktickej oblasti programovania je však bežný prístup pokus-omyl. Model Codex-S napodobňujúci tento scenár zo skutočného sveta, keď dostal 100 šancí, bol úspešne vyriešený 77.5% z výziev.

Generatívne modely ako ChatGPT, ktoré produkujú kód, sa zvyčajne hodnotia porovnaním vygenerovaných vzoriek s referenčným roztokom. Toto porovnanie môže byť presné alebo môže využívať mieru podobnosti, ako je skóre BLEU. Tieto metriky založené na zhode však často nedokážu pochopiť nuansy kódovania. Kľúčovou kritikou BLEU je jeho neefektívnosť pri zachytávaní sémantických charakteristík kódu.

Namiesto spoliehania sa výlučne na párovanie bolo navrhnuté relevantnejšie opatrenie: funkčná správnosť. To znamená, že kód vytvorený modelom by mal prejsť daným súborom jednotkových testov. Myšlienka je v súlade so štandardnými postupmi kódovania, pretože vývojári často používajú testy jednotiek na meranie účinnosti a presnosti svojho kódu.

Táto metrika nehodnotí len presnosť, ale aj funkčnú využiteľnosť vygenerovaného kódu.

pass@k metrika sa zavádza ako miera funkčnej správnosti. V podstate to znamená, že ak ktorákoľvek z „k“ vygenerovaných vzoriek kódu prejde jednotkovými testami, problém sa považuje za vyriešený. Avšak namiesto toho, aby sa to použilo len v jeho priamej forme, na výpočet pass@k sa používa nezaujatý odhad, aby sa predišlo vysokej odchýlke.

Na posúdenie schopností kódu ChatGPT výskum využil HumanEval súbor údajov. Tento súbor údajov pozostáva z ručne písaných problémov Pythonu, z ktorých každý je sprevádzaný jednotkovými testami.

Príklad trénovania chatgpt s otvoreným AI

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Vzhľadom na riziká spojené so spustením neznámeho alebo nedôveryhodného kódu bolo vytvorené prostredie sandbox, ktoré bezpečne otestuje vygenerovaný kód. Toto prostredie sa používa gVisor napodobniť zdroje a vytvoriť bariéru medzi hostiteľským systémom a spusteným kódom. Takže aj keď model produkuje škodlivý kód, zostáva uzavretý a nemôže poškodiť hostiteľa alebo sieť.

Používanie tlmočníka kódu ChatGPT

ChatGPT od OpenAI prešiel mnohými evolúciami, pričom Code Interpreter vyniká ako revolučná funkcia v model GPT-4. Na rozdiel od tradičných chatových rozhraní, Code Interpreter umožňuje užívateľom ponoriť sa hlbšie do výpočtových úloh, pričom plynule spája línie medzi konverzáciami medzi ľuďmi a AI a výpočtovými procesmi.

Vo svojom jadre je tlmočník kódu podobný tomu, že má počítač zabudovaný do chatbota. Táto dynamická funkcia ponúka používateľom dočasné miesto na disku na nahranie množstva formátov súborov od bežných typov, ako sú TXT, PDF a JPEG, až po špecializovanejšie, ako sú CPP, PY a SQLite. Táto šírka podpory umocňuje jeho všestrannosť naprieč rôznymi úlohami, či už ide o spracovanie dokumentov alebo manipuláciu s obrázkami.

Interpret kódu, ktorý funguje v robustnom a bezpečnom rámci, je vybavený viac ako 300 predinštalovanými knižnicami. Toto izolované prostredie zaisťuje bezpečnosť a zároveň poskytuje značný výpočtový výkon. Je zaujímavé, že keď dostane úlohu, vytvorí skript Python v reálnom čase, aby vykonal požiadavku používateľa. Vezmime si napríklad prevod obrázkového PDF do formátu s možnosťou vyhľadávania pomocou OCR; všetko, čo používateľ musí urobiť, je nahrať dokument a ChatGPT sa postará o zvyšok.

Zaujímavým bodom bol limit veľkosti súboru pre nahrávanie. Zatiaľ čo konečné špecifikácie ešte neboli oznámené, experimenty používateľov naznačujú, že systém dokáže efektívne spracovať súbory značne väčšie ako 100 MB. Bez ohľadu na veľkosť je dôležité poznamenať, že tieto súbory sú prechodné a po skončení chatovej relácie sa zahodia.

Brilantnosť programu Code Interpreter nespočíva len v jeho technickej zdatnosti, ale aj v jeho dostupnosti. OpenAI ponúka túto funkciu predplatiteľom služby ChatGPT Plus, ktorá sa dodáva s modelom GPT-4. Tento transformačný nástroj teda nie je určený len pre technickú elitu, ale postupne sa stáva dostupným pre širšie publikum.

Rozdiel medzi štandardným modelom ChatGPT a interpretom kódu spočíva v ich interakčných paradigmách. Kým prvý primárne generuje textové odpovede, druhý chápe a spúšťa kód a ponúka priame výsledky. To z neho robí nielen cenný prínos pre technických profesionálov, ale umožňuje aj tým, ktorí nemajú znalosti kódovania, vykonávať zložité výpočtové úlohy.

Funkcie ChatGPT Code Interpreter môžu spôsobiť revolúciu v niekoľkých aspektoch vývoja softvéru a dátovej vedy:

Automatizované generovanie kódu: V prípade softvérových aplikácií aj skriptov na analýzu údajov môže systém pri vysokoúrovňovom popise vytvárať štandardné štruktúry alebo zložité úryvky kódu, čím sa urýchľuje proces vývoja a analýzy údajov.
Kontrola kódu a validácia údajov: Nástroje poháňané AI, ako je ChatGPT, môžu pomôcť pri zvyšovaní kvality a bezpečnosti softvérových kódových báz. Okrem toho v oblasti vedy o údajoch môžu byť takéto nástroje nápomocné pri kontrole a overovaní skriptov na spracovanie a transformáciu údajov, čím sa zabezpečí presnosť a efektívnosť.
Pomoc pri analýze údajov: Pre vedcov údajov môže Interpret kódu ChatGPT pomôcť pri generovaní kódu na predbežné skúmanie údajov, vizualizáciu a dokonca aj základné štatistické testy, čím sa zjednoduší pracovný tok analýzy údajov.

Ak sa chcete dozvedieť viac o zložitosti ChatGPT a rýchlom inžinierstve, Unite AI ponúka komplexný prehľad v 'ChatGPT: Pokročilé rýchle inžinierstvo".

Nastavenie tlmočníka kódu ChatGPT

Integrácia interpreta kódu umožňuje platforme interpretovať používateľské dotazy, vykonávať ich ako kód Python a zobrazovať výsledky vo formáte interaktívneho chatu. Na prístup k tejto funkcii môžu používatelia prejsť na ChatGPT nastavenia, preskúmajte sekciu beta funkcií a aktivujte tlmočníka kódu.

To, čo ho odlišuje, je jeho transparentný mechanizmus. Keď používatelia požiadajú o zadanie úlohy, platforma odhalí každý krok cesty spracovania a poskytne jasnosť, ako sa príkazy interpretujú a vykonávajú. Dôležité je, že z dôvodov ochrany súkromia a bezpečnosti funguje interpret kódu bez akéhokoľvek internetového pripojenia.

Skúmanie výhod tlmočníka kódu ChatGPT

Vizualizácia dát a Analýza

ChatGPT presahuje rámec tradičných máp a ponúka konvenčné aj inovatívne grafické znázornenia. Používatelia si tak môžu prezerať svoje údaje vo formátoch, ktoré poskytujú najzmysluplnejšie informácie.

Nejde však len o vizualizáciu nespracovaných dát. Model ChatGPT je šikovný na spracovanie a spresnenie údajov. Hoci sú výkonné, používatelia by mali byť opatrní.

Finanční analytici považujú schopnosť interpreta kódov analyzovať a vizualizovať kurzy akcií za obzvlášť užitočnú. Vďaka bezproblémovej integrácii môžu používatelia nahrávať súbory údajov a vizualizovať ich v rôznych formátoch. Význam tejto funkcie je zrejmý, keď jednotlivci môžu vykonávať komplexné analýzy údajov.

Video nižšie ukazuje, ako interpret kódu ChatGPT vytvoril komplexný súbor TSLA analýza zásob.

Kľúčové jedlá:

Akcie spoločnosti Tesla čelili volatilite, ale tiež preukázali odolnosť v obdobiach rastu.
Vysoké objemy obchodov v konkrétne dni naznačujú značný záujem trhu alebo reakcie na kľúčové udalosti.
Zostupný celoročný výnos (YTD) naznačuje, že investori by mali pri zvažovaní budúcich investícií analyzovať vnútorné faktory spoločnosti aj vonkajšie trhové podmienky.

Implementácia počítačového videnia a OCR

K detekcii tváre, základnej funkcii počítačového videnia, sa pristúpilo klasickou technikou: the Klasifikátor Haarovej kaskády z OpenCV.

Obrázok nižšie ukazuje využitie klasického klasifikátora Haar Cascade.

Proces extrakcie textu z obrázkov, známy ako optické rozpoznávanie znakov (OCR), bol bezproblémovo dosiahnutý pomocou Tesseract, pričom text bol následne štruktúrovaný pomocou GPT-4, čím sa zlepšila zrozumiteľnosť.

V nasledujúcom videu si pozrite, ako Tesseract (OCR) extrahuje text z obrázka certifikátu.

Kódový interpret vyniká v oblasti manipulácie s videom, zvukom a obrazom. Pomocou jednoduchých príkazov môžu používatelia dosiahnuť podrobné úpravy, ako je napríklad prevod GIF na MP4 so špecifickými vylepšeniami. Jednoducho nahrajte svoj súbor, zadajte požadované úpravy a sledujte, ako sa kúzlo deje.

Externá knižnica Pythonu vo vašom prekladači kódu ChatGPT

Interpret kódu ChatGPT je dynamická programovacia platforma vybavená rozsiahlou sadou knižníc Pythonu. Tie pokrývajú všetko od vizualizácie dát pomocou Seaborn až po pokročilé strojové učenie cez Torch. Ale je to viac než len statická súprava nástrojov.

Inšpirované týmto Stránka Chatgpt od Korakota Chaovavanicha.

Počnúc najnovšími vydanie nltk, nahrali sme súbor .whl do tlmočníka. Potom sme dali pokyn ChatGPT, aby našiel vhodný adresár balíkov stránok analýzou umiestnenia existujúceho balíka. Ďalší krok zahŕňal rozbalenie súboru kolesa na dočasné miesto a presun súborov do identifikovaného adresára site-packages. To však narazilo na háčik.

Pri hľadaní riešenia sme vyzvali: „Zaistite, aby bol NLTK nainštalovaný v prostredí Pythonu a aby bol dostupný po inštalácii.“

ChatGPT odpovedal a poskytol riešenie. Navrhol pridanie dočasného adresára do sys.path, čo umožňuje Pythonu identifikovať a stiahnuť moduly z rozbaleného balíka nltk v rámci tohto umiestnenia. Táto taktika dokázala zázraky a viedla k úspešnej inštalácii NLTK.

Vďaka použitiu súborov .whl sa v inštalácii prejavila zmes vynaliezavosti a prispôsobivosti. Prekladač kódu ChatGPT napriek počiatočným výzvam prejavil svoju všestrannosť a odhodlanie vyhovieť potrebám kódovačov, čím zaistil nováčikom aj veteránom vycibrené skúsenosti s kódovaním.

Vo fascinujúcej prehliadke schopností tlmočníka nedávny tweet od @DominikPeters zdôraznil jedinečnú ukážku. Peters požiadal GPT-4, aby vygeneroval kvíz o parížskych obvodoch a model dodal dobre fungujúcu webovú stránku. Pracovný kvíz je k dispozícii na praktické vyskúšanie na dominik-peters.de/gpt-arrondissement-quiz/.

Keď som GPT-4 požiadal, aby mi kódoval kvíz v parížskom obvode, fungovalo to hneď po vybalení. https://t.co/Uhv7tPLspq pic.twitter.com/3agFZllEEQ
— Dominik Peters (@DominikPeters) Apríla 30, 2023

Balil

Prielom OpenAI s ChatGPT Code Interpreter nie je nič iné ako transformácia pre kóderov aj nekódujúcich. Jeho všestrannosť pri zvládaní širokého spektra úloh – od pomoci vývojárom pri ladení až po bezproblémové chrlenie parížskych kvízov – je dôkazom neobmedzeného potenciálu AI pri zlepšovaní našich digitálnych zážitkov. Tu je destilovaná esencia nášho hlbokého ponoru:

Pochopte svoj nástroj: Tak ako by ste sa spriatelili s kolegom, zoznámte sa s Tlmočníkom kódu. Je navrhnutý nad kódexom, ktorý je doladený z GPT-4. Jeho odbornosť zahŕňa viacero programovacích jazykov, vďaka čomu je ideálnym spoločníkom pre všetky vaše dobrodružstvá s kódovaním.

Prijmite revolúciu AI: Tradičné postupy kódovania čoskoro zaznamenajú seizmický posun. S nástrojmi poháňanými AI, ako je ChatGPT Code Interpreter, je možné urýchliť úlohy, ako je identifikácia chýb, generovanie kódu a dokonca aj kontrola kódu.

Beyond Just Code: Nájazd tlmočníka nie je obmedzený na text alebo kód. Jeho schopnosť pracovať s viacerými formátmi súborov, od jednoduchých súborov TXT až po zložité skripty PY, podčiarkuje jeho užitočnosť v rôznych doménach.

Nikdy neprestávajte experimentovať: Náš prieskum s inštaláciou knižnice NLTK odzrkadľuje dôležitosť vytrvalosti a adaptability, hodnôt, ktoré interpret kódu stelesňuje. Ak je nejaký háčik, často sa to dá obísť.

Pripojte sa ku konverzácii AI: Aplikácie v reálnom svete, ako to ukázal kvíz v parížskom obvode, podčiarkujú obrovskú užitočnosť tohto nástroja v reálnom svete. Prijmite to, preskúmajte to a nechajte to rozšíriť vaše projekty.

Vyššie uvedené video je vytvorené pomocou 2. gen a Stredná cesta.

Aby som to zhrnul, ChatGPT Code Interpreter je viac než len nástroj; mení to spôsob, akým sa spájame s technikou. Pre inovátorov aj nadšencov sľubuje svet plný potenciálu kódovania.

Nasledujúci

20 najlepších výziev ChatGPT pre sociálne médiá (máj 2024)

Nenechajte si ujsť

Od nuly do pokročilého rýchleho inžinierstva s Langchainom v Pythone

Aayush Mittal

Posledných päť rokov som strávil ponorením sa do fascinujúceho sveta strojového učenia a hlbokého učenia. Moja vášeň a odborné znalosti ma viedli k tomu, že som prispel k viac ako 50 rôznym projektom softvérového inžinierstva s osobitným zameraním na AI/ML. Moja neustála zvedavosť ma tiež priviedla k spracovaniu prirodzeného jazyka, oblasti, ktorú by som chcel ďalej skúmať.

Spojte sa.AI

Skúmanie prekladača kódu ChatGPT od OpenAI: Hlboký ponor do jeho schopností

Rýchle inžinierstvo

Skúmanie prekladača kódu ChatGPT od OpenAI: Hlboký ponor do jeho schopností

Obsah

Pochopenie tlmočníka kódu ChatGPT

Školenie GPT pre kódovanie: Kódexový prístup

Používanie tlmočníka kódu ChatGPT

Skúmanie výhod tlmočníka kódu ChatGPT

Vizualizácia dát a Analýza

Implementácia počítačového videnia a OCR

Externá knižnica Pythonu vo vašom prekladači kódu ChatGPT

Balil

Posledné príspevky

Spojte sa.AI

Skúmanie prekladača kódu ChatGPT od OpenAI: Hlboký ponor do jeho schopností

Obsah

Pochopenie tlmočníka kódu ChatGPT

Školenie GPT pre kódovanie: Kódexový prístup

Používanie tlmočníka kódu ChatGPT

Skúmanie výhod tlmočníka kódu ChatGPT

Vizualizácia dát a Analýza

Implementácia počítačového videnia a OCR

Externá knižnica Pythonu vo vašom prekladači kódu ChatGPT

Balil

Možno budete chcieť

Posledné príspevky