Szybka inżynieria

Odkrywanie interpretera kodu ChatGPT OpenAI: głębokie zanurzenie się w jego możliwościach

Opublikowany August 21, 2023

Aayush Mittal Mittala

Postępy OpenAI w przetwarzaniu języka naturalnego (NLP) charakteryzują się rozwojem modeli dużego języka (LLM), które stanowią podstawę produktów używanych przez miliony, w tym asystenta kodowania GitHub Copilot i wyszukiwarki Bing. Modele te, dzięki swojej wyjątkowej zdolności do zapamiętywania i łączenia informacji, ustanowiły niezrównane standardy w zadaniach takich jak generowanie kodu i tekstu.

Zrozumienie interpretera kodu ChatGPT

Aby zrozumieć znaczenie interpretera kodu ChatGPT, należy najpierw zrozumieć, czym on jest i jak został zbudowany.

Zasadniczo interpreter kodu ChatGPT wykorzystuje możliwości ChatGPT, ale wprowadza zwiększoną biegłość w rozumieniu, interpretowaniu, a nawet generowaniu kodu w niezliczonej liczbie języków programowania. Ta funkcja przekształca ChatGPT z generatora tekstu w nieocenione narzędzie dla programistów, pomagające w zrozumieniu kodu, debugowaniu, a nawet generowaniu kodu.

Szkolenie GPT w zakresie kodowania: podejście do Kodeksu

Obie Drugi pilot GitHub oraz Interpreter kodu ChatGPT wykorzystać Model Kodeksu opracowany przez OpenAI.

Codex, wyspecjalizowany model języka GPT, został zaprojektowany tak, aby zapewniał sprawne możliwości pisania kodu w języku Python. Wyszkolony w oparciu o kod źródłowy z GitHub, Codex prezentuje swój potencjał, obsługując funkcje GitHub Copilot. Oceniany pod kątem zdolności do syntezy programów na podstawie dokumentów, co jest miarą poprawności funkcjonalnej, Codex przewyższa oba GPT-3 oraz GPT-J.

Uderzającą obserwacją jest to, że wielokrotne pobieranie próbek zwiększa biegłość Codexu. Gdy na problem zostanie wykorzystanych do 100 próbek, wskaźnik powodzenia modelu wzrasta do 70.2%. Taka wydajność sugeruje możliwość wykorzystania rankingu heurystycznego do wybrania dokładnych próbek kodu, bez konieczności pełnej oceny każdego z nich.

Aby ocenić jego możliwości, modelowi powierzono zadanie stworzenia samodzielnych funkcji Pythona opartych wyłącznie na dokumentach. Dokładność wygenerowanego kodu została następnie sprawdzona za pomocą testów jednostkowych. W zbiorze danych obejmującym 164 oryginalne problemy programistyczne, które obejmują zrozumienie języka, algorytmy i podstawowe testy matematyczne, rozwiązano Kodeks z parametrami 12B 28.8% z nich przy jednej próbie.

Dane szkoleniowe dla modelu Codex - interpreter kodu chatgpt

Dane szkoleniowe dla modelu Kodeksu: https://arxiv.org/abs/2107.03374

Dalsze udoskonalanie modelu poprzez dostrojenie prawidłowo zaimplementowanych samodzielnych funkcji zwiększyło jego wydajność, co doprowadziło do rozwiązania problemu Codex-S 37.7% wyzwań już za pierwszym podejściem. Jednak w praktycznej dziedzinie programowania powszechne jest podejście prób i błędów. Naśladując ten scenariusz ze świata rzeczywistego, model Codex-S, po otrzymaniu 100 szans, został pomyślnie rozwiązany 77.5% wyzwań.

Modele generatywne, takie jak ChatGPT, które tworzą kod, są zwykle oceniane poprzez porównanie wygenerowanych próbek z rozwiązaniem referencyjnym. Porównanie to może być dokładne lub wykorzystywać miarę podobieństwa, taką jak wynik BLEU. Jednak te wskaźniki oparte na dopasowaniach często nie uwzględniają niuansów kodowania. Kluczową krytyką BLEU jest jego nieskuteczność w przechwytywaniu cech semantycznych kodu.

Zamiast polegać wyłącznie na dopasowaniu, zaproponowano bardziej odpowiedni miernik: poprawność funkcjonalną. Oznacza to, że kod wygenerowany przez model powinien przejść zadany zestaw testów jednostkowych. Pomysł jest zgodny ze standardowymi praktykami kodowania, ponieważ programiści często korzystają z testów jednostkowych, aby ocenić skuteczność i dokładność swojego kodu.

Metryka ta ocenia nie tylko dokładność, ale także użyteczność funkcjonalną wygenerowanego kodu.

przepustka@k Wprowadzono metrykę jako miarę poprawności funkcjonalnej. Zasadniczo oznacza to, że jeśli którakolwiek z „k” wygenerowanych próbek kodu przejdzie testy jednostkowe, problem uznaje się za rozwiązany. Jednak zamiast używać tego w bezpośredniej formie, do obliczenia pass@k używany jest nieobciążony estymator, aby uniknąć dużej wariancji.

Aby ocenić możliwości kodu ChatGPT, w badaniu wykorzystano HumanEval zbiór danych. Ten zestaw danych składa się z ręcznie napisanych problemów w języku Python, którym towarzyszą testy jednostkowe.

Przykład zbioru danych szkolenia Chatgpt Open AI

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Biorąc pod uwagę ryzyko związane z uruchamianiem nieznanego lub niezaufanego kodu, zaprojektowano środowisko piaskownicy w celu bezpiecznego testowania wygenerowanego kodu. To środowisko używane g Wizjer emulować zasoby i tworzyć barierę pomiędzy systemem hosta a działającym kodem. Zatem nawet jeśli model wygeneruje złośliwy kod, pozostaje on zabezpieczony i nie może wyrządzić szkody hostowi ani sieci.

Korzystanie z interpretera kodu ChatGPT

ChatGPT OpenAI przeszedł liczne ewolucje, a interpreter kodu wyróżnia się jako rewolucyjna funkcja w środowisku Model GPT-4. W przeciwieństwie do tradycyjnych interfejsów czatu, Interpreter Kodu pozwala użytkownikom głębiej zanurzyć się w zadaniach obliczeniowych, płynnie łącząc rozmowy między ludźmi i sztuczną inteligencją a procesami obliczeniowymi.

W swej istocie Interpreter Kodu przypomina komputer wbudowany w chatbota. Ta dynamiczna funkcja oferuje użytkownikom tymczasowe miejsce na dysku do przesyłania wielu formatów plików, od popularnych typów, takich jak TXT, PDF i JPEG, po bardziej wyspecjalizowane, takie jak CPP, PY i SQLite. Tak szeroki zakres wsparcia zwiększa jego wszechstronność w przypadku różnych zadań, czy to przetwarzania dokumentów, czy manipulacji obrazami.

Działając w solidnej i bezpiecznej strukturze, Interpreter Kodu jest wyposażony w ponad 300 preinstalowanych bibliotek. To środowisko piaskownicy zapewnia bezpieczeństwo, a jednocześnie zapewnia znaczną moc obliczeniową. Co ciekawe, po otrzymaniu zadania tworzy skrypt w języku Python w czasie rzeczywistym, aby wykonać żądanie użytkownika. Weźmy na przykład konwersję pliku PDF zawierającego obrazy do formatu z możliwością wyszukiwania za pomocą OCR; jedyne, co użytkownik musi zrobić, to przesłać dokument, a ChatGPT zajmie się resztą.

Intrygującym punktem był limit rozmiaru przesyłanych plików. Chociaż ostateczne specyfikacje nie zostały jeszcze ogłoszone, eksperymenty użytkowników sugerują, że system może skutecznie przetwarzać pliki znacznie większe niż 100 MB. Niezależnie od rozmiaru, należy pamiętać, że pliki te mają charakter tymczasowy i są usuwane po zakończeniu sesji czatu.

Genialność Code Interpreter to nie tylko jego sprawność techniczna, ale także jego dostępność. OpenAI oferuje tę funkcję abonentom ChatGPT Plus, który jest dostarczany z modelem GPT-4. Dlatego to narzędzie do transformacji jest przeznaczone nie tylko dla elity technologicznej, ale stopniowo staje się dostępne dla szerszego grona odbiorców.

Różnica między standardowym modelem ChatGPT a interpreterem kodu polega na ich paradygmatach interakcji. Podczas gdy ten pierwszy generuje głównie odpowiedzi tekstowe, drugi rozumie i wykonuje kod, oferując bezpośrednie wyniki. Dzięki temu jest to nie tylko cenny nabytek dla profesjonalistów z branży technologicznej, ale także umożliwia osobom nieposiadającym wiedzy z zakresu kodowania wykonywanie złożonych zadań obliczeniowych.

Możliwości interpretera kodu ChatGPT mogą zrewolucjonizować kilka aspektów tworzenia oprogramowania i nauki o danych:

Automatyczne generowanie kodu: Zarówno w przypadku aplikacji, jak i skryptów analizy danych, po zastosowaniu opisu wysokiego poziomu, system może tworzyć standardowe struktury lub skomplikowane fragmenty kodu, przyspieszając procesy programowania i analizy danych.
Recenzje kodu i weryfikacja danych: Narzędzia oparte na sztucznej inteligencji, takie jak ChatGPT, mogą pomóc w poprawie jakości i bezpieczeństwa baz kodów oprogramowania. Dodatkowo w dziedzinie analityki danych narzędzia takie mogą odegrać zasadniczą rolę w przeglądaniu i walidacji skryptów przetwarzania i transformacji danych, zapewniając dokładność i wydajność.
Pomoc w analizie danych: Dla badaczy danych interpreter kodu ChatGPT może pomóc w generowaniu kodu do wstępnej eksploracji danych, wizualizacji, a nawet podstawowych testów statystycznych, ułatwiając w ten sposób przepływ pracy w analizie danych.

Jeśli chcesz dowiedzieć się więcej na temat zawiłości ChatGPT i szybkiej inżynierii, Unite AI oferuje kompleksowy podział w „ChatGPT: Zaawansowana szybka inżynieria".

Konfigurowanie interpretera kodu ChatGPT

Integracja z interpreterem kodu umożliwia platformie interpretowanie zapytań użytkowników, wykonywanie ich jako kodu w języku Python i wyświetlanie wyników w formacie interaktywnego czatu. Aby uzyskać dostęp do tej funkcji, użytkownicy mogą przejść do ChatGPT ustawień, zapoznaj się z sekcją Funkcje Beta i aktywuj Interpreter kodu.

To, co go wyróżnia, to przejrzysty mechanizm. Gdy użytkownicy zgłaszają zadanie, platforma ujawnia każdy etap procesu przetwarzania, zapewniając przejrzystość interpretacji i wykonywania poleceń. Co ważne, ze względów prywatności i bezpieczeństwa, Interpreter Kodu działa bez połączenia z Internetem.

Odkrywanie zalet interpretera kodu ChatGPT

Wizualizacja danych & Analiza

ChatGPT wykracza poza zakres tradycyjnych wykresów, oferując zarówno konwencjonalne, jak i innowacyjne reprezentacje graficzne. Dzięki temu użytkownicy mogą przeglądać swoje dane w formatach zapewniających najbardziej znaczące informacje.

Jednak nie chodzi tylko o wizualizację surowych danych. Model ChatGPT jest specjalistą w przetwarzaniu i udoskonalaniu danych. Choć jest potężny, użytkownicy powinni zachować ostrożność.

Analitycy finansowi uznają zdolność Interpretera Kodeksu do analizowania i wizualizacji kursów akcji za szczególnie przydatną. Dzięki bezproblemowej integracji użytkownicy mogą przesyłać zestawy danych i wizualizować je w różnych formatach. Znaczenie tej funkcji jest oczywiste, gdy jednostki mogą przeprowadzać złożone analizy danych.

Poniższy film pokazuje, jak interpreter kodu ChatGPT stworzył kompleksowy plik TSLA analiza zapasów.

Na wynos:

Akcje Tesli charakteryzują się zmiennością, ale wykazują również odporność w okresach wzrostu.
Wysokie wolumeny obrotu w określone dni wskazują na duże zainteresowanie rynku lub reakcje na kluczowe wydarzenia.
Spadkowa stopa zwrotu od początku roku (YTD) sugeruje, że rozważając przyszłe inwestycje inwestorzy powinni przeanalizować zarówno czynniki wewnętrzne firmy, jak i zewnętrzne warunki rynkowe.

Implementacja wizji komputerowej i OCR

Do wykrywania twarzy, kluczowej funkcji widzenia komputerowego, podjęto klasyczną technikę: Klasyfikator kaskadowy Haara z OpenCV.

Poniższy obraz przedstawia wykorzystanie klasycznego klasyfikatora kaskadowego Haara.

Proces wyodrębniania tekstu z obrazów, znany jako optyczne rozpoznawanie znaków (OCR), został bezproblemowo przeprowadzony przy użyciu Tesseract, a tekst został następnie uporządkowany według GPT-4, co zwiększyło zrozumiałość.

W poniższym filmie zobaczysz, jak Tesseract (OCR) wyodrębnia tekst z obrazu certyfikatu.

Interpreter kodu wyróżnia się w dziedzinie manipulacji wideo, audio i obrazem. Za pomocą prostych poleceń użytkownicy mogą wprowadzać szczegółowe zmiany, takie jak konwersja plików GIF na pliki MP4 z określonymi ulepszeniami. Po prostu prześlij plik, wprowadź żądane modyfikacje i obserwuj, jak dzieje się magia.

Zewnętrzna biblioteka Pythona w interpreterze kodu ChatGPT

Interpreter kodu ChatGPT to dynamiczna platforma programistyczna wyposażona w rozbudowany zestaw bibliotek Pythona. Obejmują one wszystko, od wizualizacji danych za pomocą Seaborn po zaawansowane uczenie maszynowe za pośrednictwem Torch. Ale to coś więcej niż statyczny zestaw narzędzi.

Zainspirowany tym Strona Chatgpt od Korakota Chaovavanicha.

Zaczynając od najnowszego wydanie nltk, przesłaliśmy plik .whl do Interpretera. Następnie poinstruowaliśmy ChatGPT, aby zlokalizował odpowiedni katalog pakietów witryn, analizując lokalizację istniejącego pakietu. Następnym krokiem było rozpakowanie pliku koła do tymczasowego miejsca i przeniesienie plików do wskazanego katalogu site-packages. Jednak to napotkało przeszkodę.

Szukając rozwiązania, poprosiliśmy: „Prosimy upewnić się, że NLTK zostanie zainstalowany w środowisku Python i będzie dostępny po instalacji”.

ChatGPT odpowiedział, dostarczając rozwiązanie. Zasugerowano dodanie katalogu tymczasowego do sys.path, co umożliwi Pythonowi identyfikację i pobranie modułów z rozpakowanego pakietu nltk w tej lokalizacji. Ta taktyka zdziałała cuda, prowadząc do pomyślnej instalacji NLTK.

Dzięki wykorzystaniu plików .whl instalacja wykazała połączenie pomysłowości i możliwości adaptacji. Interpreter kodu ChatGPT, pomimo początkowych wyzwań, wykazał swoją wszechstronność i zaangażowanie w zaspokajanie potrzeb programistów, zapewniając zarówno nowicjuszom, jak i weteranom wyrafinowane doświadczenie w kodowaniu.

W fascynującym pokazie możliwości tłumacza niedawny tweet @DominikPeters podkreślił wyjątkową demonstrację. Peters poprosił GPT-4 o wygenerowanie quizu na temat dzielnic Paryża, a model dostarczył dobrze działającą stronę internetową. Działający quiz jest dostępny do praktycznego wykorzystania na stronie dominik-peters.de/gpt-arrondissement-quiz/.

Poprosiłem GPT-4 o zakodowanie quizu dotyczącego dzielnic Paryża, zadziałało od razu. https://t.co/Uhv7tPLspq pic.twitter.com/3agFZllEEQ

— Dominik Peters (@DominikPeters) 30 kwietnia 2023 r.

Owijanie w górę

Przełom w OpenAI dzięki interpreterowi kodów ChatGPT jest po prostu transformacją zarówno dla programistów, jak i osób niekodujących. Jego wszechstronność w wykonywaniu szerokiego zakresu zadań — od pomocy programistom w debugowaniu po łatwe tworzenie paryskich quizów — świadczy o nieograniczonym potencjale sztucznej inteligencji w ulepszaniu naszych cyfrowych doświadczeń. Oto destylowana esencja naszego głębokiego nurkowania:

Zrozum swoje narzędzie: Tak jak zaprzyjaźniłbyś się z kolegą, zapoznaj się z Interpreterem Kodu. Został zaprojektowany w oparciu o Codex, który jest dostrojony z GPT-4. Jego biegłość obejmuje wiele języków programowania, co czyni go idealnym towarzyszem wszystkich Twoich przygód z kodowaniem.

Przyjmij rewolucję AI: Tradycyjne praktyki kodowania wkrótce ulegną gwałtownej zmianie. Dzięki narzędziom opartym na sztucznej inteligencji, takim jak interpreter kodu ChatGPT, można przyspieszyć zadania takie jak identyfikacja błędów, generowanie kodu, a nawet przeglądanie kodu.

Więcej niż tylko kod: Wyprawa tłumacza nie ogranicza się do tekstu lub kodu. Jego zdolność do obsługi wielu formatów plików, od prostych plików TXT po złożone skrypty PY, podkreśla jego użyteczność w różnych domenach.

Nigdy nie przestawaj eksperymentować: Nasze eksploracje związane z instalacją biblioteki NLTK odzwierciedlają znaczenie trwałości i zdolności adaptacyjnych, czyli wartości, które ucieleśnia Interpreter Kodu. Jeśli jest jakiś problem, często można go obejść.

Dołącz do rozmowy o sztucznej inteligencji: Zastosowania w świecie rzeczywistym, jak zaprezentowano w quizie dotyczącym dzielnic Paryża, podkreślają ogromną użyteczność tego narzędzia w świecie rzeczywistym. Przyjmij to, eksploruj i pozwól, aby wzmocniło Twoje projekty.

Powyższy film powstał przy użyciu styczeń-2 oraz W połowie drogi.

Podsumowując, Interpreter Kodu ChatGPT to coś więcej niż tylko narzędzie; zmienia sposób, w jaki łączymy się z technologią. Zarówno dla innowatorów, jak i entuzjastów obiecuje świat pełen potencjału kodowania.

W przyszłym

20 najlepszych monitów ChatGPT do mediów społecznościowych (sierpień 2025)

Nie przegap

Inżynieria od zera do zaawansowanej szybkiej inżynierii z Langchain w Pythonie

Aayush Mittal

Ostatnie pięć lat spędziłem zanurzając się w fascynującym świecie uczenia maszynowego i głębokiego uczenia się. Moja pasja i wiedza sprawiły, że uczestniczyłem w ponad 50 różnorodnych projektach z zakresu inżynierii oprogramowania, ze szczególnym uwzględnieniem AI/ML. Moja ciągła ciekawość przyciągnęła mnie również w stronę przetwarzania języka naturalnego – dziedziny, którą chcę dalej zgłębiać.

Zjednoczyć.AI