Prompt Engineering

Erforschung von OpenAIs ChatGPT-Code-Interpreter: Eine tiefe Analyse seiner Fähigkeiten

Veröffentlicht am 21. August 2023

Aktualisiert am 23. Mai 2026

Von

Aayush Mittal Mittal

OpenAIs Fortschritte im Bereich der Natural Language Processing (NLP) sind durch den Aufstieg von Large Language Models (LLMs) gekennzeichnet, die die Grundlage für Produkte wie den Coding-Assistenten GitHub Copilot und die Bing-Suchmaschine bilden. Diese Modelle haben durch ihre einzigartige Fähigkeit, Informationen zu speichern und zu kombinieren, unvergleichliche Benchmarks in Aufgaben wie Code- und Textgenerierung gesetzt.

Verständnis des ChatGPT-Code-Interpreters

Um die Bedeutung des ChatGPT-Code-Interpreters zu verstehen, ist es wichtig, zunächst zu verstehen, was er ist und wie er entwickelt wurde.

Im Wesentlichen nutzt der ChatGPT-Code-Interpreter die Fähigkeiten von ChatGPT, aber bringt eine verbesserte Fähigkeit zur Verständnis, Interpretation und sogar Generierung von Code in einer Vielzahl von Programmiersprachen. Diese Funktion verwandelt ChatGPT von einem Textgenerator in ein wertvolles Werkzeug für Entwickler, das bei der Codeverständnis, Fehlersuche und sogar Codegenerierung hilft.

Ausbildung von GPT für die Codierung: Der Codex-Ansatz

Sowohl GitHub Copilot als auch ChatGPTs Code-Interpreter nutzen das Codex-Modell, das von OpenAI entwickelt wurde.

Codex, ein spezialisiertes GPT-Sprachmodell, ist darauf ausgelegt, überzeugende Python-Code-Schreibfähigkeiten zu besitzen. Trainiert auf öffentlich zugänglichem Code von GitHub, zeigt Codex sein Potenzial, indem es Funktionen in GitHub Copilot antreibt. Wenn seine Fähigkeit, Programme aus Docstrings zu synthetisieren, bewertet wird, übertrifft Codex sowohl GPT-3 als auch GPT-J.

Ein auffälliges Merkmal ist, dass wiederholtes Sampling Codex’ Fähigkeiten verbessert. Wenn bis zu 100 Proben pro Problem verwendet werden, steigt die Erfolgsrate des Modells auf 70,2%. Eine solche Effizienz legt die Möglichkeit nahe, heuristische Bewertung zu verwenden, um genaue Codeproben auszuwählen, ohne eine vollständige Bewertung für jeden zu erfordern.

Um seine Fähigkeiten zu bewerten, wurde das Modell mit der Erstellung von eigenständigen Python-Funktionen allein auf der Grundlage von Docstrings beauftragt. Die Genauigkeit des generierten Codes wurde dann mit Hilfe von Unit-Tests bewertet. In einer Datenmenge, die 164 ursprüngliche Programmierprobleme umfasst, einschließlich Sprachverständnis, Algorithmen und grundlegender Mathetests, löste Codex mit 12-B-Parametern 28,8% davon bei einem ersten Versuch.

Trainingsdaten für das Codex-Modell - ChatGPT-Code-Interpreter

Trainingsdaten für das Codex-Modell: https://arxiv.org/abs/2107.03374

Indem das Modell weiter durch Feinabstimmung korrekt implementierter eigenständiger Funktionen verfeinert wurde, wurde seine Effizienz gesteigert, was dazu führte, dass Codex-S 37,7% der Herausforderungen beim ersten Versuch löste. Im praktischen Bereich der Programmierung ist jedoch ein Trial-and-Error-Ansatz üblich. Unter Nachahmung dieser realen Szenarien löste das Codex-S-Modell, wenn es 100 Chancen erhielt, erfolgreich 77,5% der Herausforderungen.

Generative Modelle wie ChatGPT, die Code produzieren, werden normalerweise durch Vergleichen der generierten Proben mit einer Referenzlösung bewertet. Dieser Vergleich kann entweder exakt sein oder ein Ähnlichkeitsmaß wie den BLEU-Score verwenden. Diese Übereinstimmungsbasierten Metriken erfassen jedoch oft nicht die Nuancen der Codierung. Ein wichtiger Kritikpunkt am BLEU-Score ist seine Unfähigkeit, die semantischen Merkmale des Codes zu erfassen.

Stattdessen wurde ein relevanteres Maß vorgeschlagen: funktionale Korrektheit. Dies bedeutet, dass der vom Modell produzierte Code eine gegebene Menge von Unit-Tests bestehen sollte. Die Idee stimmt mit den Standard-Coding-Praktiken überein, da Entwickler oft Unit-Tests verwenden, um die Effizienz und Genauigkeit ihres Codes zu bewerten.

Dieses Maß bewertet nicht nur die Genauigkeit, sondern auch die funktionale Nutzbarkeit des generierten Codes.

Das pass@k-Maß wird als Maß für funktionale Korrektheit eingeführt. Es bedeutet im Wesentlichen, dass, wenn eine der “k” generierten Codeproben die Unit-Tests bestehen, das Problem als gelöst gilt. Es wird jedoch anstelle der direkten Verwendung ein unvoreingenommener Schätzer verwendet, um pass@k zu berechnen, um eine hohe Varianz zu vermeiden.

Um die Codefähigkeiten von ChatGPT zu bewerten, wurde die HumanEval-Datenbank verwendet. Diese Datenbank besteht aus handgeschriebenen Python-Problemen, die jeweils von Unit-Tests begleitet werden.

ChatGPT-OpenAI-Trainingsdatensatz-Beispiel

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Da mit der Ausführung unbekannten oder unvertrauenswürdigen Codes Risiken verbunden sind, wurde eine Sandbox-Umgebung entwickelt, um den generierten Code sicher zu testen. Diese Umgebung nutzte gVisor, um Ressourcen zu emulieren und eine Barriere zwischen dem Host-System und dem laufenden Code zu schaffen. Somit bleibt der Code, auch wenn das Modell schädlichen Code produziert, eingeschlossen und kann das Host-System oder das Netzwerk nicht schädigen.

Verwendung des ChatGPT-Code-Interpreters

OpenAIs ChatGPT hat zahlreiche Evolutionen durchlaufen, wobei der Code-Interpreter als revolutionäres Feature im GPT-4-Modell hervorsticht. Im Gegensatz zu herkömmlichen Chat-Schnittstellen ermöglicht der Code-Interpreter es Benutzern, tiefer in computationale Aufgaben einzutauchen und nahtlos die Grenzen zwischen menschlichen Gesprächen und computativen Prozessen zu überbrücken.

Im Kern ist der Code-Interpreter ähnlich wie ein Computer, der in den Chatbot eingebettet ist. Diese dynamische Funktion bietet Benutzern temporären Speicherplatz, um eine Vielzahl von Dateiformaten hochzuladen, von gängigen Typen wie TXT, PDF und JPEG bis hin zu spezielleren wie CPP, PY und SQLite. Diese Breite an Unterstützung verstärkt seine Vielseitigkeit bei verschiedenen Aufgaben, sei es Dokumentenverarbeitung oder Bildbearbeitung.

Innerhalb eines robusten und sicheren Rahmens ist der Code-Interpreter mit über 300 vorinstallierten Bibliotheken ausgestattet. Diese sandboxbasierte Umgebung gewährleistet Sicherheit und bietet gleichzeitig erhebliche Rechenleistung. Interessanterweise erstellt der Code-Interpreter, wenn er aufgefordert wird, in Echtzeit ein Python-Skript, um die Anfrage des Benutzers auszuführen. Nehmen wir beispielsweise die Umwandlung eines bildbasierten PDF in ein durchsuchbares Format mithilfe von OCR; alles, was der Benutzer tun muss, ist, das Dokument hochzuladen, und ChatGPT erledigt den Rest.

Ein interessanter Punkt war die Dateigrößenbeschränkung für Uploads. Obwohl definitive Spezifikationen noch nicht bekannt gegeben wurden, deuten Benutzerexperimente darauf hin, dass das System Dateien effektiv verarbeiten kann, die erheblich größer als 100 MB sind. Unabhängig von der Größe ist es wichtig zu beachten, dass diese Dateien vorübergehend sind und nach dem Abschluss der Chat-Sitzung verworfen werden.

Die Brillanz des Code-Interpreters liegt nicht nur in seinem technischen Können, sondern auch in seiner Zugänglichkeit. OpenAI bietet dieses Feature Abonnenten von ChatGPT Plus an, das mit dem GPT-4-Modell ausgestattet ist. Somit ist dieses transformative Werkzeug nicht nur für die Tech-Elite bestimmt, sondern wird allmählich für ein breiteres Publikum zugänglich.

Die Unterscheidung zwischen dem Standard-ChatGPT-Modell und dem Code-Interpreter liegt in ihren Interaktionsparadigmen. Während das Former hauptsächlich textuelle Antworten generiert, versteht und führt der Letztere Code aus und bietet direkte Ergebnisse. Dies macht es nicht nur zu einem wertvollen Asset für Tech-Profis, sondern auch zu einem Werkzeug, das es auch Nicht-Programmierern ermöglicht, komplexe computative Aufgaben auszuführen.

Die Fähigkeiten des ChatGPT-Code-Interpreters können verschiedene Aspekte der Softwareentwicklung und der Datenwissenschaft revolutionieren:

Automatisierte Codegenerierung: Für Softwareanwendungen und Datenanalyse-Skripte kann das System, gegeben eine hochrangige Beschreibung, Boilerplate-Strukturen oder komplexe Code-Snippets produzieren, wodurch die Entwicklung und Datenanalyse beschleunigt werden.
Code-Überprüfung und Datenvalidierung: AI-gesteuerte Tools wie ChatGPT können dabei helfen, die Qualität und Sicherheit von Software-Codebasen zu verbessern. Im Bereich der Datenwissenschaft können solche Tools bei der Überprüfung und Validierung von Datenverarbeitungs- und Transformations-Skripten instrumental sein, um Genauigkeit und Effizienz zu gewährleisten.
Datenanalyse-Unterstützung: Für Datenwissenschaftler kann der ChatGPT-Code-Interpreter bei der Generierung von Code für vorläufige Datenexploration, Visualisierung und sogar grundlegende statistische Tests helfen, wodurch der Datenanalyse-Workflow erleichtert wird.

Wenn Sie mehr über die Feinheiten von ChatGPT und Prompt-Engineering erfahren möchten, bietet Unite AI eine umfassende Analyse in ‘ChatGPT: Advanced Prompt Engineering‘.

Einrichtung des ChatGPT-Code-Interpreters

Die Code-Interpreter-Integration ermöglicht es der Plattform, Benutzeranfragen zu interpretieren, sie als Python-Code auszuführen und die Ergebnisse in einem interaktiven Chat-Format anzuzeigen. Um auf dieses Feature zuzugreifen, können Benutzer zur ChatGPT-Einstellungen navigieren, den Beta-Features-Bereich erkunden und den Code-Interpreter aktivieren.

Was es von anderen unterscheidet, ist sein transparenter Mechanismus. Wenn Benutzer eine Aufgabe anfordern, enthüllt die Plattform jeden Schritt der Verarbeitungsreise, wodurch Klarheit über die Interpretation und Ausführung von Befehlen geschaffen wird. Wichtig ist, dass der Code-Interpreter aus Gründen der Privatsphäre und Sicherheit ohne Internetverbindung funktioniert.

Erkundung der Vorteile des ChatGPT-Code-Interpreters

Datenvisualisierung & Analyse

ChatGPT geht über den Rahmen herkömmlicher Diagramme hinaus und bietet sowohl konventionelle als auch innovative grafische Darstellungen. Dies ermöglicht es Benutzern, ihre Daten in Formaten zu betrachten, die die bedeutendsten Erkenntnisse liefern.

Es geht jedoch nicht nur um die Visualisierung von Rohdaten. Das ChatGPT-Modell ist auch in der Lage, Daten zu verarbeiten und zu verfeinern. Obwohl es leistungsfähig ist, sollten Benutzer Vorsicht walten lassen.

Finanzanalysten werden die Fähigkeit des Code-Interpreters, Aktienkurse zu analysieren und zu visualisieren, besonders nützlich finden. Durch nahtlose Integration können Benutzer Datenmengen hochladen und sie in verschiedenen Formaten visualisieren. Die Bedeutung dieser Funktion ist offensichtlich, wenn Individuen komplexe Datenanalysen durchführen können.

Das folgende Video zeigt, wie ChatGPTs Code-Interpreter eine umfassende TSLA-Aktienanalyse erstellte.

Wichtige Punkte:

Teslas Aktie hat mit Volatilität zu kämpfen, zeigt aber auch Zeichen der Widerstandsfähigkeit mit Perioden des Wachstums.
Hohe Handelsvolumina an bestimmten Tagen deuten auf ein starkes Marktenthusiasmus oder Reaktionen auf wichtige Ereignisse hin.
Die negative Jahresrendite (YTD) legt nahe, dass Anleger sowohl interne Unternehmensfaktoren als auch externe Markteinflüsse analysieren sollten, wenn sie zukünftige Investitionen in Betracht ziehen.

Implementierung von Computer Vision und OCR

Ein Gesichtserkennungsalgorithmus, ein wesentlicher Bestandteil der Computer-Vision, wurde mit einer klassischen Technik angegangen: dem Haar-Cascade-Klassifizierer von OpenCV.

Das folgende Bild zeigt die Verwendung des klassischen Haar-Cascade-Klassifizierers.

Der Prozess der Textextraktion aus Bildern, bekannt als optische Zeichenerkennung (OCR), wurde mithilfe von Tesseract nahtlos durchgeführt, und der Text wurde anschließend von GPT-4 strukturiert, um die Verständlichkeit zu verbessern.

In dem folgenden Video sehen Sie, wie Tesseract (OCR) Text aus einem Zertifikatsbild extrahiert.

Der Code-Interpreter überzeugt im Bereich von Video-, Audio- und Bildbearbeitung. Mit einfachen Befehlen können Benutzer detaillierte Bearbeitungen durchführen, wie z.B. die Umwandlung von GIFs in MP4s mit bestimmten Verbesserungen. Einfach die Datei hochladen, die gewünschten Änderungen eingeben und das Ergebnis beobachten.

Python-Externe Bibliothek im ChatGPT-Code-Interpreter

Der ChatGPT-Code-Interpreter ist eine dynamische Programmierplattform, die mit einer umfangreichen Sammlung von Python-Bibliotheken ausgestattet ist. Diese reichen von Datenvisualisierung mit Seaborn bis hin zu fortschrittlichem maschinellem Lernen mit Torch. Es ist jedoch mehr als nur ein statisches Werkzeug.

Angeregt durch diese ChatGPT-Seite von Korakot Chaovavanich.

Beginnend mit der neuesten nltk-Version, haben wir eine .whl-Datei zum Interpreter hochgeladen. Wir haben dann ChatGPT angewiesen, den geeigneten site-packages-Verzeichnis durch Analyse des Speicherorts einer bestehenden Pakets zu finden. Der nächste Schritt bestand darin, die Wheel-Datei in einen temporären Speicherort zu entpacken und die Dateien in das identifizierte site-packages-Verzeichnis zu verschieben. Dies stieß jedoch auf ein Hindernis.

Als Ausweg haben wir angeregt: “Bitte stellen Sie sicher, dass NLTK in der Python-Umgebung installiert wird und nach der Installation zugänglich ist.”

ChatGPT antwortete mit einer Lösung. Es schlug vor, den temporären Verzeichnis zu sys.path hinzuzufügen, um es Python zu ermöglichen, Module aus dem entpackten NLTK-Paket in diesem Speicherort zu erkennen. Diese Taktik funktionierte hervorragend und führte zur erfolgreichen Installation von NLTK.

Durch die Verwendung von .whl-Dateien zeigte die Installation eine Mischung aus Erfindungsreichtum und Anpassungsfähigkeit. Der ChatGPT-Code-Interpreter, trotz anfänglicher Herausforderungen, zeigte seine Vielseitigkeit und sein Engagement, die Bedürfnisse von Programmierern zu erfüllen, und garantierte sowohl Anfängern als auch erfahrenen Programmierern eine verfeinerte Codiererfahrung.

In einer faszinierenden Demonstration der Fähigkeiten des Interpreters hat ein kürzlicher Tweet von @DominikPeters eine einzigartige Demonstration hervorgehoben. Peters bat GPT-4, einen Quiz über Pariser Arrondissements zu erstellen, und das Modell lieferte eine funktionierende Website. Der funktionierende Quiz ist auf dominik-peters.de/gpt-arrondissement-quiz/ verfügbar.

https://twitter.com/DominikPeters/status/1652630445639467008?s=20

Zusammenfassung

OpenAIs Durchbruch mit dem ChatGPT-Code-Interpreter ist nichts weniger als eine Transformation für Programmierer und Nicht-Programmierer gleichermaßen. Seine Vielseitigkeit bei der Bewältigung einer Vielzahl von Aufgaben – von der Unterstützung von Entwicklern bei der Fehlersuche bis hin zur Erstellung von Pariser Quizzes – ist ein Zeugnis für das unendliche Potenzial von KI bei der Verbesserung unserer digitalen Erfahrungen. Hier ist die Essenz unserer tiefen Analyse:

Verstehen Sie Ihr Werkzeug: Genau wie Sie einen Kollegen kennenlernen würden, sollten Sie sich mit dem Code-Interpreter vertraut machen. Er basiert auf Codex, das aus GPT-4 feinabgestimmt wurde. Seine Fähigkeiten umfassen mehrere Programmiersprachen, was es zu einem idealen Begleiter für alle Ihre Programmierabenteuer macht.

Die KI-Revolution umarmen: Traditionelle Programmierpraktiken stehen vor einer seismischen Verschiebung. Mit KI-gesteuerten Tools wie dem ChatGPT-Code-Interpreter können Aufgaben wie Fehlersuche, Codegenerierung und sogar Code-Überprüfung beschleunigt werden.

Jenseits von Code: Der Code-Interpreter ist nicht nur auf Text oder Code beschränkt. Seine Fähigkeit, mit verschiedenen Dateiformaten umzugehen, von einfachen TXT-Dateien bis hin zu komplexen PY-Skripten, unterstreicht seine Nützlichkeit in verschiedenen Bereichen.

Nie aufhören zu experimentieren: Unsere Erfahrung mit der Installation der NLTK-Bibliothek spiegelt die Bedeutung von Beharrlichkeit und Anpassungsfähigkeit wider, Werte, die der Code-Interpreter verkörpert. Wenn es ein Hindernis gibt, gibt es oft einen Weg drum herum.

Der KI-Gespräch beitreten: Realweltanwendungen, wie sie durch den Pariser Arrondissements-Quiz demonstriert werden, unterstreichen die enorme realweltliche Nützlichkeit des Tools. Nehmen Sie es an, erkunden Sie es und lassen Sie es Ihre Projekte verstärken.

Das obige Video wurde mit Gen-2 und Midjourney erstellt.

Zusammengefasst ist der ChatGPT-Code-Interpreter mehr als nur ein Werkzeug; er verändert die Art und Weise, wie wir mit Technologie interagieren. Für Innovatoren und Enthusiasten gleichermaßen verspricht er eine Welt voller Codierungspotenzial.

Aayush Mittal, Mittal

Ich habe die letzten fünf Jahre damit verbracht, mich in die faszinierende Welt des Machine Learning und Deep Learning zu vertiefen. Mein Engagement und meine Expertise haben mich dazu geführt, an über 50 verschiedenen Software-Entwicklungsprojekten mit einem besonderen Fokus auf AI/ML beizutragen. Meine anhaltende Neugier hat mich auch zum Bereich der Natural Language Processing hingezogen, einem Feld, das ich weiter erforschen möchte.

Unite.AI