即时工程

探索 OpenAI 的 ChatGPT 代码解释器：深入探究其功能

更新 on 2023 年 8 月 21 日

OpenAI 在自然语言处理 (NLP) 方面的进步以大型语言模型 (LLM) 的兴起为标志，大型语言模型 (LLM) 支撑着数百万人使用的产品，包括编码助手 GitHub Copilot 和 Bing 搜索引擎。这些模型凭借其独特的记忆和合并信息的能力，在代码和文本生成等任务中树立了无与伦比的基准。

了解 ChatGPT 的代码解释器

要了解 ChatGPT 代码解释器的重要性，首先必须了解它是什么以及它是如何构建的。

从本质上讲，ChatGPT 代码解释器利用了 ChatGPT 的功能，但增强了理解、解释甚至跨多种编程语言生成代码的能力。此功能将 ChatGPT 从文本生成器转变为开发人员的宝贵工具，有助于代码理解、调试甚至代码生成。

编码培训 GPT：Codex 方法

以上皆是 GitHub 副驾驶和 ChatGPT 的代码解释器利用法典模型由 OpenAI 开发。

Codex 是一种专门的 GPT 语言模型，旨在具有熟练的 Python 代码编写能力。 Codex 经过 GitHub 公开源代码的培训，通过支持 GitHub Copilot 中的功能展示了其潜力。当评估其从文档字符串合成程序的能力（功能正确性的衡量标准）时，Codex 的表现优于两者 GPT-3 和 GPT-J.

一个惊人的观察结果是，重复采样提高了 Codex 的熟练程度。当每个问题使用多达 100 个样本时，模型的成功率会增加到 70.2%。这种效率表明可以使用启发式排名来挑选准确的代码样本，而无需对每个样本进行全面评估。

为了评估其功能，该模型的任务是仅基于文档字符串创建独立的 Python 函数。然后使用单元测试来衡量生成的代码的准确性。在包含 164 个原始编程问题（包括语言理解、算法和基本数学测试）的数据集中，Codex 解决了 12B 个参数 28.8% 一次尝试即可完成。

Codex 模型的训练数据：https://arxiv.org/abs/2107.03374

通过微调正确实现的独立函数来进一步磨练模型，其效率得到了提高，从而解决了 Codex-S 问题 37.7% 第一次尝试时面临的挑战。然而，在编程的实际领域中，试错方法很常见。 Codex-S 模型模仿了这一现实场景，在给予 100 次机会后，成功解决了 77.5% 的挑战。

像 ChatGPT 这样生成代码的生成模型通常通过将生成的样本与参考解决方案进行比较来进行评估。这种比较可以是精确的，也可以采用 BLEU 分数等相似性度量。然而，这些基于匹配的指标通常无法掌握编码的细微差别。对 BLEU 的一个关键批评是它在捕获代码语义特征方面效率低下。

人们提出了一种更相关的衡量标准，而不是仅仅依赖匹配：功能正确性。这意味着模型生成的代码应该通过一组给定的单元测试。这个想法与标准编码实践一致，因为开发人员经常使用单元测试来衡量代码的有效性和准确性。

该指标不仅评估准确性，还评估生成代码的功能可用性。

通过@k 引入度量作为功能正确性的度量。它本质上意味着，如果“k”个生成的代码示例中的任何一个通过了单元测试，则问题被视为已解决。然而，不只是以其直接形式使用它，而是使用无偏估计器来计算 pass@k 以避免高方差。

为了评估 ChatGPT 的代码能力，该研究利用了 人类评估 数据集。该数据集由手写的 Python 问题组成，每个问题都附有单元测试。

https://github.com/openai/code-align-evals-data/blob/main/human_eval

考虑到与运行未知或不受信任的代码相关的风险，沙箱环境被设计来安全地测试生成的代码。使用的这个环境 g遮阳板模拟资源并在主机系统和运行代码之间创建屏障。因此，即使该模型产生恶意代码，它仍然受到控制，不会损害主机或网络。

使用 ChatGPT 代码解释器

OpenAI 的 ChatGPT 经历了多次演变，其中代码解释器作为一项革命性功能脱颖而出 GPT-4模型。与传统的聊天界面不同，代码解释器允许用户更深入地研究计算任务，无缝融合人类与人工智能对话和计算过程之间的界限。

从本质上讲，代码解释器类似于将计算机嵌入聊天机器人中。此动态功能为用户提供临时磁盘空间来上传大量文件格式，从 TXT、PDF 和 JPEG 等常见类型到 CPP、PY 和 SQLite 等更专业的类型。这种广泛的支持增强了其在各种任务中的多功能性，无论是文档处理还是图像处理。

代码解释器在强大且安全的框架内运行，配备了 300 多个预安装的库。这种沙盒环境可确保安全性，同时仍提供大量计算能力。有趣的是，当接到任务时，它会实时编写一个 Python 脚本来执行用户的请求。以使用 OCR 将基于图像的 PDF 转换为可搜索格式为例；用户所需要做的就是上传文档，ChatGPT 会处理剩下的事情。

一个有趣的点是上传的文件大小限制。虽然最终规格尚未公布，但用户实验表明该系统可以有效处理大于 100MB 的文件。无论大小如何，重要的是要注意这些文件是暂时的，在聊天会话结束后将被丢弃。

代码解释器的辉煌之处不仅在于其技术实力，还在于其可访问性。 OpenAI 向 ChatGPT Plus 的订阅者提供此功能，该功能随 GPT-4 模型一起提供。因此，这种变革性工具不仅适用于技术精英，而且正在逐渐为更广泛的受众所使用。

标准 ChatGPT 模型和代码解释器之间的区别在于它们的交互范例。前者主要生成文本响应，而后者理解并执行代码，提供直接结果。这不仅使其成为技术专业人士的宝贵资产，而且还使那些没有编码知识的人能够执行复杂的计算任务。

ChatGPT 代码解释器的功能可以彻底改变软件开发和数据科学的多个方面：

自动代码生成：对于软件应用程序和数据分析脚本，只要给出高级描述，系统就可以生成样板结构或复杂的代码片段，从而加速开发和数据分析过程。
代码审查和数据验证：像 ChatGPT 这样的人工智能驱动工具可以帮助提高软件代码库的质量和安全性。此外，在数据科学领域，此类工具有助于审查和验证数据处理和转换脚本，确保准确性和效率。
数据分析协助：对于数据科学家来说，ChatGPT 代码解释器可以帮助生成用于初步数据探索、可视化甚至基本统计测试的代码，从而简化数据分析工作流程。

如果您热衷于了解有关 ChatGPT 和即时工程的复杂性的更多信息，Unite AI 提供了“ChatGPT：高级提示工程“。

设置 ChatGPT 代码解释器

代码解释器集成允许平台解释用户查询，将其作为 Python 代码执行，并以交互式聊天格式显示结果。要访问此功能，用户可以导航至 ChatGPT 设置，探索 Beta 功能部分，然后激活代码解释器。

它的与众不同之处在于其透明的机制。当用户提示任务时，平台会揭示处理过程的每个步骤，清楚地说明命令是如何解释和执行的。重要的是，出于隐私和安全原因，代码解释器在没有任何互联网连接的情况下运行。

探索 ChatGPT 代码解释器的优势

数据可视化 & 分析

ChatGPT 超越了传统图表的范围，提供传统和创新的图形表示。这确保用户可以以提供最有意义的见解的格式查看数据。

然而，这不仅仅是可视化原始数据。 ChatGPT 模型擅长处理和提炼数据。虽然功能强大，但用户应谨慎使用。

金融分析师会发现代码解释器分析和可视化股票价格的能力特别有用。通过无缝集成，用户可以上传数据集并以各种格式可视化它们。当个人可以进行复杂的数据分析时，此功能的重要性就很明显。

下面的视频演示了 ChatGPT 的代码解释器如何创建一个全面的 TSLA 股票分析。

关键精华:

特斯拉的股票面临波动，但在增长时期也显示出弹性。
特定日期的高交易量表明市场有浓厚的兴趣或对关键事件的反应。
年初至今（YTD）回报率的下降表明，投资者在考虑未来投资时应同时分析公司内部因素和外部市场状况。

实施计算机视觉和 OCR

人脸检测是计算机视觉中的一项重要功能，它是通过一种经典技术来实现的： Haar级联分类器来自 OpenCV。

下图展示了经典 Haar Cascade 分类器的使用。

从图像中提取文本的过程（称为光学字符识别 (OCR)）是使用 Tesseract 无缝实现的，文本随后由 GPT-4 结构化，从而增强了可理解性。

在以下视频中，了解 Tesseract (OCR) 如何从证书图像中提取文本。

代码解释器在视频、音频和图像处理领域表现出色。通过简单的命令，用户可以实现详细的编辑，例如将 GIF 转换为具有特定增强功能的 MP4。只需上传您的文件，输入您想要的修改，然后观看奇迹的发生。

ChatGPT 代码解释器内的 Python 外部库

ChatGPT 代码解释器是一个动态编程平台，配备了一组广泛的 Python 库。这些涵盖了从 Seaborn 的数据可视化到 Torch 的高级机器学习的一切。但它不仅仅是一个静态工具包。

受此启发聊天页面来自科拉科特·乔瓦瓦尼奇。

从最新的开始 nltk发布，我们将 .whl 文件上传到解释器。然后，我们指示 ChatGPT 通过分析现有包的位置来找到合适的站点包目录。下一步涉及将wheel文件解压到临时位置并将文件移动到识别的站点包目录。然而，这遇到了障碍。

为了寻求解决方法，我们提示：“请确保 NLTK 安装在 Python 环境中，并且安装后可以访问。”

ChatGPT 做出了回应，提供了解决方案。它建议将临时目录添加到 sys.path，允许 Python 识别并从该位置内解压的 nltk 包中提取模块。这一策略产生了奇迹，导致 NLTK 成功安装。

通过使用 .whl 文件，安装展示了独创性和适应性的结合。尽管面临最初的挑战，ChatGPT 代码解释器还是表现出了其多功能性和满足编码人员需求的承诺，确保新手和老手都能获得精致的编码体验。

@DominikPeters 最近发布的一条推文强调了一次独特的演示，精彩地展示了口译员的能力。 Peters 要求 GPT-4 生成有关巴黎各区的测验，该模型提供了一个运行良好的网站。工作测验可在 dominik-peters.de/gpt-arrondissement-quiz/ 上获得实践体验。