人工智能

GPT-2，人工智能文本生成器以完整形式发布

发布于 2019年11月6日

更新于 2026年5月25日

作者

Ljubinko Zivkovic

正如 TheNextWeb (TNW) 报道， OpenAI ，一个非盈利组织，负责多个人工智能项目，刚刚发布了 GPT-2 的最终模型，这是一个文本生成器，自二月份宣布发布以来，就引起了很大的争议。

根据 OpenAI 的研究论文 Language Models are Unsupervised Multitask Learners，“GPT-2 使用机器学习根据有限输入生成新文本。” 这意味着用户可以输入一两个句子关于任何主题，AI 生成器将生成与原始输入有关的文本。本质上，正如 TNW 注意到的，GPT-2 不像大多数“文本生成器”那样输出预写的字符串。 GPT-2 制作了以前不存在的文本。”

在他的推文中，卡内基梅隆大学图书馆的计划主任 Scott B. Weingart 给出了一个具体的例子:

什么是黑豹，但是一只年轻的狮子?

一个走廊里充满了人们的尖叫声。

这算是一个快乐的结局吗？ pic.twitter.com/qvPTrs790N

— Scott B. Weingart (@scott_bot) 2019年8月20日

如果死亡，在某个遥远的时刻，
击中我，当我睡着时，如果我还在做梦:
那是我与永恒共度的和平吗？
[…]
但是我担心它不会带来和平或休息
直到星星给我它们全部的光芒
让我看到所有的担忧和烦恼在瞬间。

糟糕。 pic.twitter.com/QRoi1C3rjj

— Scott B. Weingart (@scott_bot) 2019年8月20日

OpenAI 最初担心他们的系统可能被滥用，因此在 2019 年 2 月决定以四个部分在八个月内发布 GPT-2。正如他们在博客中解释的，“由于我们担心该技术的恶意应用，我们不会发布训练模型。作为一个负责任的披露实验，我们将发布一个较小的模型供研究人员实验，以及一篇技术论文。”

如解释，完整模型包含 15 亿个参数。 “模型训练的参数越多，它似乎就越‘聪明’——就像人类一样，熟能生巧。”

TNW 注意到，最初 OpenAI 发布了一个 1.24 亿参数的模型，随后发布了 3.55 亿和 7.74 亿参数的模型。根据他们的说法，在测试发布的模型后，“每次迭代都比前一次迭代有了显著的改进。”

为了防止滥用，OpenAI 发布了 GPT-2 检测模型，这些模型被设计为“预先防止滥用”。在他们的博客文章中，他们承认，这些检测模型仍需要额外的工作，以达到 GPT-2 本身目前取得的质量水平。

有兴趣的人可以在 Github 上下载 GPT-2 模型这里，查看模型卡这里，并阅读 OpenAI 的博客文章这里。

Ljubinko Zivkovic

前外交官和联合国翻译，目前自由撰稿人/作家/研究员，专注于现代技术、人工智能和现代文化。

Unite.AI

GPT-2，人工智能文本生成器以完整形式发布

You may like