人工智能

GPT-2,人工智能文本生成器以完整形式发布

mm

正如 TheNextWeb (TNW) 报道, OpenAI ,一个非盈利组织,负责多个人工智能项目,刚刚发布了 GPT-2 的最终模型,这是一个文本生成器,自二月份宣布发布以来,就引起了很大的争议。

根据 OpenAI 的研究论文 Language Models are Unsupervised Multitask Learners,“GPT-2 使用机器学习根据有限输入生成新文本。” 这意味着用户可以输入一两个句子关于任何主题,AI 生成器将生成与原始输入有关的文本。 本质上,正如 TNW 注意到的,GPT-2 不像大多数“文本生成器”那样输出预写的字符串。 GPT-2 制作了以前不存在的文本。”

在他的推文中,卡内基梅隆大学图书馆的计划主任 Scott B. Weingart 给出了一个具体的例子:

 

OpenAI 最初担心他们的系统可能被滥用,因此在 2019 年 2 月 决定以四个部分在八个月内发布 GPT-2。 正如他们在博客中解释的,“由于我们担心该技术的恶意应用,我们不会发布训练模型。 作为一个负责任的披露实验,我们将发布一个较小的模型供研究人员实验,以及一篇技术论文。”

如解释,完整模型包含 15 亿个参数。 “模型训练的参数越多,它似乎就越‘聪明’——就像人类一样,熟能生巧。”

TNW 注意到,最初 OpenAI 发布了一个 1.24 亿参数的模型,随后发布了 3.55 亿和 7.74 亿参数的模型。 根据他们的说法,在测试发布的模型后,“每次迭代都比前一次迭代有了显著的改进。”

为了防止滥用,OpenAI 发布了 GPT-2 检测模型,这些模型被设计为“预先防止滥用”。 在他们的 博客文章 中,他们承认,这些检测模型仍需要额外的工作,以达到 GPT-2 本身目前取得的质量水平。

有兴趣的人可以 在 Github 上下载 GPT-2 模型 这里,查看模型卡 这里,并阅读 OpenAI 的博客文章 这里

前外交官和联合国翻译,目前自由撰稿人/作家/研究员,专注于现代技术、人工智能和现代文化。