人工智能
GPT-2,人工智能文本生成器以完整形式发布

正如 TheNextWeb (TNW) 报道, OpenAI ,一个非盈利组织,负责多个人工智能项目,刚刚发布了 GPT-2 的最终模型,这是一个文本生成器,自二月份宣布发布以来,就引起了很大的争议。
根据 OpenAI 的研究论文 Language Models are Unsupervised Multitask Learners,“GPT-2 使用机器学习根据有限输入生成新文本。” 这意味着用户可以输入一两个句子关于任何主题,AI 生成器将生成与原始输入有关的文本。 本质上,正如 TNW 注意到的,GPT-2 不像大多数“文本生成器”那样输出预写的字符串。 GPT-2 制作了以前不存在的文本。”
在他的推文中,卡内基梅隆大学图书馆的计划主任 Scott B. Weingart 给出了一个具体的例子:
什么是黑豹,但是一只年轻的狮子?
一个走廊里充满了人们的尖叫声。
这算是一个快乐的结局吗? pic.twitter.com/qvPTrs790N
— Scott B. Weingart (@scott_bot) 2019年8月20日
如果死亡,在某个遥远的时刻,
击中我,当我睡着时,如果我还在做梦:
那是我与永恒共度的和平吗?
[…]
但是我担心它不会带来和平或休息
直到星星给我它们全部的光芒
让我看到所有的担忧和烦恼在瞬间。糟糕。 pic.twitter.com/QRoi1C3rjj
— Scott B. Weingart (@scott_bot) 2019年8月20日
OpenAI 最初担心他们的系统可能被滥用,因此在 2019 年 2 月 决定以四个部分在八个月内发布 GPT-2。 正如他们在博客中解释的,“由于我们担心该技术的恶意应用,我们不会发布训练模型。 作为一个负责任的披露实验,我们将发布一个较小的模型供研究人员实验,以及一篇技术论文。”
如解释,完整模型包含 15 亿个参数。 “模型训练的参数越多,它似乎就越‘聪明’——就像人类一样,熟能生巧。”
TNW 注意到,最初 OpenAI 发布了一个 1.24 亿参数的模型,随后发布了 3.55 亿和 7.74 亿参数的模型。 根据他们的说法,在测试发布的模型后,“每次迭代都比前一次迭代有了显著的改进。”
为了防止滥用,OpenAI 发布了 GPT-2 检测模型,这些模型被设计为“预先防止滥用”。 在他们的 博客文章 中,他们承认,这些检测模型仍需要额外的工作,以达到 GPT-2 本身目前取得的质量水平。
有兴趣的人可以 在 Github 上下载 GPT-2 模型 这里,查看模型卡 这里,并阅读 OpenAI 的博客文章 这里。












