访谈
Julien Salinas,NLP Cloud 的创始人和 CTO – 采访系列

Julien Salinas 是 NLP Cloud 的创始人和 CTO。NLP Cloud 平台提供基于 spaCy 和 HuggingFace transformers 的高性能、生产就绪的 NLP 模型,用于多种用例,包括命名实体识别、情感分析、文本分类、摘要、问答、文本生成、翻译、语言检测、语法和拼写纠正、意图分类和语义相似性。
您最初是什么时候对计算机科学感兴趣的?
我在商学院开始编程!我知道这听起来很惊讶。实际上,我很快意识到商业本身很枯燥,如果我没有技术技能来实现我的项目,我很快就会受到限制。
当时的第一个项目是一个小网站,用于我的音乐老师,接着是另一个用于我的家庭,接着我开始学习 Python… 等等。现在,我已经是 Python/Go 开发者和 DevOps 15 年了。
您能分享 NLP Cloud 的创立故事吗?
这始于 2 年前,当时我意识到,作为一名开发者,部署机器学习模型到生产环境是很困难的。
我对 Hugging Face Transformers 和 spaCy 等框架的进步感到惊讶,我能够在我的项目中利用非常先进的 NLP 模型。但是,在生产环境中使用这些模型是另一回事,令人惊讶的是,我找不到任何有趣的 No-Ops 云平台用于 NLP。
所以,我决定开始自己的 NLP 模型部署平台。很快我们收到了很好的客户反馈,我们根据这些反馈添加了许多功能(预训练模型、微调、游乐场…)。
NLP Cloud 平台支持 GPT-3 的开源替代品 GPT-J。什么是 GPT-J?
GPT-J 由一组名为 EleutherAI 的研究人员在今年六月发布。他们认为 GPT-3 应该是一个开源模型,就像其前身(GPT 和 GPT-2)。他们声称,即使我们都应该担心像 GPT 这样的强大 AI 模型的潜在滥用,但这并不是不开源这些模型的理由。相反,他们认为,如果 AI 模型保持开源,这是社区理解这些模型如何在底层工作并确保这些模型不会表现出错误行为(厌女、种族主义…)的最佳方式。
GPT-J 是 GPT-3 Curie 的直接等价物,两者都训练了大约 6 亿个参数。
两者几乎可以互换使用。
为什么 GPT-J 是 GPT-3 的更好的替代品?
GPT-3 属于 Microsoft,人们使用它的唯一方法是通过官方的 GPT-3 API。
但这个 API 很昂贵,非常限制:您需要请求访问 API,即使您的应用程序被接受,您的访问也可能在任何时候被关闭,如果他们认为您的商业模式不符合他们的指南。例如,您不能生成“开放式”文本(由多个段落组成的长文本),因为这违反了他们的政策。
GPT-J 没有这样的限制,因为它是开源的,任何人都可以安装和使用它。
将 GPT-J 集成到 NLP Cloud 上的技术挑战是什么?
GPT-J 因为其高资源消耗(RAM、CPU、GPU…)而难以安装。它可以在没有 GPU 的情况下工作,但速度非常慢,几乎无法使用。
最终,运行 GPT-J 所需的硬件非常昂贵,因此为了降低成本,我们不得不处理许多实现细节。
另外,为了确保 GPT-J 在 NLP Cloud 上的高可用性并使其适合生产,我们不得不处理 GPT-J 的冗余和故障转移策略,这可能非常具有挑战性。
您能讨论一下提供的预训练 AI 模型吗?
我们尽力为每个用例选择最好的预训练 AI 模型。
对于文本摘要,我们认为最好的一个是 Facebook 的 Bart Large CNN,它提供了很好的结果,但如果没有 GPU,它可能会相当慢。
对于文本分类,我们实现了 Facebook 的 Bart Large MNLI(用于英语分类)和 Joe Davison 的 XLM Roberta Large XLNI(用于非英语语言)。两者都很快且很准确。
对于问答,我们使用 Deepset 的 Roberta Base Squad 2。它很快且很准确,但对于更高级的问答,您可能需要使用 GPT-J。
还有很多其他的!
NLP Cloud 的一些最佳用例是什么?
最常用的用例似乎是文本摘要、文本分类和使用 GPT-J 生成产品描述、改述、文章生成等文本。
但我们在客户中看到的用例非常多样化,看到这么多伟大的想法很令人印象深刻!
您还想分享关于 NLP Cloud 的其他信息吗?
似乎人工智能用于文本理解和文本生成终于在实际产品或内部工作流中被真正使用,越来越多的公司都在使用它。
看到 NLP 不再仅仅是一个纯研究领域,而是有真正的商业用例可以利用 NLP,这是很棒的。
在 NLP Cloud,我们将继续努力使任何人都能轻松地在生产环境中测试和使用 NLP。
感谢这次精彩的采访,希望了解更多的读者可以访问 NLP Cloud。












