访谈

Danny Postma,HeadshotPro 的创始人 – 采访系列

mm

Danny Postma 是一位独立黑客,也是一位连续创业者,他也是 HeadshotPro 的创始人。 HeadshotPro 生成人工智能头像,这些头像旨在捕捉用户最好看的特征,并将其重现在用户选择的背景下,具有完美的面部照明,这些是真正的摄影师在最完美的条件下需要花费数小时才能设置的。

您以连续创业者闻名,您的第一家公司是什么?

Landingfolio 是我的第一个大项目。我在 2015 年开始这个项目,当时我 21 岁。那个时候,我作为一名自由职业的转化率优化专家,我很难为我的客户创建有效的登陆页面设计。因此,我创建了 Landingfolio,这是一个展示互联网上最酷的登陆页面设计的设计画廊,作为一个侧项目来解决这个问题。

当时我不会编程,所以我使用 WordPress 构建了它。这个网站至今仍然存在,每天有成千上万的访客,但是很难将其货币化,所以我决定转向其他项目。

您是什么时候开始接触人工智能世界的?

我大约在 2022 年开始接触人工智能世界。当时我正在开发一个名为 Headlime 的产品,最初它不是一个人工智能工具。一个朋友向我介绍了 GPT-3,我对其能力很感兴趣,所以我决定直接联系 OpenAI 的 CTO Greg Brockman,请求访问权限。幸运的是,我能够作为第一批用户之一获得访问权限。

您的第一个人工智能业务是什么?

这标志着我进入人工智能领域的开始。它有点像是一次偶然的转变,从一个非人工智能产品到一个基于人工智能的产品。

在开发 Landingfolio 的同时,我写了一本交互式的 200 个标题的书,您可以轻松地输入某些变量来使标题适应您的用例。我意识到这实际上是一个非常好的软件工具,所以我将其转变为一个简单的复制旋转器,称为 Headlime。

大约在同一时间,GPT-3 发布了,我如上所述获得了早期访问权限。我尝试使用 GPT-3 编写 Headlime 的模板,我对其生成副本的能力感到惊讶。这导致了一个关键时刻,我意识到将 Headlime 转变为一个人工智能驱动的复制工具的潜力。

当 GPT-3 出现时,我已经在开发一个复制工具,这有点幸运。我是最早在生产环境中实现 GPT-3 的人之一,除了 Copy.AI 和其他几个工具之外。

您能分享 HeadshotPro 的起源故事吗?

当稳定扩散人工智能在 2022 年 9 月推出时,它为我打开了新的可能性。最初,我想创建一个股票照片网站,并开发了一个名为 Stock AI 的东西。然而,质量没有达到预期,而且有关于大公司如 Getty Images 的潜在法律问题的担忧,它们拥有大量的法律资源来保护其图像权利。

这种担忧导致我转向。Dreambooth 推出了一个可以转换面部的 AI 服务,我意识到我正在开发类似的东西。我快速开发并在 30 小时内发布了我的产品,击败了竞争对手。 ProfilePicture.AI 在 Twitter 上爆红,仅一周内就产生了大量销售。我很幸运在 Google 搜索中排名靠前,搜索的是个人资料图片。

然而,当最初的兴奋消退,销售开始下降时,我知道我需要再次转向。就是那时,我开始与一位开发者朋友 David 合作。我开发了一个可以操纵照片到不同姿势的 Python 模型,这导致我专注于使用人工智能创建头像。

我同时推出了 Deep Agency 和 HeadshotPro。虽然 Deep Agency 引起了很多媒体关注,但它并没有转化为销售。另一方面,HeadshotPro 成为一款爆品。看到对人工智能生成头像的需求,我决定专注于 HeadshotPro。这是一个意外的转变,但它表明了保持灵活性和对市场做出反应的重要性。

HeadshotPro 后端使用了哪些机器学习和生成人工智能算法?

HeadshotPro 看起来很简单,但我们在后端有一个巨大的管道来输出高质量的头像。我们的竞争对手只使用稳定扩散,这是一个开源的图像生成模型,结合 DreamBooth,它在您的照片上进行训练。

我们部署了数十个开源和自定义开发模型,以提高输出质量。我们已经在自定义模型上工作了一整年。我们距离生成人工智能照片和真实照片几乎无法区分的目标越来越近。

我们使用的另一个开源模型是 LLaVa,它是一个大型语言和视觉助手,您可以提示它询问有关图像的问题。我们使用它来过滤不良用户上传或删除不适合工作场所的头像生成。我们使用的另一个模型是 Codeformer,它有助于从面部中删除人工智能生成的伪影,使其看起来更加真实。

您从单独创业者转变为建立团队的挑战是什么?

从单独创业者转变为建立团队来发展 HeadshotPro,对我来说是一个重大的挑战,也是一个个人和职业成长的旅程。最初,我面临的主要挑战是对招聘的恐惧。我最初犹豫是否要扩大团队,因为这涉及到管理人员的不确定性。这导致我尽可能地自动化一切,尤其是在人工智能出现之前。

然而,当 HeadshotPro 成长时,我意识到我无法独自管理一切。我有三个选择:出售业务,继续作为单独创业者,或者建立团队。最终,我决定建立团队是正确的选择,如果我想扩大业务规模,无论多么可怕。

这个决定标志着我从单独创业者的身份转变为领导团队建设的开始。它迫使我承认我没有所有答案。建立团队需要不同的思维方式,并改变了我为业务设定的目标。它不再只是经营一家业务,而是领导一支团队共同建设一些东西。

这种转变带来了兴奋和恐惧的混合。我从第一轮面试开始,就对潜在的团队成员坦白了我的缺乏团队管理经验,并设定了期望,即这对我来说是一个新领域,可能会遇到一些障碍。我从与其他客户合作的承包商和兼职人员开始,创建了一个安全网,同时我学习团队管理的技巧。

回顾过去,我应该更早地组建团队。现在,我有一支由非常聪明和敬业的人组成的小团队,他们能做到我自己无法做到的事情。同时,这也让我感到不再孤独,分享胜利的感觉也更加美好。

人工智能头像生成器变得越来越流行,您如何使 HeadshotPro 与众不同?

照片质量是我们与其他人工智能头像生成器的主要区别。我们的竞争对手依赖于开源模型,这些模型不够好,无法生成真实的照片。通过每天迭代提高质量,我们相信在一年内,我们的头像将与真实照片无法区分,这将进一步扩大我们与其他不太认真的人工智能头像生成器之间的差距。

最后,我们专注于专业头像。我们的竞争对手正在水平扩展,提供诸如约会照片和可爱的头像等服务,朝着成为一个完整的摄影工作室的方向发展。虽然这确实有市场,但我们的团队认为这些偏离专业头像的转变是一种分散注意力的因素。我们的唯一关注点是创建最高质量的专业人工智能头像。我不认为我们的竞争对手与我们共享这一点。

您的团队如何增强或优化 HeadshotPro 体验?

这可能听起来很陈词滥调,但我们真的痴迷于结果的质量。生成人工智能头像,几乎无法与真实照片区分开来,这是我们的最终目标。如果模型每天改进 1%,那么我们没有理由认为我们不能在今年年底实现这一目标,或者至少非常接近它。

除了逐步提高质量之外,我们还在改进服装生成方面进行工作。我们认为“虚拟试穿”服务将在 2024 年开始引起更多的关注,我们希望利用这项技术为我们的企业客户提供更好的结果,他们经常要求我们匹配西装等东西用于员工的头像。

然后,当然,我们的用户体验也在不断改进。目前,我们需要 15-17 个用户输入照片,因为这是我们为了最大化质量而选择的神奇数字。我们正在努力找到一种方法,使其对我们的客户来说更容易使用,而不损害我们努力维护的照片质量。

您正在开发或考虑推出的其他人工智能产品是什么?

我已经开发了很多小型人工智能产品:

  • 纹身 AI: 一个人工智能纹身生成器。
  • 爱丽丝: 一个有趣的人工智能社交媒体实验,展示人工智能如何生成完全新的概念和想法,这些在之前从未被看到过。(https://www.thismodeldoesnotexist.co/
  • 个人资料图片 AI: 一个个人资料图片生成器,就像一个(远远)不专业的 HeadshotPro 版本。
  • 深度代理: 雇用虚拟人工智能生成的模型。
  • 表情变形:将自己变成你最喜欢的表情包。

那里有很多有趣的产品,但我实际上正在出售其中大部分产品,以便专注于 HeadshotPro。自从 HeadshotPro 起飞以来,这些项目没有得到太多的关注。

感谢这次精彩的采访,希望了解更多的读者可以访问 HeadshotPro

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。