关注我们.

面试

Danny Postma,HeadshotPro 创始人 – 访谈系列

mm

Danny Postma 是一名独立黑客,以连续创业者而闻名,他也是 HeadshotPro 的创始人。 HeadshotPro 生成人工智能头像,旨在捕捉用户最上镜的品质,并在用户选择的背景上重现它们,完美的面部照明,即使在最完美的条件下,真正的摄影师也需要几个小时才能设置。

您是一位连续创业者,您创办的第一家企业是什么?

Landingfolio 是我的第一个重大项目。我于 2015 年开始工作,当时我 21 岁。当时我是一名自由转换优化专家,正在努力为客户创建有效的登陆页面设计。我创建了 Landingfolio,一个设计画廊,展示互联网上最酷的登陆页面设计,作为解决这个问题的一个副项目。

我当时不知道如何编程,所以我使用 WordPress 构建了它。这比我预想的要容易得多。该网站至今仍然存在,并拥有数千名访问者,但很难盈利,所以我决定转向其他项目。

您什么时候第一次沉浸在人工智能的世界里?

我最初接触人工智能世界纯属偶然。当时我正在开发我的产品 Headlime(它最初是一款非人工智能工具),一位朋友向我介绍了 GPT-3。我对 GPT-3 的功能非常感兴趣,于是决定直接联系 OpenAI 的首席技术官 Greg Brockman,申请访问权限。幸运的是,我作为首批用户获得了访问权限。

您的第一个人工智能业务是什么?

对 GPT-3 的介绍标志着我进入人工智能之旅的开始。从非人工智能产品到基于人工智能的产品,这是一种偶然的转变。 

在开发 Landingfolio 时,我写了一本包含 200 个标题的交互式书籍,您可以在其中轻松输入某些变量来自定义标题以适合您自己的用例。我意识到这实际上是一个非常好的软件工具,所以我把它变成了一个非常简单的复制旋转器,可以为您进行替换,并将其命名为 Headlime。 

大约在同一时间,GPT-3 发布了,如上所述,我很早就获得了访问权限。我尝试让 GPT-3 为 Headlime 编写模板——我对它生成副本的能力感到惊讶。这导致了一个关键时刻,我意识到将 Headlime 转变为人工智能驱动的文案写作工具的潜力。 

幸运的是,当像 GPT-3 这样的文案人工智能出现时,我已经在开发文案工具了。我是第一批在生产环境中实施 GPT-3 的人之一 复制人工智能 和一些其他工具。

您能分享一下 HeadshotPro 背后的起源故事吗?

2022年XNUMX月,稳定扩散AI发布后,它为我打开了新的可能性。最初,我考虑创建一个图片库网站,并开发了一个名为Stock AI的东西。然而,质量达不到预期,而且我担心像Getty Images这样的大公司可能会提出法律问题,因为这些公司以其丰富的法律资源来保护其肖像权而闻名。

这种担忧促使我转向。我看到 Dreambooth 正在推出一项可以变换面孔的人工智能服务,并意识到我正在做一些非常类似的事情。我在 30 小时内快速开发并推出了我的产品,击败了竞争对手进入市场。 个人资料图片.AI,在 Twitter 上爆红,短短一周内就产生了可观的销量。这是一个高度可分享的产品,我很幸运在谷歌个人资料图片搜索中排名靠前。

然而,随着最初的兴奋感逐渐消退,销量也开始下降,我知道我必须再次转型。就在那时,我开始与一位开发者朋友David合作。我们当时都在做AI相关的项目,我开发了一个Python模型,可以处理照片,使其摆出不同的姿势。这项开发让我专注于利用AI技术制作头像。

我同时推出了 Deep Agency 和 HeadshotPro。虽然 Deep Agency 获得了大量媒体关注,但并没有转化为销量。另一方面,HeadshotPro 却一炮走红。看到 AI 生成的头像需求旺盛,我决定将更多精力放在 HeadshotPro 上。这是一个意料之外的转变,但它也体现了保持灵活性并对市场动态做出反应的重要性。

后端使用的不同机器学习和生成式人工智能算法有哪些?

HeadshotPro 乍一看可能很简单,但我们在后端运行着庞大的管道来输出精彩的头像。我们的大多数竞争对手仅使用稳定扩散(一种开源图像生成模型),并结合 梦想展位,它根据您自己的照片进行训练。 

我们不是这样做事的。

我们部署了数十个额外的开源和定制开发模型,将输出质量提高了 10 倍。我们已经在我们自己的定制模型上工作了一整年。我们已经非常接近持续生成与真实照片无法区分的人工智能照片。

我们使用的另一个开源模型是 拉瓦,一个大型语言和视觉助手,可以提示您询问有关图像的问题。例如,我们使用它来过滤不良用户上传或删除 NSFW 的头像生成。我们使用的另一个模型是 代码形成者,这有助于消除面部的人工智能伪影,并将其变成更真实的面部。

您作为一名个体企业家创办了 HeadshotPro,过渡到组建团队有哪些挑战?

从个体创业者转变为 HeadshotPro 组建团队是一项重大挑战,也是个人和职业成长的旅程。我面临的主要挑战之一是害怕招聘。最初,由于人员管理存在不确定性,我对扩大团队规模犹豫不决。这种恐惧促使我尽可能地依靠自己实现自动化,尤其是在人工智能出现之前的时代。

然而,随着 HeadshotPro 的成长,我意识到我无法再独自管理所有事情。他们的选择是要么出售公司,要么继续作为个体企业家,要么建立一个团队。我最终决定,如果我想扩大业务规模,组建团队是正确的做法,无论这有多可怕。

这个决定标志着我作为个体创业者身份的重大转变,也迫使我承认自己并非无所不知。我明白,组建团队需要不同的思维方式,也会改变我对企业的目标。这不再仅仅是经营一家企业;而是带领一个团队共同创造。

这种转变带来了兴奋和恐惧的混合。从第一次面试开始,我就对所有潜在团队成员坦诚地表达了自己的经验不足,并设定了这样的期望:这对我来说是一个新领域,并且一路上可能会遇到坎坷。我从已经有其他客户的承包商和兼职人员开始,创建一个安全网,同时学习团队管理的诀窍。

回想起来,我应该早点组建一个团队。我现在拥有一个由令人难以置信的聪明和敬业的人组成的小团队,他们做了我自己永远无法完成的事情。一起分享你的胜利也不会那么孤独,而且会更有趣。 

AI 头像生成器变得越来越流行,如何在拥挤的空间中区分 HeadshotPro?

照片质量是我们与其他人工智能爆头生成器的主要区别。我们的竞争对手依赖开源模型,坦率地说,这对于生成真实的照片来说根本不够好。通过每天迭代更高质量的头像,我们相信一年之内我们的头像将与真实照片无法区分,进一步拉大我们与其他不那么严肃的人工智能头像生成器之间的差距。

最后,我们只专注于专业头像。我们的大部分竞争对手都在横向发展,提供诸如约会照片和可爱头像之类的东西,努力成为一家成熟的摄影工作室。虽然这显然有市场,但我们的团队个人认为这些远离专业爆头的弯路会分散注意力。我们唯一的重点是创造最高质量、专业的人工智能头像。我不认为我们的竞争对手有同样的关注点。

您的团队增强或优化 HeadshotPro 体验的方法有哪些?

这可能听起来很陈词滥调,但我们确实对结果的质量很着迷。生成与真实照片无法区分的人工智能头像是我们的最终目标。如果模型每天改进 1%,那么我们没有理由无法在今年年底之前实现该目标,或者真正接近该目标。

除了迭代质量改进之外,我们还致力于改进服装的生产。我们认为“虚拟试穿”服务将在 2024 年开始引起更多兴趣,我们希望利用该技术为我们的企业客户提供更好的结果,这些客户经常要求为员工的头像匹配西装等。

当然,我们的用户体验总是越来越好。现在我们需要 15-17 张用户输入的照片,因为这是我们最大限度提高质量的神奇数字。我们正在研究替代方法,让客户的工作变得更轻松,同时又不影响我们努力维持的照片质量。

您正在开发或考虑推出哪些其他人工智能产品?

我已经构建了大量的小型人工智能产品:

  • 纹身人工智能: 人工智能驱动的纹身生成器。
  • 爱丽丝: 一个有趣的人工智能社交媒体实验,展示人工智能如何产生以前从未见过的全新概念和想法。(https://www.thismodeldoesnotexist.co/)
  • 头像AI: 个人资料图片生成器,就像(不太)专业的 HeadshotPro 版本。
  • 深层机构: 雇用人工智能生成的虚拟模型。
  • 模因变形:把自己变成你最喜欢的模因。

那里有很多有趣的产品,但实际上我正在销售大部分产品,以完全专注于 HeadshotPro。自从 HeadshotPro 起飞以来,这些项目并没有引起我的太多关注。

感谢您的精彩采访,想要了解更多信息的读者可以访问 HeadshotPro.

Antoine 是一位富有远见的领导者,也是 Unite.AI 的创始合伙人,他对塑造和推动人工智能和机器人技术的未来有着坚定不移的热情。作为一名连续创业者,他相信人工智能将像电力一样颠覆社会,并经常对颠覆性技术和 AGI 的潜力赞不绝口。

作为一个 未来学家他致力于探索这些创新将如何塑造我们的世界。此外,他还是 证券一个专注于投资重新定义未来和重塑整个行业的尖端技术的平台。