访谈
Seth Forsgren,Riffusion联合创始人兼CEO – 采访系列

Seth Forsgren,Riffusion联合创始人兼CEO,领导开发了一款基于文本提示的AI音乐生成工具。Riffusion允许用户实时尝试不同的音乐风格和声音,使音乐创作更加便捷。该平台旨在平衡创造力和易用性,允许任何人无需正式音乐专业知识即可探索AI生成的音乐。
Riffusion是我个人尝试过的最好的AI音乐生成器,也是我推荐给对AI生成音乐感兴趣的用户的工具。
您能带我们回到Riffusion的早期吗?是什么最初的火花让您决定构建一个AI音乐生成工具?
Riffusion最初是一个两个终身音乐爱好者之间的爱好项目。我的联合创始人Hayk和我已经一起演奏业余乐队超过十年,我们一直对创作过程着迷。有一天下午,我们在我的后院写歌,寻找灵感时,我们开始尝试早期可以从无到有生成图像的AI模型。但我们真正想要的是一个可以与我们一起创作音乐的工具,一个可以与我们合作创造新旋律和声音的AI。那个时候没有类似的东西,所以我们尝试为自己构建它,而不是为别人构建。
您何时意识到Riffusion有潜力成为一家成熟的公司?
转折点出现在我们与一些朋友分享了我们的爱好项目后,项目突然变得非常流行。它不仅仅是技术人员或AI爱好者对其感兴趣——专业音乐家、制作人和数百万普通音乐爱好者以我们无法预料的方式与其互动。我们最喜欢的艺术家开始通过使用Riffusion创作的样本与我们联系!
该项目还激发了谷歌、字节跳动等顶级研究实验室基于我们的工作启动了自己的AI音乐项目,这让我们清楚地认识到这不仅仅是一个实验——它是更大事物的基础。作为一家公司,我们现在有机会将这件新乐器带给世界各地的创意人士。
在将Riffusion从实验转变为商业产品的过程中,您面临的最大技术和商业挑战是什么?
从技术方面来说,我们已经取得了很大的进步。我们的第一个模型生成了低保真度的五秒音乐片段,现在我们可以生成全长、高质量的歌曲,具有很好的可控性和表达性。这需要我们在模型架构上取得重大进步,并不断从头开始重新思考问题。我们的研究团队做出了令人难以置信的工作,我们知道这只是技术可能性的开始。
从商业角度来说,我们必须深入思考Riffusion在音乐行业中的位置。AI音乐仍然是一个新兴领域,虽然我们看到业余创作者和专业人士都在采用这项技术,但仍然存在关于AI和人类创造力如何共存的讨论。我们的重点始终是赋予音乐家权力,而不是取代他们——为人们提供新的工具来探索他们的创造力,以他们以前从未想到的方式。
Riffusion最初专注于生成短音乐片段,但现在可以创作全长作品。是什么进步使您能够扩展其功能?
通过从头开始训练我们自己的基础模型,我们能够提高Riffusion输出的质量、表达性和可控性。我们开发和发布的最新模型FUZZ是一个重大突破。在盲测试中,FUZZ始终在给定相同歌词和声音提示时优于竞争对手模型。FUZZ的设计旨在帮助用户找到他们的个人声音——用户使用Riffusion的时间越长,FUZZ就越了解他们的个人口味,生成的音乐也就越个性化。我们认为这是Riffusion的一个重要区别。
许多AI音乐模型在保持音乐的情感深度方面存在困难。Riffusion如何捕捉不同情绪和风格的细微差别?
音乐是深深的个人和情感的,我们希望Riffusion生成的音乐能在人性化的层面上产生共鸣。正如我们的顾问Alex Pall所说,“这不仅仅是关于制作声音;这是关于通过声音让人们感受到特别的东西。”
就像一把制作精良的小提琴可以赋予艺术家完全表达自己的能力一样,我们训练我们的模型成为一种由用户的创造力在每个转折点指导的乐器。无论您输入的是旋律、文本提示,甚至是一幅图像,Riffusion都会适应您的意图,塑造输出以反映不同的情绪、动态和风格选择。我们专注于那些每天回来在平台上创作真正令人惊叹的音乐的用户。
随着AI生成音乐的不断发展,您如何看待它与人类创造力相互补充而不是取代的潜力?
AI是一种为音乐家服务的工具,而不是取代他们。整个历史过程中,新的音乐工具——从合成器到数字音频工作站——都扩大了艺术家可以创作的可能性,而没有削弱人类的艺术性。Riffusion遵循同样的哲学。我们将Riffusion视为一种鼓励音乐家实验、合作和尝试新形式的故事讲述的工具。艺术家仍然带来了灵魂和意图到他们的音乐中,AI帮助将这些想法变为现实。我们很高兴看到这么多专业音乐家和爱好者每天都在使用这款工具,并在创作过程中找到乐趣。
音乐家和制作人如何响应Riffusion的能力?您是否看到过对该工具的任何意外或创新的使用?
反应非常令人惊讶。有一些人从几年前就开始使用这些工具,但每周都有越来越多的专业音乐家和制作人采用这项技术。我们看到艺术家使用Riffusion进行头脑风暴,创造新的声音,甚至创作整个专辑。有些人将Riffusion的生成与现场乐器结合起来,创造出全新的流派。最令人兴奋的事情之一是看到人们如何将这款工具变成自己的东西,无论是从自然的声音中生成音乐,测试实验性作品,还是为电影配乐。
现在Riffusion可以创作长篇音乐,您是否看到了在电影、视频游戏或其他媒体中使用AI生成的配乐的潜力?
Riffusion能够生成长篇音乐无疑使其成为媒体领域的一种强大工具。我们已经看到来自电影制片人、游戏开发者和内容创作者的兴趣,他们希望拥有适应其叙事的独特配乐,甚至可能实时适应。很明显,AI可以帮助讲故事者跨媒体表达自己,我们才刚刚开始这一前沿领域。
展望未来,您对Riffusion的最终愿景是什么,您如何看待它将塑造音乐创作的未来?
今天,只有很小一部分人创作音乐,但创造力是我们所有人都有的。通过构建降低进入门槛的工具,同时也提高了声音的可能性,Riffusion将成为音乐创作未来的重要乐器。我将Riffusion视为任何想要创作、实验和通过音乐联系的人的首选平台。无论您是专业制作人还是从未创作过歌曲的人,我们希望Riffusion成为帮助您找到自己声音的乐器。
感谢这次精彩的采访,感兴趣的用户可以访问Riffusion生成音乐。












