Dr. Timo Kunz 是 Aflorithmic 的联合创始人和CEO - 这是世界上第一个可以完全自动化的文本到语音和音频的端到端解决方案。
近两_thirds 的人认同某种种族或民族少数群体 说 他们更有可能与包含多元化观点的品牌互动。但是,多元化不仅仅是让客户在您的品牌中看到自己,还要让他们听到自己的声音。去年,首次推出音频身份的品牌数量增加了 22%。公司正在尝试在行业中突出自己的声音,并更好地根据他们服务的所有个人的需求量身定制自己的信息。但是,虽然品牌知道促进多元化的道德和经济原因,但他们并不总是知道如何在规模上实现这一点。这就是合成语音的用途。该技术使品牌能够以更包容的方式与受众进行沟通,并且不会损害他们的真实性。另外,合成语音的易用性使更多的品牌能够使用它并代表更多的人。以下是合成语音将成为更多多元化品牌和他们的故事的扩音器的原因。全球公司需要全球声音大规模的数字化转型使品牌从一开始就成为全球性的。在一个主要的在线商业领域,公司必须满足来自多个位置和使用多种语言、口音、方言和词汇的客户的需求。不管您在哪个行业,您的用户群体在近年来可能已经多元化,您需要在您的音频品牌中反映这种扩张。欧洲和亚洲的初创公司可能比他们的美国同行更容易实现多元化。美国的公司往往专注于国内市场,因为那里有大量的机会,当他们超出国界时,他们会在后期实现多元化。欧洲和亚洲的初创公司更早地实现多元化,因为他们跨越了更多的边界和文化。在一个较小的市场中经营实际上具有多元化市场的优势。语音技术主要针对英语使用者而设计 – 部分是因为其开发根源在美国,但更多是因为其作为世界上 最广泛使用的语言。然而,超过 一亿 人以英语作为第二语言,并且很少听到反映他们作为外语者的口音的品牌声音。使用合成语音,品牌可以与会说英语作为第二语言的配音员合作,轻松准确地捕捉他们的语音细微差别,并将音频部署在他们的营销活动中。不仅品牌可以代表更多的社会群体,他们还可以利用像索菲亚·维加拉(哥伦比亚)和阿诺德·施瓦辛格(奥地利)这样的独特、强烈的口音。复制更多多元化的口音虽然近年来配音员的数量已经增加,但 演员的 демограф 仍然是白人男性占多数。因此,很难找到来自世界上较小或更偏远地区的口音,例如马耳他岛。使用先进的自定义语音克隆技术,从这些地方(或甚至这些地方的普通人)可以阅读特定的脚本,以特定的音调,并记录他们的口音的细微差别。这些口音可以复制到品牌的音频中,使公司能够本地化他们的内容,并将较少知名的说话方式带给他们的受众。自然地,该技术仍在开发中,需要数小时的音频录音才能变得强大和自然。语音模型在特定的用例中(如广播、旁白或广告)效果最佳,因此品牌必须考虑语音将在哪种情况下应用,并相应地完善他们的流程。特别是在生产罕见口音时,品牌可能无法轻易确认语调和速度是否适合该场景。合成语音市场预计到2025年将价值 $36B;它能够(字面上)与人们交谈,使品牌能够直接与客户的日常生活对话。2022年,人们希望品牌看起来和听起来像他们,合成语音使公司能够传达更多的声音,更加响亮地传达,而不会失去他们的原始声音。让品牌角色活起来音频品牌是一个强大的工具,尤其是在年轻的、技术敏感的受众中(他们也是最有可能要求品牌多元化的群体)。事实上,英国的研究表明,超过 1/5 的 35 岁以下的成年人 更有可能购买品牌的产品,因为他们听到了与该品牌相关的声音。但是,音频不必是真人的声音才能被认为是多元化的。合成语音可以实现针对特定群体、体现某些个性特征或只是品牌的有趣、即刻可识别的延伸的虚构角色。看看托尼老虎、巴特沃斯夫人和笑牛等角色。合成语音可以根据一组构造所需角色的证书进行设计。例如,如果一个角色是由巧克力制成的,听起来应该很甜,但也有点喘不过气来,因为它正在融化。该技术的范围为品牌提供了很多创造性的灵活性,并有助于在Instagram和TikTok等社交媒体平台上建立更强的存在感,因为Z世代用户期望看到更多独特、艺术化的品牌形象。