Financiering

AI-tekst-naar-spraakbedrijf WellSaid Labs kondigt financieringsronde van $10M aan

mm

Het bedrijf voor kunstmatige intelligentie (AI) tekst-naar-spraaktechnologie WellSaid Labs heeft een financieringsronde van $10 miljoen aangekondigd in serie A. De ronde werd geleid door FUSE, samen met eerdere investeerder Voyager, Qualcomm Ventures LLC en GoodFriends.

Volgens WellSaid zullen de fondsen worden gebruikt om de AI en productinnovatie verder te ontwikkelen, de go-to-market-functies te schalen en het team van het bedrijf te laten groeien.

Het bedrijf streeft ernaar om bedrijven en merken te voorzien van topklasse Text-to-Speech (TTS)-diensten, en het geeft content creators en productteams de mogelijkheid om aantrekkelijke voice-content te ontwikkelen voor verschillende toepassingen, zoals streamingdiensten, radio, programmatische reclame, digitale marketing en bedrijfstrainingen.

Volgens het persbericht van het bedrijf heeft WellSaid “TTS ontwikkeld om de moeilijkste contentontwikkelingsproblemen van bedrijven op te lossen en een snelle manier te bieden voor content creators – groot of klein – om al hun gewenste content te ontwikkelen in één consistente stem die hun merk vertegenwoordigt.”

WellSaid Labs heeft een Voice Avatar-bibliotheek die toegang biedt tot meerdere stijlen en tonen, en merken kunnen hun eigen AI Voice Avatars ontwikkelen met hun eigen gelijkenis, stijl en uniekheid.

Cameron Borumand is algemeen directeur bij FUSE.

“Voor de hand liggend en eenvoudig, WellSaid is de toekomst van contentcreatie voor voice. Dit is waarom duizenden klanten elke dag van het product houden met een ongekende bottom-up adoptie. Matt en Michael hebben een wereldklasse-team samengesteld en we konden niet meer enthousiast zijn om deel te nemen aan de reis van WellSaid,” zei Borumand.

Natuurlijk klinkende spraak vanuit tekst

Een van de grootste uitdagingen op het gebied van AI is de ontwikkeling van natuurlijk klinkende spraak vanuit tekst, waar onderzoekers al decennialang aan werken. WellSaid Labs heeft de afgelopen drie jaar aan hun eigen versie gewerkt en heeft doorbraken behaald op het gebied van kwaliteit, snelheid en betrouwbaarheid.

Het bedrijf kondigde in juni 2020 aan dat hun tekst-naar-spraak de eerste was die menselijke pariteit bereikte voor naturalness op korte audiofragmenten voor meerdere stemmen.

Matt Hocking is CEO van WellSaid Labs.

“We hebben AI-voice toegevoegd aan het gereedschap van duizenden content creators en hun teams,” zei Hocking. “Onze menselijke-pariteit AI-stem kan sneller worden geproduceerd dan in realtime, en kan op aanvraag worden bijgewerkt. Dit opent nieuwe en spannende kansen om ‘voice’ toe te voegen waar dit eerder niet mogelijk leek. AI-voice zorgt er gemakkelijk voor dat elke productie efficiënt kan worden gecreëerd en bijgewerkt op grote schaal.”

Woorden van investeerders

James Newell maakt deel uit van het team bij Voyager Capital.

“Content creators of productervaringontwerpers werden eerder geconfronteerd met moeilijke keuzes tussen kwaliteit en schaalbaarheid bij het gebruik van TTS-hulpmiddelen of menselijke voice-over. De ongelooflijke stemmen van WellSaid, die toegankelijk zijn via een studio-applicatie of een schaalbare API, elimineren de noodzaak om te kiezen tussen natuurlijk, levendig klinkende spraak of oneindig schaalbaar en gemakkelijk bewerkbare voice-content. WellSaid biedt beide en levert het aan zoals uw team het wil consumeren,” zei Newell. “Creatieve teams hebben het erg nuttig gevonden wanneer ze meerdere stukken van hoge kwaliteit content in een consistente stem moeten produceren in enkele uren in plaats van weken.”

Carlos Kokron is vice-president bij Qualcomm Ventures Americas.

“Recente ontwikkelingen in TTS-technologie met behulp van generatieve AI hebben het mogelijk gemaakt dat synthetische stemmen zeer menselijk klinken, waardoor nieuwe toepassingen voor voice mogelijk worden, zoals e-learning, reclame en nieuwslezers,” zei Kokron. “WellSaid Labs biedt een industrieleidende product dat hoogwaardige, menselijk klinkende stemmen genereert. We kijken ernaar uit om samen te werken met WellSaid Labs om de creator-economie te stimuleren met menselijke-pariteit AI-stemmen op mobiele en IoT-apparaten.”

Dave Gilboa maakt deel uit van het team bij Good Friends en is co-CEO van Warby Parker.

“Het team van WellSaid heeft diepe technische expertise toegepast om een platform te bouwen dat het gemakkelijk maakt om zeer levendige audio te creëren en te bewerken. We zien een significante groeipotentieel in het gebruik van hoge kwaliteit audio om merken de mogelijkheid te geven om met klanten te communiceren en creators de mogelijkheid te geven om met het publiek te engageren,” zei Gilboa.

Productontwikkelaars kunnen toegang krijgen tot de core AI-engine van WellSaid Labs via real-time API’s, waardoor ze digitale ervaringen kunnen stimuleren met schaalbare voice-infrastructuur. Creatives kunnen de verschillende barrières en complexiteiten overwinnen die worden aangetroffen in traditionele tekst-naar-spraaktechnologieën.

Leer meer over WellSaid Labs en luister naar de verschillende AI-stemmen van het bedrijf hier.

Alex McFarland is een AI-journalist en schrijver die de laatste ontwikkelingen op het gebied van kunstmatige intelligentie onderzoekt. Hij heeft samengewerkt met talloze AI-startups en publicaties wereldwijd.