Connect with us

Intervjuer

Isaiah N. Granet, medgrunnlegger og CEO av Bland – Intervju-serie

mm

Isaiah N. Granet, medgrunnlegger og CEO av Bland, er en startup-grunnlegger og ingeniør hvis bakgrunn kombinerer teknisk gjennomføring med tidlig entreprenørerfaring og langvarig sosial påvirkningsarbeid. Før han lanserte sin nåværende virksomhet, deltok han i Z Fellows og Y Combinator, bygget ingeniørerfaring i Lantern, og grunnla San Diego Chill, en ideell organisasjon som samlet inn over 2,5 millioner dollar for å hjelpe barn med utviklingshemninger å få tilgang til idrett, og som fortsatt eksisterer i dag med hans involvering på styretnivå.

Bland fokuserer på å bygge infrastruktur for AI-drevne telefonoppringninger, som muliggjør at bedrifter kan deployere stemmeagenter som kan håndtere kundestøtte, salg og operative arbeidsflyter i stor skala. Plattformen er designet for å erstatte eller supplere tradisjonelle kontaktssentere ved å tilby programmerbare stemmeinteraksjoner, sanntidsrespons og dype integrasjoner med bedriftssystemer, og posisjonerer seg som en kjernekomponent i hvordan bedrifter automatiserer kommunikasjon med kunder.

Du grunnla San Diego Chill som tenåring for å skape inkluderende tilgang til idrett for barn med utviklingshemninger, lenge før du gikk inn i Y Combinator eller lanserte Bland. Hvordan påvirkede denne tidlige erfaringen med å bygge en virkelig organisasjon din tilnærming til å grunnlegge et stemme-først AI-selskap som nå ligger mellom bedrifter og deres kunder?

Mye av mitt liv og arbeid har fokusert på bygging. Fra en ung alder hadde jeg denne konstante ønsket om å bringe ting til live. Når en idé eller en overbevisning om verden dukker opp i hodet mitt, blir det umulig for meg å ignorere det. Byggingen av San Diego Chill lærte meg ikke bare hvordan man skaper og driver en organisasjon, men også hvordan våre handlinger kan påvirke andre. Å kunne gi tilbake ved å skape en organisasjon som ellers aldri ville ha eksistert, er noe dypt belønnende. Leksjonene og verdiene jeg lærte fra Chill følger meg hver dag.

Etter å ha gått gjennom YC i 2023, hva overbeviste deg om at bedriftens stemme-infrastruktur fortsatt var fundamentalt feil, til å rettferdiggjøre bygging av et end-to-end-system i stedet for å legge LLM-er på toppen av legacy IVR-verktøy?

Tenker på siste gang du brukte en bank-chatbot. Du ventet sannsynligvis lenger enn du burde, fikk et svar som ikke addreserte hva du egentlig spurte, og endte opp med å ringe likevel. Deretter gikk en robot-stemme deg gjennom en meny av alternativer du ikke ønsket, og å trykke 0 gjorde ingenting nyttig.

Banker har brukt milliarder på å gjøre denne opplevelsen mulig, og chatbot-er rangerer fortsatt sist i kundetilfredshet med 29%. Lavere enn e-post. Lavere enn kontaktssentere, som alle allerede klager over.

Dette har vært dynamikken i to tiår. Bedrifter prøver å holde kundene borte fra personalet sitt. Kundene prøver å komme til en person. Ingen av partene vinner.

Problemets årsak er ikke at selskapene ikke ønsker å fikse det. De kan bare ikke bemanne seg til en god opplevelse i stor skala. Et kontaktssenter som håndterer en million samtaler per måned er en dyrt og vanskelig operasjon, og kvaliteten er ustabil nesten per definisjon.

Hva som har endret seg, er at AI nå gjør det mulig å løse samtaler i stedet for bare å rute eller avvise dem. Ikke telefon-tre-er. Ikke ventemusikk. En agent som forstår hva kunden spør og håndterer det.

Men det fungerer bare hvis systemet er bygget for sanntids-stemme fra bunnen av. Når du legger LLM-er på toppen av legacy IVR-verktøy eller syer sammen tredjeparts-tjenester, kommer forsinkelsen inn og påliteligheten synker. Samtaler bryter sammen.

Dette er hvorfor vi fokuserte på å bygge infrastrukturen fra ende til ende. Stemme fungerer bare hvis det føles umiddelbart og naturlig. Hvis det ikke gjør det, legger kunden på.

Bland har tatt det uvanlige skrittet å bygge og hoste sin egen TTS-, inferens- og transkripsjonsstakke internt. Hva var de største tekniske utfordringene du møtte da du bygde agenter som måtte svare i under en sekund mens de opprettholdt samtale-nøyaktighet?

Forsinkelse. Det er der de fleste demo-er dør.

Hvis en chatbot tar tre sekunder å svare, venter brukeren. Hvis en stemme-agent pauserer awkardt etter at du har fullført å snakke, er samtalen allerede brutt. Svar må komme tilbake på under 400 millisekunder. De fleste plattformer kan ikke nå dit, fordi de syr sammen flere tredjeparts-tjenester, hver med sin egen forsinkelse.

Men forsinkelse er bare en del av det. Reelle kundesamtaler er ustyrlige på måter demo-er aldri fanger. Folk avbryter midt i setningen. Bakgrunnsstøy kommer inn. Samtalepartnere skifter språk. Forespørsler er vagt definerte. Stemme-AI som holder i produksjon håndterer avbrytelser uten å miste kontekst, tilpasser seg når samtaler går utenfor manuset, og gjør det uten å høres ut som om det bufferer.

Kundene sammenligner stemme-AI ikke med andre bot-er. De sammenligner det med å snakke med en person. Det er standarden.

Det er en økende skrutinering av hvordan menneske-lignende AI-systemer representerer seg selv under interaksjoner. Hvordan bør bedrifter tenke om åpenhet når de deployer samtale-agenter som kan være umulig å skille fra menneskelige ansatte?

Vi tror sterkt på ærlighet og åpenhet for sluttbrukeren. Mens en del reguleringer er byrdefulle og hemmende, er noen former for bedrageri ikke akseptable. Vi arbeider med bedrifter for å utvikle sammenhengende opplevelser som bygger på tillit med kunden.

Når AI-agenter begynner å håndtere millioner av samtidige kundesamtaler, hva slags operative utfordringer dukker opp først når selskaper flytter fra pilot-distribusjoner til produksjonsskala-utrullinger?

Noen ting betyr i praksis. Først og fremst er det modulær prompt-arkitektur. Monolitisk prompt-er er nesten umulig å feilsøke. Når en samtale går galt, må du isolere eksakt hvor og hvorfor det skjedde, ikke stirre på en vegg av instruksjoner og prøve å finne ut hvilken linje som forårsaket problemet.

Full oversikt betyr like mye. Post-samtale-summeringer er ikke nok. Du trenger sanntids-synlighet på hva agenten gjør på hvert punkt i hver interaksjon.

Retningslinjer er også essensielle, spesielt i regulerte industrier. Agenten må holde seg innenfor policy. Det er ikke valgfritt. Og hvis det ikke gjør det, må det være en elegant reserve.

Til slutt er det kunnskapsforvaltning. Agenten må ha tilgang til proprietær data som produkter, policyer og prosedyrer. Plattformen bør også presentere kunnskaps-gapper automatisk når de dukker opp i reelle samtaler, ikke uker senere etter at en kunde klager.

Ser du at bedriftens stemme-agenter vil forbli oppgave-spesifikke verktøy, eller vil de utvikle seg til generaliserte AI-agenter som kan håndtere hele forretningsprosesser initiert gjennom samtale?

Hvis jeg bare visste svaret! Jeg tror at stemme-agenter vil utvikle seg over hele bedrifts-staben, men det er usannsynlig at se en hel bedrift drevet av en stemme-agent. Det being sagt, jeg tror at mennesker vil kunne få umiddelbar, nøyaktig og mer omfattende service fra AI-agenter enn de får i dag. I virkeligheten tror vi at flere telefon-samtaler vil skje når dette skjer. Ikke færre.

Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Bland.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.