Intervjuer
Richard White, Grundare & VD för Fathom – Intervjuserie

Richard White, Grundare & VD för Fathom, är en återkommande grundare och produktinriktad entreprenör som är mest känd för att förvandla personliga frustrationer till kategoribestämmande programvara. Före Fathom grundade och ledde han UserVoice i nästan 13 år, och växte det till en lönsam feedbackhanteringsplattform som används av tusentals företag, från startups till företag som Microsoft, och banade också väg för den nu överallt förekommande “Feedback”-fliken på webbplatser. Tidigare i sin karriär byggde han och drev SlimTimer helt på egen hand i över ett decennium, ledde inflytelserika öppen källkodsprojekt som AjaxScaffold i Ruby on Rails-ekosystemet, och arbetade som ProduktDesign Lead på Kiko (YC S05), erfarenheter som kollektivt formade hans filosofi kring användbarhet, kundempati och byggnad av verktyg som tyst men meningsfullt förbättrar hur team arbetar.
Fathom, som grundades 2020, speglar samma etos genom att tackla en universell smärtunkt: den kognitiva överbelastningen av att ta anteckningar medan man försöker ha riktiga samtal. Plattformen spelar automatiskt in, transkriberar och sammanfattar möten – mest anmärkningsvärt på Zoom – och låter användare markera ögonblick i realtid, dela korta klipp istället för råa anteckningar, och bevara nyanserna som ofta förloras i skrivna sammanfattningar. När Fathom har mognat har det utvecklats bortom enkel transkription till ett lätt system för konversationsregistrering, utformat för att hjälpa team att behålla sammanhang, lära av kundsamtal och samarbeta asynkront utan att lägga till friktion till mötet i sig.
Du har tillbringat de senaste 15 åren med att bygga företag som omformar hur människor kommunicerar – från UserVoice till Fathom. Vad var det ögonblick som fick dig att grundandet Fathom, och hur formade dina ingenjörs- och produktutformningsrötter företaget från dag ett?
Min inspiration för att grunda Fathom kom i början av 2020. Det var före pandemin, men jag gjorde omfattande användarundersökningar för en produkt och satt plötsligt igenom 15 eller 20 möten i följd varje dag. Sex veckor av det gjorde mig starkt medveten om hur smärtsamt upplevelsen var. Jag kan inte prata och skriva samtidigt – jag tittade på mina anteckningar två veckor senare och mindes inte vilket samtal som var vilket. Det största problemet var att jag gjorde all denna forskning och sedan delade några punkter med mitt team och det landade inte alls. Allt gick förlorat i översättningen. Det var ett “trampa på tårna”-ögonblick för mig: Något som, om det händer en gång i månaden, ignorerar du. Du trampar på tårna på något varje dag, flera gånger om dagen, och du försöker mycket snabbt fixa det.
Min ingenjörs- och designbakgrund informerade båda valet jag gjorde medan jag byggde Fathom. Jag har alltid närmat mig problem genom att ta koncept som redan existerar och göra dem radikalt mer användbara för en mycket större publik. Med Fathom hade jag denna insikt att transkriptionsteknologi blev allmänt tillgänglig – det fanns en spridning av standardlösningar som inte fanns för fem år sedan. Så transkription var en del av lösningen, men det var inte lösningen i sig.
Från ett produktutformningsperspektiv insåg jag att transkriptioner kan vara värdefulla för de som var på samtalet. Men de är verkligen inte hjälpsamma för de som inte var där. Vad vi fann betydligt mer påverkande var att visa dem 30-sekunders videoklippet av kunden som invände mot priset eller ställde den tekniska frågan. Vi använder transkriptionen nästan som en innehållsförteckning för att hitta den faktiska ljud-videoklippet. Den produktutvecklingen – att förstå jobben som ska utföras, inte bara teknologin – kom direkt från mina designrötter.
Fathom skapades 2020, långt innan de flesta företag tänkte allvarligt på AI-nativa arbetsflöden. Vilka fördelar gav byggandet med AI i kärnan – snarare än att återanpassa det – er tidigt?
Den viktigaste fördelen var arkitektonisk frihet. Vi kunde utforma varje system, från datapipeliner till användarupplevelse, med antagandet att AI skulle vara ett grundläggande lager och inte en påbyggnadsfunktion. De flesta konkurrenter 2020 och 2021 anställde lingvistexperter och ML-specialister för att bygga sina egna modeller. Vi tog den motsatta vägen eftersom vi trodde att vinnarna i utrymmet skulle vara de som kunde tillämpa AI effektivt för att lösa riktiga problem, inte de som byggde modellerna själva. Den contrarian-vyn låter oss stanna smidiga med ett mindre team och fokusera våra ingenjörsresurser på de hårda infrastrukturproblemen – tillförlitlig inspelning över plattformar, virala distributionsmekanismer, realtidsbearbetning i stor skala.
Här är det viktiga med att starta 2020: AI var inte tillräckligt bra ännu. Vi visste det. Men vi visste också att om vi väntade på att AI skulle mognat innan vi byggde företaget, skulle vi vara två till tre år för sent. Dörren skulle vara vidöppen, och alla skulle strömma in. Så vi byggde allt annat först – infrastrukturen, distributionskanalerna, användarupplevelsen – med det uttryckliga förväntning att när AI kom dit, kunde vi släppa in det som en ny motor i en bil. Det beslutet betalade av massivt. När GPT-4 och Claude anlände 2022-2023 kunde vi omedelbart integrera dem. Konkurrenter som hade tillbringat år med att bygga anpassade NLP-pipeliner tvingades plötsligt ompröva hela sin stack. Vi uppgraderade bara våra modeller och fortsatte leverera.
Att bygga AI-nativt förändrade också grundläggande vår produktutvecklingsprocess. Traditionell programvara har en ganska linjär roadmap: Du bestämmer vad du ska bygga, du bygger det och du levererar det. Med AI använder vi vad jag kallar en “Jenga-modell”. Varje block representerar en potentiell AI-förmåga. Om vi trycker på ett block och får motstånd eftersom modellerna inte är tillräckligt bra än, provar vi ett annat. Vi vet att om sex månader kommer teknologin att förbättras och vi kan komma tillbaka till det. Detta hindrar oss från att tvinga funktioner innan de är klara, samtidigt som vi ser till att vi alltid levererar värde.
Den andra fördelen var trovärdighet. Ja, investerare sa till mig att inte sätta “AI” i vårt namn 2020, men att vara tidiga gav oss autenticitet. Vi hoppade inte på en trend; vi satte vår tilltro till en tes innan den blev uppenbar. Det positionerade oss som byggare, inte snabba följare.
Du har beskrivit möteskonversationer som en av de mest försummade datakällorna inom organisationer. Vad övertygade dig om att detta var den nästa stora gränsen för AI?
Jag insåg att jag aldrig hade mött en säljare som har åtta timmar om dagen att lyssna på alla sina teams möten, för att inte tala om att fatta beslut och coacha sitt team baserat på vad de har hört. Möten genererar otroligt värdefulla data, men det är helt otillgängligt i stor skala. Med traditionella möten slänger vi bort 99 % av innehållet, medan de sista 1 % av anteckningarna hamnar i CRM. Sedan försöker vi omvänd extrapolera från där vad som kommer att hända med vår verksamhet. Det är en absurd process. Informationen som faktiskt är viktig – kundens röstens ton, den specifika invändningen de reste, den konkurrensmention som kom upp – allt filtreras genom någons hastigt skrivna anteckningar och förlorar all kontext.
Vad som övertygade mig om att detta var den nästa stora gränsen var att känna igen att denna “konversationsmörka data” faktiskt är den rikaste signalen för vad som händer i en organisation. Du får realtidsinsikt i kundens smärt punkter, produktgap, konkurrens hot och utbildningsbehov – allt i människors egna ord. När en kund förklarar varför de behöver en funktion, är det mycket mer värdefullt än en säljrepresentants parafras i en CRM-fält.
Genombrottet med AI är att vi äntligen kan utnyttja denna data i stor skala. När vi först lanserade Ask Fathom kunde det svara på frågor om enskilda möten. Sedan förbättrade vi det för att hantera små grupper av möten. Nu är det smart nog att förstå hela företagets uppsättning av möten. Säljledare kan fråga, “Vilka konkurrenter är mest trendande nyligen? Visa mig några klipp.” Ingenjörsteam kan fråga, “Berätta för oss om transkriptionsmotorernas historia på Fathom” och få en sexsidig syntetiserad dokument som drar från fyra års möten med ingenjörer.
Det börjar bli ett mycket större hjärna som verkligen förstår vad din verksamhet gör och de samtal den har. Du kan föreställa dig en värld snart där en AI kan berätta för dig vilka funktioner du ska bygga härnäst baserat på vad som skulle hjälpa till att stänga de flesta affärer, eller vilka konkurrenter som kommer upp, eller vilka utbildningsgap som finns över hela ditt team.
Många användare citerar Fathom som transformerande för att stanna närvarande under möten. Hur balanserar du automatisering med att bevara den naturliga flödet av mänskliga samtal?
Detta har varit kärnan i vår designfilosofi från början. Målet är inte att ha AI som berättar för dig vad du ska göra under ett möte, utan snarare att ge dig insikter som hjälper dig att vara mer närvarande och effektiv i dina samtal.
Vi är försiktiga med vad vi automatiserar och vad vi inte gör. Vi lanserar inte funktioner förrän vi vet att vi kan göra dem riktigt bra. Detta innebär ibland att vi inte är först på marknaden med vissa funktioner, men när vi lanserar något, fungerar det och levererar äkta värde. Vi har varit försiktiga med att förfölja saker som telefonsamtalinspelning eller vissa mötesinspelningar på plats trots frekventa förfrågningar. Vi föredrar att excellera i vad vi gör snarare än att lansera en medioker upplevelse som stör det naturliga flödet av samtal.
Till slut berättar våra användare för oss att vi slår rätt balans: De säger att de sparar 6+ timmar per vecka och flyttar 3× snabbare från insikt till nästa steg; 95 % rapporterar att Fathom håller dem närvarande i möten. Detta bekräftar att vi förstärker mänsklig förmåga, inte ersätter den.
Fathom lockade mer än 1 300 användar-investerare i sin serie A – ett sällsynt tecken på produkt-nivå tillit. Vad tror du att det var som resonerade så starkt med vardagliga användare?
För det första ger vi bort en äkta robust gratisprodukt: obegränsade möten, fem AI-sammanfattningar per månad. Två tredjedelar av våra användare betalar oss aldrig en enda krona, och vi är helt okej med det. Det är inte ett typiskt SaaS-spel. Våra användare ser att vi inte försöker utvinna värde från dem vid varje vändning. Vi fokuserar på att göra enskilda bidragsgivares liv bättre gratis, och vi monetiserar genom att sälja hanteringsverktyg till deras chefer – coachningsinstrumentpaneler, mötesintelligens och konkurrensinsikter. Produkten fungerar bara, och den fortsätter att fungera oavsett om du betalar eller inte. Det skapar äkta tillit.
Vår tillväxt är nästan uteslutande mun-till-mun – vi har vuxit mer som ett socialt medieplattform än traditionell B2B-programvara. Våra användare är våra förespråkare och distributionskanal. Att låta dem bli investerare erkänner bara vad som redan är sant: De är partners i denna mission.
Jag tror också att det finns en djupare resonans kring problemet vi löser. Alla har upplevt smärtan av att vara i ett möte, försöka vara närvarande och se någon frenetiskt skriva istället för att engagera sig. Alla har behövt information från ett möte de inte var på och fått en värdelös tvåradig sammanfattning. Problemet är universellt, och lösningen känns nästan magisk när den fungerar bra. Användare investerar för att de vill att denna framtid ska existera – inte bara för sig själva, utan för alla de arbetar med.
Din bakgrund inkluderar att bygga UserVoice, som hjälpte till att definiera hur företag hanterar kundfeedback. Hur påverkade den erfarenheten ditt tänkande kring organisatoriskt minne och AI-drivna kunskapsflöden?
UserVoice lärde mig att den mest värdefulla informationen i företag ofta är den mest utspridda. Kundfeedback fanns överallt. Den var begravd i supportärenden, vidarebefordrade e-postmeddelanden och slumpmässiga säljsamtal. Företag kunde ha tusentals datapunkter om vad kunderna ville ha, men inget sätt att syntetisera det till strategiska beslut. Vi byggde infrastruktur för att samla in den feedbacken i stor skala och göra den tillgänglig för de personer som fattade produktbeslut.
Parallellen med Fathom är tydlig, men problemutrymmet är mer djupgående. Möten är exponentiellt mer utspridda än kundfeedback. Varje organisation har hundratals eller tusentals timmar av samtal som sker varje vecka. Vad jag lärde mig av UserVoice är att fånga är nödvändigt, men det räcker inte. Du kan inte bara samla information; du måste bygga intelligens om vad som är viktigt och dirigera det till rätt personer. Med UserVoice byggde vi röstningssystem, trenderingsalgoritmer och adminpaneler så att produktteam kunde skilja signal från brus. Med Fathom bygger vi AI som förstår sammanhang över samtal och kan proaktivt yta insikter: “Fem kunder nämnde den här användningsfallet den här månaden”, eller “Ditt team fastnar för det här invändningen.”
Den andra lärdomen var om demokratisering. UserVoice gjorde det möjligt för varje kund att ge feedback, inte bara de högsta som kunde få chefer på telefon. Med Fathom demokratiserar vi tillgång till mötesintelligens. I vårt fallstudie med Netgain tillbringade deras driftschef 7,5 timmar om dagen med att bara svara på grundläggande frågor om vad som hände i säljsamtal. Det är galet. Informationen fanns, men den var instängd i människors huvuden och utspridda anteckningar.
Framtiden för organisatoriskt minne är att flytta från dessa isolerade kunskaps-silos – CRM, dokument, feedbacksystem – till anslutna, konversationsbaserad intelligens. Det är den logiska utvecklingen av vad vi började bygga med UserVoice, men AI gör det möjligt att göra det med fullständig trohet till mänskligt samtal, inte bara strukturerad data.
Zoom-baserade AI-verktyg exploderade efter 2020. Enligt din åsikt, vad skiljer en riktigt hjälpsam AI-assistent från en som bara lägger till brus?
Jag berättar alltid för människor att det bara finns två saker som kan verkligen sänka en AI-mötesassistent: om produkten inte är tillförlitlig, eller om AI-utmatningen är skräp. Jag tror att det fanns mycket marknadsförings- AI i den tidigare generationen där det var lätt att lova magiska saker, men sedan kom verkligheten ut som nonsens. Vi har alltid försökt se till att vi har en högkvalitativ, tillförlitlig produkt som gör vad den lovar. Våra nyckeldifferentieringar är:
- Transkriptionsnoggrannhet. Fathom anses vara den mest exakta transkriptionen där ute idag. De flesta verktyg utnyttjar en tredjeparts transkriptionstjänst, medan vi byggde vår egen proprietära transkriptionsteknologi internt. Om din transkription är dålig, är allt från en AI-komponent helt förstört eftersom allt kommer från transkriptionen.
- Tillförlitlighet och infrastruktur. När du går med i ett möte är du ofta i en brådska eller stressad. Många av dessa andra verktyg skulle ha botar som gick med i möten men sedan inte spela in, eller inspelningen skulle misslyckas. Vi existerar nästan på ett realtids-systemnivå – du arbetar på något som är ett steg bakom avionik. Om det inte fungerar två gånger, är användaren borta. Det är inte som traditionell SaaS där du kan vara nere ibland.
- AI som förstår nyans och sammanhang. Affärsspråk kan vara mycket subtilt. Jag minns att jag körde säljteamet på UserVoice och läste människors anteckningar, tänkande, “Jag behöver höra hur de faktiskt sa det.” AI måste fånga inte bara vad som sades, utan tonen, tvekan och entusiasmen (eller bristen på den). Det är därför vi länkar varje sammanfattningspunkt tillbaka till det faktiska ögonblicket i inspelningen.
- Anpassning utan komplexitet. AI bör anpassa sig till din verksamhet, inte tvärtom. Säljteam bör kunna modifiera mallar för att matcha sina specifika metoder – MEDDIC, Challenger, SPICED, vad de än använder. Men detta kan inte kräva en datavetenskaplig examen. Det behöver bara fungera.
Fathom omvandlar mötesinnehåll till agerbar kunskap. Hur nära är vi till AI-system som fungerar som riktiga arbetsflödesmotorer – anslutning samtal, beslut och nedströmsuppgifter automatiskt?
Jag tror att vi är närmare än de flesta människor förstår. Men det finns fortfarande viktiga steg att ta. Just nu rör vi oss mot en värld där Fathom gör allt mer av arbetet åt dig. Det första steget är bara att få informationen dit där du vill att den ska gå. Nästa steg, som inte är långt borta, är att ha AI som faktiskt gör arbetet åt dig.
Vi ser redan tidiga versioner av detta. Vår Asana-integration tar action items från möten och skapar automatiskt spårbara uppgifter. Fathom vill inte skapa en uppgiftshanteringslösning – det finns många bra där ute, som Asana. Så vi bygger integrationer som trycker mötesresultat direkt in i de verktyg som människor redan använder för att få jobbet gjort.
På CRM-sidan trycker vi automatiskt in strukturerade fält – smärt punkter, tidsplaner, nyckelbeslutsfattare – in i Salesforce och HubSpot. I ett fallstudie sparade detta 20 till 30 minuter per affärsuppdatering och ledde till nästan perfekt månadsvis exakthet i prognos. Det är ett arbetsflödesmotor i aktion: Samtal sker, AI extraherar nyckelaffärsdata och sedan flyter det automatiskt in i ditt system för registrering utan att någon skriver något.
Men jag tror att det riktiga genombrottet är på väg med vad jag kallar semantiska baserade aviseringar och intelligent routing. Tänk dig att vara en chef eller säljledare och få en daglig höjdpunktsfilm där AI har hittat varje prisdiskussion som gick snett, eller varje produktblockerare som kom upp i en förnyelse-samtal. Om du är en ingenjörschef ser du varje het debatt bland dina ingenjörer. AI kan förstå ton och nyans nu, inte bara nyckelord, så den vet vilka ögonblick du faktiskt bryr dig om.
Som företag växer, kämpar de med distribuerad kunskap och informationsförfall. Hur ser du att AI hanterar gapet mellan vad team diskuterar och vad som faktiskt utförs?
Detta är ett av de mest kritiska problemen vi löser. Det finns två grupper vi kan hjälpa: människor i mötet som försöker ta anteckningar och vara närvarande, och chefer, ledare och grundare som inte är i mötet men kör team och försöker förstå vad som händer. Den senare gruppen är där det distribuerade kunskapsproblemet verkligen slår.
Det grundläggande problemet är synlighet. När någon i ett företag vill veta statusen för en affär eller vad som händer med en kund, finns det traditionellt sett ingen plats att enkelt hitta den informationen. De ringer säljteamet, vilket tvingar representanter att tillbringa 20-30 minuter med att gräva igenom anteckningar. Under toppperioder får vissa driftschefar 15 förfrågningar dagligen – det är 7,5 timmar som tillbringas på informationsåtervinning istället för värdeskapande aktiviteter.
AI kan börja ansluta prickar över samtal som ingen människa kunde spåra. Den typen av mönsterigenkänning över distribuerade samtal är hur du förhindrar kunskapsförfall och faktiskt omvandlar samtal till strategisk intelligens.
Om fem år, hur förväntar du dig att mötesintelligens kommer att utvecklas – och vilken roll ser du att AI kommer att spela i framtiden för organisatoriskt minne, beslutsfattande och samarbete?
Om fem år tror jag att vi kommer att se tillbaka på dagens mötesintelligensverktyg på samma sätt som vi nu ser på de tidiga smartphones: imponerande för sin tid, men primitiva jämfört med vad som blev möjligt.
Den första stora utvecklingen är att flytta från anteckningar till riktiga arbetsflödesautomatiseringar. Vi föreställer oss en framtid där att bara säga något i ett möte kan vilja det till existens, utan det efterföljande arbetet. Just nu, om du säger i ett möte, “Låt oss skapa en specifikation för den här funktionen och schemalägga en uppföljning med ingenjörerna nästa vecka”, måste du fortfarande manuellt skapa den dokumentationen och skicka den kalenderinbjudan. Om fem år kommer AI att göra allt det arbetet åt dig. Du säger det, och det händer. Med AI som skapar uppgifter, specifikationer och dokument kan människor fokusera på det arbete som faktiskt kräver mänsklig kreativitet och bedömning.
Den andra utvecklingen är att expandera från kundinriktade till alla möten. Just nu fokuserar vi på externa möten: försäljning, kundframgång, byråer som möter kunder. Men vårt mål under de kommande 12 till 18 månaderna är att göra Fathom-plattformen som du kan använda över hela din organisation, inte bara kundinriktade team. Vi bygger bot-lös inspelning som kan fånga vilket samtal som helst, inklusive Slack-samlingar och möten på plats. Det utvecklas till att kunna fånga vilket samtal som helst du har i ditt företag, oavsett medium.
Företagen som stiger till toppen kommer att vara de som behandlar konversationsdata som en första klassens medborgare – lika viktigt som deras CRM-data, analyser och dokument. För tillförlitligheten är den viktigaste faktorn i att bygga förtroende med kunder och anställda.












