interviste
Richard White, fondatore e CEO di Fathom – Serie di interviste

Richard White, fondatore e CEO di Fathom, è un fondatore pluripremiato e imprenditore focalizzato sul prodotto, noto per aver trasformato le frustrazioni personali in software che hanno definito nuove categorie. Prima di Fathom, ha fondato e guidato UserVoice per quasi 13 anni, trasformandola in una redditizia piattaforma di gestione del feedback utilizzata da migliaia di aziende, dalle startup alle grandi aziende come Microsoft, e ha anche ideato l'ormai onnipresente scheda "Feedback" sui siti web. All'inizio della sua carriera, ha creato e gestito SlimTimer in completa autonomia per oltre un decennio, ha guidato influenti progetti open source come AjaxScaffold nell'ecosistema Ruby on Rails e ha lavorato come Product Design Lead presso Kiko (YC S05), esperienze che hanno plasmato la sua filosofia incentrata su usabilità , empatia con il cliente e creazione di strumenti che migliorano in modo discreto ma significativo il modo in cui i team lavorano.
Fondata nel 2020, Scandagliare riflette la stessa filosofia affrontando un punto dolente universale: il sovraccarico cognitivo di prendere appunti mentre si cerca di avere conversazioni reali. La piattaforma registra, trascrive e riassume automaticamente le riunioni, in particolare su Zoom, consentendo agli utenti di evidenziare i momenti in tempo reale, condividere brevi clip invece di appunti grezzi e preservare le sfumature che spesso si perdono nei riassunti scritti. Con la maturazione di Fathom, si è evoluto oltre la semplice trascrizione in un sistema di registrazione delle conversazioni leggero, progettato per aiutare i team a conservare il contesto, imparare dalle chiamate dei clienti e collaborare in modo asincrono senza aggiungere attrito alla riunione stessa.
Negli ultimi 15 anni hai creato aziende che rimodellano il modo in cui le persone comunicano, da UserVoice a Fathom. Qual è stato il momento che ti ha spinto a fondare Fathom e in che modo le tue radici nell'ingegneria e nella progettazione di prodotti hanno plasmato l'azienda fin dal primo giorno?
L'ispirazione per fondare Fathom è arrivata all'inizio del 2020. Era il periodo pre-pandemia, ma stavo conducendo un'ampia ricerca sugli utenti per un prodotto e all'improvviso mi sono ritrovato a partecipare a 15 o 20 riunioni Zoom consecutive al giorno. Sei settimane di questo tipo mi hanno reso profondamente consapevole di quanto fosse dolorosa quell'esperienza. Non riesco a parlare e scrivere contemporaneamente: guardavo i miei appunti due settimane dopo e non ricordavo più quale conversazione fosse stata. Il problema più grande era che facevo tutte queste ricerche e poi condividevo alcuni punti elenco con il mio team, ma non funzionava. Tutto si perdeva nella traduzione. Per me è stato un momento in cui mi sono sentito "inciampato": qualcosa che, se capita una volta al mese, ignori. Ti capita di inciampare in qualcosa ogni giorno, più volte al giorno, e cerchi subito di rimediare.
La mia formazione in ingegneria e design ha influenzato le scelte che ho fatto durante la creazione di Fathom. Ho sempre affrontato i problemi prendendo concetti già esistenti e rendendoli radicalmente più fruibili per un pubblico molto più vasto. Con Fathom, ho avuto l'intuizione che la tecnologia di trascrizione stava diventando una commodity: c'era una proliferazione di soluzioni pronte all'uso che cinque anni prima non esistevano. Quindi, la trascrizione era parte della soluzione, ma non era la soluzione stessa.
Dal punto di vista del product design, mi sono reso conto che le trascrizioni possono essere preziose per le persone che hanno partecipato alla chiamata. Ma non sono di grande aiuto per chi non era presente. Ciò che abbiamo trovato molto più efficace è stato mostrare il video di 30 secondi del cliente che solleva obiezioni sul prezzo o pone una domanda tecnica. Utilizziamo la trascrizione quasi come un indice per trovare la clip audio-video vera e propria. Quel pensiero di prodotto – comprendere le attività da svolgere, non solo la tecnologia – deriva direttamente dalle mie radici nel design.
Fathom è stata creata nel 2020, ben prima che la maggior parte delle aziende iniziasse a considerare seriamente i flussi di lavoro basati sull'intelligenza artificiale. Quali vantaggi vi ha offerto fin dall'inizio la creazione di un'azienda basata sull'intelligenza artificiale, anziché adattarla in un secondo momento?
Il vantaggio principale era la libertà architettonica. Potevamo progettare ogni sistema, dalle pipeline di dati all'esperienza utente, dando per scontato che l'intelligenza artificiale sarebbe stata un livello fondamentale e non una funzionalità aggiuntiva. La maggior parte dei concorrenti nel 2020 e nel 2021 assumeva esperti linguistici e specialisti di machine learning per costruire i propri modelli. Noi abbiamo adottato la strategia opposta, perché credevamo che i vincitori nel settore sarebbero stati coloro che avrebbero saputo applicare l'intelligenza artificiale in modo efficace per risolvere problemi reali, non coloro che avrebbero costruito i modelli stessi. Questa visione anticonformista ci ha permesso di rimanere agili con un team più piccolo e di concentrare le nostre risorse ingegneristiche sui problemi infrastrutturali più complessi: registrazione affidabile su più piattaforme, meccanismi di distribuzione virale, elaborazione in tempo reale su larga scala.
Ecco il punto di partenza del 2020: l'intelligenza artificiale non era ancora abbastanza avanzata. Lo sapevamo. Ma sapevamo anche che se avessimo aspettato che l'intelligenza artificiale maturasse prima di fondare l'azienda, saremmo stati in ritardo di due o tre anni. La porta si sarebbe spalancata e tutti ci avrebbero invaso. Quindi abbiamo costruito tutto il resto per primo – l'infrastruttura, i canali di distribuzione, l'esperienza utente – con l'aspettativa esplicita che, una volta arrivata l'intelligenza artificiale, l'avremmo introdotta come un nuovo motore in un'auto. Quella decisione si è rivelata estremamente vantaggiosa. Quando GPT-4 e Claude sono arrivati ​​nel 2022-2023, abbiamo potuto integrarli immediatamente. I concorrenti che avevano trascorso anni a costruire pipeline NLP personalizzate hanno improvvisamente dovuto ripensare l'intero stack. Noi abbiamo semplicemente aggiornato i nostri modelli e continuato le spedizioni.
Costruire un'intelligenza artificiale nativa ha anche cambiato radicalmente il nostro processo di sviluppo prodotto. Il software tradizionale ha una roadmap piuttosto lineare: si decide cosa costruire, lo si costruisce e lo si consegna. Con l'intelligenza artificiale, utilizziamo quello che chiamo un "modello Jenga". Ogni blocco rappresenta una potenziale capacità dell'IA. Se spingiamo su un blocco e incontriamo resistenza perché i modelli non sono ancora abbastanza buoni, ne proviamo uno diverso. Sappiamo che tra sei mesi la tecnologia migliorerà e potremo tornarci sopra. Questo ci impedisce di forzare funzionalità prima che siano pronte, garantendo al contempo di fornire sempre valore.
L'altro vantaggio era la credibilità . Sì, gli investitori mi avevano detto di non mettere "AI" nel nostro nome nel 2020, ma essere stati in anticipo sui tempi ci ha dato autenticità . Non stavamo cavalcando un trend; stavamo scommettendo su una tesi prima che diventasse ovvia. Questo ci ha posizionato come costruttori, non come semplici follower.
Hai descritto le conversazioni durante le riunioni come una delle fonti di dati più trascurate all'interno delle organizzazioni. Cosa ti ha convinto che questa sarebbe stata la prossima grande frontiera dell'intelligenza artificiale?
Mi sono reso conto di non aver mai incontrato un venditore che avesse otto ore al giorno per ascoltare tutte le riunioni del suo team, figuriamoci prendere decisioni e guidare il team in base a ciò che ha sentito. Le riunioni generano dati incredibilmente preziosi, ma sono completamente inaccessibili su larga scala. Con le riunioni tradizionali buttiamo via il 99% dei contenuti, mentre l'ultimo 1% degli appunti finisce nel CRM. Poi cerchiamo di estrapolare da lì cosa accadrà alla nostra attività . È un processo assurdo. Le informazioni che contano davvero – il tono di voce di un cliente, l'obiezione specifica che ha sollevato, la menzione della concorrenza che è venuta fuori – vengono filtrate attraverso gli appunti frettolosamente digitati da qualcuno e perdono ogni contesto.
Ciò che mi ha convinto che questa fosse la prossima frontiera è stato riconoscere che questi "dati oscuri conversazionali" sono in realtà il segnale più completo di ciò che sta accadendo in un'organizzazione. Si ottengono informazioni in tempo reale sui punti critici dei clienti, sulle lacune dei prodotti, sulle minacce competitive e sulle esigenze di formazione, il tutto con le parole delle persone. Quando un cliente spiega perché ha bisogno di una funzionalità , questo è molto più prezioso della parafrasi di un addetto alle vendite in ambito CRM.
La svolta dell'intelligenza artificiale è che finalmente possiamo sfruttare questi dati su larga scala. Quando abbiamo lanciato Ask Fathom, poteva rispondere a domande su singole riunioni. Poi lo abbiamo migliorato per gestire piccoli gruppi di riunioni. Ora è abbastanza intelligente da comprendere l'insieme di riunioni dell'intera azienda. I responsabili delle vendite possono chiedere: "Quali concorrenti stanno crescendo di recente? Mostrami qualche clip". I team di ingegneri possono chiedere: "Raccontaci la storia dei motori di trascrizione di Fathom" e ottenere un documento sintetizzato di sei pagine, ricavato da quattro anni di riunioni di ingegneri.
Sta iniziando a essere un cervello molto più grande, che capisce davvero cosa sta facendo la tua azienda e le conversazioni che sta avendo. Puoi immaginare un mondo in cui presto un'IA potrà dirti quali funzionalità dovresti sviluppare in base a ciò che ti aiuterebbe a chiudere il maggior numero di accordi, o quali concorrenti si stanno presentando, o quali lacune formative esistono nel tuo team. C'è questa straordinaria fonte di dati che l'IA sta estraendo per fornirti input per la tua prossima riunione strategica o per il processo di roadmap.
Molti utenti citano Fathom come un'applicazione rivoluzionaria che permette di rimanere concentrati durante le riunioni. Come si concilia l'automazione con il mantenimento del flusso naturale della conversazione umana?
Questo è stato il fulcro della nostra filosofia di progettazione fin dall'inizio. L'obiettivo non è che l'intelligenza artificiale ti dica cosa fare durante una riunione, ma piuttosto che ti fornisca spunti che ti aiutino a essere più presente ed efficace nelle tue conversazioni.
Siamo attenti a ciò che automatizziamo e a ciò che non automatizziamo. Non lanciamo nuove funzionalità finché non siamo certi di poterle realizzare davvero bene. Questo a volte significa che non siamo i primi a lanciare sul mercato determinate funzionalità , ma quando lo facciamo, funziona e offre un valore reale. Siamo stati cauti nel perseguire soluzioni come la registrazione delle telefonate o l'acquisizione di alcune sessioni di meeting in-room, nonostante le frequenti richieste. Preferiamo eccellere in ciò che facciamo piuttosto che offrire un'esperienza mediocre che interrompe il flusso naturale della conversazione.
In definitiva, i nostri utenti ci dicono che stiamo trovando il giusto equilibrio: affermano di risparmiare più di 6 ore a settimana e di passare 3 volte più velocemente dall'intuizione ai passaggi successivi; il 95% afferma che Fathom li mantiene concentrati durante le riunioni. Questo conferma che stiamo potenziando le capacità umane, non sostituendole.
Fathom ha attirato oltre 1,300 investitori-utenti nel suo round di Serie A, un raro segnale di fiducia a livello di prodotto. Cosa pensi abbia avuto un impatto così forte sugli utenti abituali?
Innanzitutto, offriamo un prodotto gratuito davvero valido: riunioni illimitate, cinque riepiloghi AI al mese. Due terzi dei nostri utenti non ci pagano mai un centesimo, e per noi va benissimo. Non è una tipica strategia SaaS. I nostri utenti vedono che non cerchiamo di estrarre valore da loro a ogni passo. Ci concentriamo sul migliorare la vita dei singoli collaboratori gratuitamente e guadagniamo vendendo strumenti di gestione ai loro superiori: dashboard di coaching, intelligence cross-meeting e approfondimenti sulla concorrenza. Il prodotto funziona e basta, e continua a funzionare, che si paghi o meno. Questo crea una fiducia autentica.
La nostra crescita è quasi interamente dovuta al passaparola: siamo cresciuti più come una piattaforma di social media che come un tradizionale software B2B. I nostri utenti sono i nostri sostenitori e il nostro canale di distribuzione. Lasciarli diventare investitori non fa che riconoscere ciò che è già vero: sono partner in questa missione.
Penso anche che ci sia una risonanza più profonda attorno al problema che stiamo risolvendo. Tutti abbiamo provato il dolore di essere in riunione, cercando di essere presenti e guardando qualcuno digitare freneticamente invece di partecipare. Tutti abbiamo avuto bisogno di informazioni da una riunione a cui non eravamo presenti e abbiamo ricevuto un inutile riassunto di due righe. Il problema è universale e la soluzione sembra quasi magica quando funziona bene. Gli utenti investono perché vogliono che questo futuro esista, non solo per loro stessi, ma per tutti coloro con cui lavorano.
Il tuo background include lo sviluppo di UserVoice, che ha contribuito a definire il modo in cui le aziende gestiscono il feedback dei clienti. In che modo questa esperienza ha influenzato il tuo pensiero sulla memoria organizzativa e sui flussi di conoscenza basati sull'intelligenza artificiale?
UserVoice mi ha insegnato che le informazioni più preziose in un'azienda sono spesso quelle più disperse. Il feedback dei clienti era ovunque. Era sepolto in ticket di supporto, email inoltrate e conversazioni di vendita casuali. Le aziende avevano migliaia di dati sulle esigenze dei clienti, ma nessun modo per sintetizzarli in decisioni strategiche. Abbiamo creato un'infrastruttura per aggregare quel feedback su larga scala e renderlo accessibile a chi prendeva decisioni sui prodotti.
Il parallelismo con Fathom è chiaro, ma il problema è più profondo. Le riunioni sono esponenzialmente più disperse rispetto al feedback dei clienti. Ogni organizzazione ha centinaia o migliaia di ore di conversazioni ogni settimana. Quello che ho imparato da UserVoice è che la cattura è necessaria, ma non sufficiente. Non si possono semplicemente aggregare le informazioni; è necessario creare intelligence su ciò che conta e indirizzarla alle persone giuste. Con UserVoice, abbiamo creato sistemi di voto, algoritmi di trending e dashboard di amministrazione in modo che i team di prodotto potessero distinguere il segnale dal rumore. Con Fathom, stiamo sviluppando un'intelligenza artificiale che comprende il contesto delle conversazioni e può far emergere in modo proattivo insight: "Cinque clienti hanno menzionato questo caso d'uso questo mese" oppure "Il tuo team continua a bloccarsi su questa obiezione".
L'altra lezione riguardava la democratizzazione. UserVoice ha permesso a qualsiasi cliente di fornire feedback, non solo a quelli più rumorosi che riuscivano a parlare al telefono con i dirigenti. Con Fathom, stiamo democratizzando l'accesso all'intelligence delle riunioni. Nel nostro caso di studio con Netgain, il loro responsabile operativo trascorreva 7.5 ore al giorno solo a rispondere a domande basilari su cosa stesse accadendo durante le chiamate di vendita. È assurdo. Le informazioni esistevano, ma erano intrappolate nella testa delle persone e in appunti sparsi.
Il futuro della memoria organizzativa si sta spostando da questi isolati silos di conoscenza – CRM, documentazione, sistemi di feedback – a un'intelligenza conversazionale connessa. Questa è l'evoluzione logica di ciò che abbiamo iniziato a sviluppare con UserVoice, ma l'intelligenza artificiale consente di farlo con la stessa fedeltà della conversazione umana, non solo con dati strutturati.
Gli strumenti di intelligenza artificiale basati su Zoom hanno avuto un'esplosione dopo il 2020. Secondo te, cosa differenzia un assistente AI veramente utile da uno che si limita ad aggiungere rumore?
Dico sempre alla gente che ci sono solo due cose che possono davvero far fallire un assistente di meeting basato sull'intelligenza artificiale: se il prodotto non è affidabile o se l'output dell'intelligenza artificiale è spazzatura. Credo che ci sia stato molto marketing dell'intelligenza artificiale nella generazione precedente, dove era facile promettere cose magiche, ma poi la realtà si è rivelata un'assurdità . Abbiamo sempre cercato di assicurarci di avere un prodotto affidabile e di alta qualità che mantenga le promesse. I nostri principali fattori di differenziazione sono:
- Precisione della trascrizione. Fathom è considerata la trascrizione più accurata attualmente disponibile. La maggior parte degli strumenti sfrutta un servizio di trascrizione di terze parti, mentre noi abbiamo sviluppato internamente la nostra tecnologia di trascrizione proprietaria. Se la tua trascrizione è scadente, tutto ciò che proviene da un componente di intelligenza artificiale viene completamente distrutto, perché tutto viene rimosso dalla trascrizione.
- Affidabilità e infrastruttura. Quando si partecipa a una riunione, spesso si è di fretta o stressati. Molti di questi altri strumenti permetterebbero ai bot di partecipare alle riunioni, ma poi non registrerebbero, o la registrazione fallirebbe. Noi esistiamo quasi a livello di sistema in tempo reale: stiamo lavorando a qualcosa che è un passo indietro rispetto all'avionica. Se non funziona due volte, l'utente se ne va. Non è come il SaaS tradizionale, dove si può occasionalmente rimanere inattivi.
- Un'intelligenza artificiale che comprende sfumature e contesto. Il linguaggio aziendale può essere molto sottile. Ricordo di aver gestito il team di vendita di UserVoice e di aver letto gli appunti delle persone, pensando: "Devo sentire come hanno effettivamente detto questo". L'intelligenza artificiale deve catturare non solo ciò che è stato detto, ma anche il tono, l'esitazione e l'entusiasmo (o la sua mancanza). Ecco perché colleghiamo ogni punto di sintesi al momento effettivo nella registrazione.
- Personalizzazione senza complessità . L'intelligenza artificiale dovrebbe adattarsi alla tua attività , non il contrario. I team di vendita dovrebbero essere in grado di modificare i modelli per adattarli alle loro specifiche metodologie: MEDDIC, Challenger, SPICED, qualsiasi cosa utilizzino. Ma questo non può richiedere una laurea in data science. Deve semplicemente funzionare.
Fathom trasforma i contenuti delle riunioni in conoscenze fruibili. Quanto siamo vicini ai sistemi di intelligenza artificiale che funzionano come veri e propri motori di flusso di lavoro, collegando automaticamente conversazioni, decisioni e attività a valle?
Penso che siamo più vicini di quanto la maggior parte delle persone creda, ma ci sono ancora passi importanti da compiere. Al momento, ci stiamo muovendo verso un mondo in cui Fathom fa sempre più lavoro per te. Il primo passo è semplicemente portare le informazioni dove vuoi che vadano. Il passo successivo, che non è lontano, è far sì che l'IA faccia effettivamente il lavoro per te.
Stiamo già vedendo le prime versioni di questo sistema. La nostra integrazione con Asana acquisisce le attività dalle riunioni e crea automaticamente attività tracciabili. Fathom non vuole inventare una soluzione di gestione delle attività : ce ne sono molte ottime, come Asana. Quindi stiamo sviluppando integrazioni che trasferiscono i risultati delle riunioni direttamente negli strumenti che le persone già utilizzano per lavorare.
Sul lato CRM, inseriamo automaticamente i campi strutturati (punti critici, tempistiche, decision maker chiave) in Salesforce e HubSpot. In un caso di studio, questo ha fatto risparmiare dai 20 ai 30 minuti per aggiornamento dello stato di una trattativa e ha portato a una precisione pressoché perfetta delle previsioni di fine mese. Questo è un motore di flusso di lavoro in azione: avviene la conversazione, l'intelligenza artificiale estrae i dati aziendali chiave e li confluisce automaticamente nel sistema di archiviazione senza che nessuno digiti nulla.
Ma credo che la vera svolta arriverà con quelli che chiamo avvisi semantici e routing intelligente. Immaginate di essere un manager o un responsabile delle vendite e di ricevere ogni giorno un video con i momenti salienti in cui l'IA ha individuato ogni discussione sui prezzi andata a rotoli, o ogni ostacolo al prodotto emerso durante una chiamata di rinnovo. Se siete un responsabile tecnico, vedreste ogni dibattito acceso tra i vostri ingegneri. L'IA ora è in grado di comprendere toni e sfumature, non solo parole chiave, quindi sa quali sono i momenti che vi interessano davvero.
Man mano che le aziende crescono, si scontrano con la distribuzione della conoscenza e il decadimento delle informazioni. Come pensi che l'intelligenza artificiale possa colmare il divario tra ciò che i team discutono e ciò che viene effettivamente eseguito?
Questo è uno dei problemi più critici che stiamo risolvendo. Ci sono due gruppi che possiamo davvero aiutare: i partecipanti alla riunione che cercano di prendere appunti ed essere presenti, e il management, la leadership e i fondatori che non sono presenti alla riunione ma gestiscono i team e cercano di capire cosa sta succedendo. È in questo secondo gruppo che si manifesta il vero problema della conoscenza distribuita.
Il problema principale è la visibilità . Quando qualcuno in un'azienda vuole conoscere lo stato di una trattativa o cosa sta succedendo con un cliente, tradizionalmente non c'è un posto dove trovare facilmente queste informazioni. Chiamano il team di vendita, costringendo i rappresentanti a dedicare 20-30 minuti a esaminare gli appunti. Nei periodi di punta, alcuni responsabili operativi ricevono 15 richieste al giorno, ovvero 7.5 ore spese a recuperare informazioni invece che in attività a valore aggiunto.
L'intelligenza artificiale può iniziare a collegare punti in conversazioni che nessun essere umano potrebbe tracciare. Questo tipo di riconoscimento di schemi in conversazioni distribuite è il modo in cui si previene il decadimento della conoscenza e si trasformano effettivamente le conversazioni in intelligenza strategica.
Guardando al futuro dei prossimi cinque anni, come prevedi che evolverà l'intelligenza artificiale nelle riunioni e quale ruolo ritieni che giocherà l'intelligenza artificiale nel futuro della memoria organizzativa, del processo decisionale e della collaborazione?
Tra cinque anni, penso che guarderemo agli attuali strumenti di intelligence per le riunioni nello stesso modo in cui guardiamo ai primi smartphone: impressionanti per l'epoca, ma primitivi rispetto a ciò che è diventato possibile.
La prima grande evoluzione è il passaggio dalla presa di appunti alla vera automazione del flusso di lavoro. Immaginiamo un futuro in cui il semplice fatto di dire qualcosa in una riunione può farla diventare realtà , senza il lavoro successivo. Attualmente, se durante una riunione si dice "Creiamo una specifica per questa funzionalità e pianifichiamo un follow-up con il reparto tecnico la prossima settimana", è comunque necessario creare manualmente quel documento e inviare quell'invito dal calendario. Tra cinque anni, l'intelligenza artificiale farà tutto automaticamente. Basta pronunciarlo e il processo si svolge. Con l'intelligenza artificiale che crea attività , specifiche e documenti, le persone possono concentrarsi sul lavoro che richiede effettivamente creatività e giudizio umani.
La seconda evoluzione riguarda l'espansione dalle riunioni rivolte al cliente a tutte le riunioni. Al momento ci concentriamo sulle riunioni esterne: vendite, customer success, incontri tra agenzie e clienti. Ma il nostro obiettivo nei prossimi 12-18 mesi è rendere Fathom la piattaforma utilizzabile in tutta la vostra organizzazione, non solo per i team a contatto con il cliente. Stiamo sviluppando una registrazione senza bot in grado di catturare qualsiasi conversazione, comprese le riunioni su Slack e le riunioni di persona. Si sta evolvendo per consentirvi di catturare qualsiasi conversazione abbiate in azienda, indipendentemente dal mezzo utilizzato.
Le aziende che raggiungeranno il vertice saranno quelle che tratteranno i dati conversazionali come cittadini di prima classe, importanti quanto i dati CRM, le analisi e i documenti. Perché, in definitiva, la conoscenza più importante in qualsiasi organizzazione non risiede nei sistemi; risiede nelle conversazioni. L'intelligenza artificiale sta finalmente rendendo possibile sfruttarle.
Grazie per la fantastica intervista, i lettori che desiderano saperne di più su questa app per prendere appunti dovrebbero visitare Scandagliare.












