Interviews
Ofer Ronen, Co-Founder und CEO von Tomato.ai – Interview-Reihe

Ofer Ronen ist der Co-Founder und CEO von Tomato.ai, einer Plattform, die einen künstlich intelligenten Sprachfilter zur Abschwächung von Akzenten für Offshore-Agentenstimmen anbietet, wenn diese sprechen, was zu verbesserten CSAT- und Verkaufsmetriken führt.
Ofer hat zuvor drei Tech-Startups verkauft, zwei an Google und eines an IAC. Er verbrachte die letzten fünf Jahre bei Google, wo er im Area 120-Inkubator Contact-Center-KI-Lösungen aufbaute. Er schloss über 500 Millionen Dollar an Deals für diese neuen Lösungen ab. Er hat einen Master-Abschluss in Computer-Ingenieurwesen mit Schwerpunkt KI von der University of Michigan und einen MBA von Cornell.
Was hat Sie ursprünglich zur maschinellen Lernung und KI hingezogen?
KI hat eine lange Geschichte von Starts und Stops. Perioden, in denen es viel Hoffnung für die Technologie gab, um Branchen zu verändern, gefolgt von Perioden der Desillusionierung, weil sie nicht ganz den Erwartungen entsprach.
Als ich vor ein paar Jahrzehnten einen Master-Abschluss in KI an der University of Michigan machte, war es eine Periode der Desillusionierung, in der KI nicht ganz den gewünschten Einfluss hatte. Ich war fasziniert von der Idee, dass Computer durch Beispiele und nicht durch traditionelle Heuristiken, die das Nachdenken über explizite Anweisungen erfordern, Aufgaben ausführen können. Zu dieser Zeit arbeitete ich in einem KI-Forschungslabor an virtuellen Agenten, die Lehrern halfen, Online-Ressourcen für ihre Klassen zu finden. Damals hatten wir nicht die großen Datenmengen, die leistungsfähigen Rechenressourcen oder die fortschrittlichen neuronalen Netze, die wir heute haben, so dass die Fähigkeiten, die wir aufbauten, begrenzt waren.
Von 2016 bis 2019 haben Sie im Google-Area-120-Inkubator an der Entwicklung hoch robuster virtueller Agenten für die größten Contact-Center gearbeitet. Was war diese Lösung genau?
Vor kurzem habe ich im Google-Area-120-Inkubator an einigen der größten Voice-Virtual-Agent-Deployments gearbeitet, einschließlich einiger Projekte für Fortune-50-Unternehmen mit über 100 Millionen Supportanrufen pro Jahr.
Um robustere Voice-Virtual-Agenten zu bauen, die komplexe Gespräche bewältigen können, haben wir Millionen von historischen Gesprächen zwischen Menschen verwendet, um den Typ von Follow-up-Fragen zu erkennen, die Kunden über ihr anfängliches Problem hinaus haben. Durch das Mining von Follow-up-Fragen und das Mining unterschiedlicher Wege, wie Kunden jede Frage formulieren, konnten wir flexible virtuelle Agenten bauen, die sich in Gesprächen bewegen können. Dies spiegelt besser die Art von Gesprächen wider, die Kunden mit menschlichen Agenten führen. Das Ergebnis war eine materielle Steigerung der Gesamtanrufe, die von den virtuellen Agenten vollständig bearbeitet wurden.
Im Jahr 2021 und 2022 haben Sie ein zweites Startup im Area 120 aufgebaut. Könnten Sie uns erzählen, was diese Firma war und was Sie aus dieser Erfahrung gelernt haben?
Mein zweites Startup innerhalb von Area 120 konzentrierte sich erneut auf Call-Center. Unsere Lösung konzentrierte sich auf die Reduzierung von Kundenverlusten, indem Kunden sofort nach einem fehlgeschlagenen Supportanruf kontaktiert wurden, bei dem der Kunde sein Problem geäußert, aber keine Lösung gefunden hatte. Der Kontakt wurde von virtuellen Agenten durchgeführt, die darauf trainiert waren, diese offenen Probleme anzusprechen. Was ich aus dieser Erfahrung gelernt habe, ist, dass es schwierig ist, den Kundenverlust in einer zeitnahen Weise zu messen. Es kann sechs Monate dauern, um statistisch signifikante Ergebnisse für Änderungen im Kundenverlust zu erhalten. Das macht es schwierig, eine Erfahrung schnell genug zu optimieren und Kunden davon zu überzeugen, dass eine Lösung funktioniert.
Könnten Sie uns die Entstehungsgeschichte hinter Ihrem dritten Contact-Center-AI-Startup Tomato.ai erzählen und warum Sie sich entschieden haben, es selbst zu tun, anstatt innerhalb von Google zu arbeiten?
Die Idee für Tomato.ai, meinem dritten Contact-Center-Startup, kam von James Fan, meinem Co-Founder und CTO. James dachte, es wäre effektiver, Wein mit einem französischen Akzent zu verkaufen, und was, wenn jeder so klingen könnte, als ob er Französisch spricht?
Dies war der Same der Idee, und von dort aus entwickelte sich unser Denken weiter. Als wir es genauer untersuchten, fanden wir ein akuteres Schmerzpunktproblem, das Kunden haben, wenn sie mit akzentuierten Offshore-Agenten sprechen. Kunden hatten Probleme mit dem Verständnis und dem Vertrauen. Dies stellte eine größere Marktmöglichkeit dar. Angesichts unserer Hintergründe erkannten wir den großen Einfluss, den es auf Call-Center haben würde, um ihre Verkaufs- und Supportmetriken zu verbessern. Wir bezeichnen diese Art von Lösung jetzt als Akzentabschwächung.
James und ich haben zuvor Startups geleitet und verkauft, einschließlich jeweils eines Startups, das wir an Google verkauft haben.
Wir entschieden uns, Google zu verlassen, um Tomato.ai zu gründen, weil wir nach vielen Jahren bei Google danach strebten, wieder ein eigenes Unternehmen zu gründen und zu leiten.
Tomato.ai löst ein wichtiges Schmerzpunktproblem in Call-Centern, nämlich die Abschwächung von Akzenten für Agenten. Könnten Sie erläutern, warum Sprachfilter eine bevorzugte Lösung gegenüber der Agentenausbildung sind?
Bei Tomato.ai verstehen wir die Bedeutung klarer Kommunikation in Call-Centern, wo Akzente manchmal Barrieren schaffen können. Anstatt sich ausschließlich auf traditionelle Agentenausbildung zu verlassen, haben wir Sprachfilter entwickelt, oder was wir “Akzentabschwächung” nennen. Diese Filter helfen Agenten, ihre einzigartige Stimme beizubehalten, während sie ihre Akzente reduzieren, was die Klarheit für Anrufer verbessert. Durch die Verwendung von Sprachfiltern stellen wir sicher, dass die Kommunikation besser wird und das Vertrauen zwischen Agenten und Anrufern aufgebaut wird, was jeden Kontakt effektiver und zufriedenstellender für den Kunden macht. Im Vergleich zu umfassenden Ausbildungsprogrammen bieten Sprachfilter eine einfachere und unmittelbarere Lösung, um akzentbedingte Herausforderungen in Call-Centern anzugehen.
Wenn bestehende Agenten diese Tools nutzen, um ihre Leistung zu verbessern, werden sie in die Lage versetzt, höhere Tarife zu verlangen, die ihren erhöhten Wert bei der Lieferung außergewöhnlicher Kundenerfahrungen widerspiegeln. Gleichzeitig wird der demokratisierende Effekt von generativer KI neue Einsteiger-Agenten in die Branche bringen, was den Talentpool erweitert und die Stundenlöhne senkt. Dieses Dilemma markiert eine grundlegende Veränderung in der Dynamik von Call-Center-Dienstleistungen, bei der Technologie und menschliche Expertise die Landschaft der Branche neu gestalten und den Weg für eine inklusivere und wettbewerbsfähigere Zukunft ebnen.
Welche maschinellen Lern- und KI-Technologien werden verwendet, um die Sprachfilterung zu ermöglichen?
Eine solche Echtzeit-Sprachfilterlösung wäre vor ein paar Jahren nicht möglich gewesen. Fortschritte in der Sprachforschung in Kombination mit neueren Architekturen wie dem Transformer-Modell und Deep Neural Networks sowie leistungsfähigeren KI-Hardware (wie TPUs von Google und GPUs von NVidia) machen es heute möglich, solche Lösungen zu entwickeln. Es ist dennoch ein sehr schwieriges Problem, das unsere Team dazu zwingt, neue Techniken für die Schulung von Sprache-zu-Sprache-Modellen zu erfinden, die niedrige Latenz und hohe Qualität aufweisen.
Welche Art von Feedback haben Sie von Call-Centern erhalten, und wie hat es sich auf die Fluktuationsrate der Mitarbeiter ausgewirkt?
Wir haben eine starke Nachfrage von großen und kleinen Offshore-Call-Centern, unsere Akzentabschwächungslösung auszuprobieren. Diese Call-Center erkennen, dass Tomato.ai ihnen bei ihren beiden größten Problemen helfen kann (1) Die Leistungsmetriken von Offshore-Agenten sind nicht so gut wie die von Onshore-Agenten (2) Es ist schwierig, genügend qualifizierte Agenten in Offshore-Märkten wie Indien und den Philippinen zu finden.
Wir erwarten in den kommenden Wochen Fallstudien, die den Einfluss zeigen, den Call-Center durch die Verwendung von Akzentabschwächung erleben. Wir erwarten, dass Verkaufsanrufe einen sofortigen Anstieg in wichtigen Metriken wie Umsatz, Abschlussraten und Lead-Qualifizierungsraten sehen werden. Gleichzeitig erwarten wir, dass Supportanrufe kürzere Bearbeitungszeiten, weniger Rückrufe und verbesserte CSAT sehen werden.
Wie oben erwähnt, dauert es länger, die Fluktuationsraten zu validieren, und daher werden Fallstudien mit diesen Verbesserungen zu einem späteren Zeitpunkt verfügbar sein.
Tomato.ai hat kürzlich eine Finanzierungsrunde von 10 Millionen Dollar abgeschlossen. Was bedeutet dies für die Zukunft des Unternehmens?
Wenn Tomato.ai sich auf den Start seines ersten Produkts vorbereitet, bleibt das Team weiterhin seinem Engagement verpflichtet, die Landschaft der globalen Kommunikation und die Zukunft der Arbeit, ein Gespräch nach dem anderen, neu zu gestalten.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Tomato.ai besuchen.












