Vordenker

Wie Voice-AI von einer Neuheit zur Kerninfrastruktur wird

Published May 29, 2026

Jason Luo, CEO, Newo

Es gibt einen Moment in jeder Technologie-Implementierung, in dem die interessante Frage aufhört, “Kann es funktionieren?” und wird “Können wir das Geschäft damit betreiben?”

Ich habe ein Jahrzehnt in der Hospitality-Technologie verbracht und diese Transition bei Property-Management-Systemen, dann bei Revenue-Management-Software und schließlich bei Operations-Plattformen beobachtet. Das Muster ist immer das gleiche. Eine neue Fähigkeit beweist sich in Pilotprojekten, frühe Adoptierer drängen es in Richtung ihrer kritischen Workflows, und dann erreicht es die Betriebsebene, die Systeme, bei denen ein Versagen sofort Geld kostet, nicht in einer Post-Mortem-Analyse, und die Hälfte der Anbieter, die in Demos gut aussahen, verschwindet still und leise.

Voice-AI befindet sich jetzt an diesem Wendepunkt.

Anforderungen ändern sich, wenn die Einsätze real sind

Sprachassistenten haben ihre Glaubwürdigkeit auf die gleiche Weise wie jede andere Unternehmens-Technologie erlangt: indem sie sich in niedrigen Risiko-Situationen als nützlich erwiesen. Terminplanung, grundlegende FAQs, Call-Routing. Schmale Aufgaben, bei denen ein Fehler wenig kostet und die Latte für “ausreichend gut” niedrig ist. Diese Phase ist größtenteils hinter uns, und das Gespräch hat sich weiterentwickelt.

Heute setzen Unternehmen AI-Assistenten als ersten Kontakt für jede eingehende Kunden-Interaktion ein, eine Rolle, die früher einem menschlichen Empfangsmitarbeiter oder Call-Center-Agenten zugeordnet war. Wenn AI diese Position innehat, wird es Teil der Infrastruktur, auf der das Geschäft läuft.

Wenn AI im kritischen Pfad der Kundenakquise sitzt, ändern sich die Bewertungskriterien vollständig. Benchmarks und Demoleistungen werden irrelevant. Die Fragen, die zählen, sind: Was ist Ihre Uptime bei Produktions-Skalierung? Wie verhält sich das System, wenn ein Anrufer einen starken Akzent, Hintergrundgeräusche oder seine Anfrage während des Gesprächs ändert? Was passiert um 2 Uhr morgens an einem Feiertag, wenn Ihr Team nicht erreichbar ist und das System auf etwas trifft, das es noch nicht gesehen hat?

Diese sind keine Randfälle. In der Produktions-AI-Implementierung sind sie Dienstag.

Was Echtzeit-AI wirklich verlangt

Das Betreiben von AI-Assistenten in Echtzeit-Umgebungen, in denen es keine Marge für Verzögerungen gibt, keine Möglichkeit zum Wiederholen und keinen Menschen im Loop, legt Einschränkungen auf, die in Benchmark-Tests nicht auftauchen.

Response-Latenz ist die Schwelle zwischen Vertrauen und Abandon. Eine im Proceedings of the National Academy of Sciences veröffentlichte Studie fand heraus, dass Menschen natürlich den Gesprächs-Staffelstab innerhalb von etwa 200 Millisekunden übergeben und dass sogar kleine Abweichungen von diesem Rhythmus als Signal registriert werden, dass etwas nicht stimmt. In einem Voice-AI-Kontext haben diese Empfindlichkeiten reale Konsequenzen. Anrufer entscheiden sich nicht bewusst, sich abzuschalten, wenn eine Antwort zu lange dauert; sie tun es einfach. Die Pause fühlt sich an, als ob etwas schief gelaufen ist, und sie handeln entsprechend.

Konsistenz ist die zweite Einschränkung, und sie ist schwieriger. Ein AI-Assistent, der einem Kunden auf seinem ersten Anruf genaue Informationen gibt und auf seinem zweiten Anruf andere Informationen gibt, schafft nicht nur Verwirrung; er zerstört das Vertrauen in das System und, durch Extension, in das Geschäft. Die Erreichung von Antwort-Konsistenz im großen Maßstab erfordert Echtzeit-Integration mit Systemen von Rekord: Buchungsplattformen, Inventar, Service-Verfügbarkeit und standortspezifische Regeln. Ein AI, der nicht mit Live-Daten verbunden werden kann, arbeitet immer mit den Informationen von gestern, und in einem Kunden-Gespräch ist gestern nicht gut genug.

Die dritte Einschränkung ist die, die die Anbieter, die auf großem Maßstab operiert haben, von denen unterscheidet, die es nicht getan haben: die Erholung von Fehlern. Nicht das Verhindern jedes Fehlers, weil das nicht erreichbar ist, sondern die Systeme, Prozesse und institutionellen Kenntnisse, um herauszufinden, was kaputt ist, es zu reparieren und die Reparatur vor dem nächsten Schichtwechsel zu deployen. Diese Fähigkeit wird über Jahre aufgebaut, nicht über Monate, und sie erscheint nicht in einem Produkt-Demo.

Integriert vs. angebaut: Warum es alles ändert

Es gibt einen bedeutenden operativen Unterschied zwischen AI, die einen Workflow ergänzt, und AI, die der Workflow ist.

Add-on-AI kann unterperformen, ohne katastrophale Konsequenzen. Wenn ein Zusammenfassungstool den Kontext verpasst oder ein Terminplanungs-Assistent eine Korrektur benötigt, ist der Kosten-Friction. Aber ein AI-Assistent, der eingehende Anrufe bei einem medizinischen Büro, einem Hausdienstleistungs-Unternehmen oder einem Einzelhandels-Unternehmen mit mehreren Standorten bearbeitet, ist nicht ergänzend. Es ist der erste und oft der einzige Kontakt, den ein Kunde vor seinem Entscheid hat, ob er bleibt oder geht. Die Toleranz für Inkonsistenz ist ungefähr Null.

Wenn AI in den Kern des Geschäfts einzieht, muss die Verantwortung mitziehen. Ein Voice-Agent, der Kundenanrufe bearbeitet, ist kein IT-Asset. Es gehört zu dem, der für den Umsatz verantwortlich ist, und das ändert die Natur der Anbieter-Beziehung vollständig. Sie kaufen keine Software. Sie nehmen einen operativen Partner auf.

Die Integrationsanforderung wird auch zwingend und nicht mehr aspirational. Als ich Operations-Technologie im großen Maßstab aufbaute, waren die Systeme, die eine dauerhafte Übernahme verdienten, diejenigen, die sich verhielten, als ob sie bereits alles wüssten, was das Geschäft wusste. Voice-AI muss diese gleiche Latte erreichen. Wenn es nicht in Echtzeit mit Ihrem CRM synchronisieren kann, Ihre aktualisierten Preise vor dem nächsten Anruf lernen und auf einen Menschen eskalieren, wenn es sollte, ist es nicht bereit für die Betriebsebene.

Und die Leistungs-Latte bewegt sich von “im Allgemeinen genau” zu “zuverlässig konsistent.” Sicher, diese klingen ähnlich, aber sie sind nicht das Gleiche.

Diese Transition ist nicht einzigartig für Voice. McKinseys Kundenpflege-Forschung hat das gleiche Muster bei kundenorientierter AI dokumentiert: Die Technologie bewegt sich von Ergänzung zu Infrastruktur, und die organisatorischen Erwartungen müssen mitziehen. Gartners Forschung zu agenter AI-Projekten sagt voraus, dass bis 2028 33% der Unternehmens-Software-Anwendungen agente AI enthalten werden, gegenüber weniger als 1% im Jahr 2024. Das sagt viel über die Richtung der Operationen aus.

Wie man AI-Systeme für den Produktions-Einsatz bewertet

Der Fehler, den die meisten Organisationen machen, ist, AI-Systeme auf die gleiche Weise zu bewerten, wie sie Software bewerten, auf Feature-Vollständigkeit und Benchmark-Leistung. Das funktioniert, wenn das System ergänzend ist, aber versagt, wenn das System tragend ist.

Eine 2025 MIT-Studie, die 300 Unternehmens-AI-Implementierungen untersuchte, fand heraus, dass 95% der AI-Piloten nicht in der Lage sind, einen messbaren Einfluss auf die Bottom-Line zu liefern, und die Hauptursache ist nicht die Modell-Qualität. Es ist die schlechte Integration in bestehende Workflows. Diese Erkenntnis sollte die Art und Weise, wie jeder Leiter die Bewertung angeht, neu gestalten.

Für agente AI, die in Kern-Workflows operieren wird, ist ein anderes Prisma erforderlich. Beginnen Sie mit der Produktions-Historie, nicht mit Demos. Fragen Sie, wie die größten Produktions-Implementierungen des Anbieters aussehen, in welchem Umfang und fragen Sie nach direktem Kontakt mit diesen Kunden. Jeder Anbieter, der sich seiner Produktions-Leistung sicher ist, wird ohne Zögern ja sagen.

Bewerten Sie das operative Support-Modell sorgfältig. Die Unternehmens-AI-Implementierung ist kein Lizenz-Kauf. Es ist eine laufende operative Beziehung. Die Frage ist nicht nur, ob die AI am ersten Tag funktioniert. Es ist, wer sie am 90. Tag überwacht, wenn etwas Unerwartetes im großen Maßstab auftritt.

Messen Sie, was Ihr Geschäft wichtig findet, nicht Vanity-Metriken wie “AI-Adoption” oder “bearbeitete Interaktionen.” Messen Sie die Lead-Konversions-Rate bei AI-bearbeiteten Anrufen im Vergleich zu menschlich bearbeiteten Anrufen, Kundenzufriedenheits-Scores und Umsatz, der direkt auf AI-wiederhergestellte Interaktionen zurückzuführen ist. Diese Zahlen werden Ihnen sagen, ob das System seinen Platz verdient oder nur Aktivität generiert.

Schließlich planen Sie die organisatorische Veränderung. Gartners Forschung zu agenter AI-Projekten sagt voraus, dass über 40% der agenter AI-Projekte bis Ende 2027 abgesagt werden, mit steigenden Kosten und unklarem Geschäftswert als Hauptgründe. Ich glaube, dass die Organisationen, die am meisten von Voice-AI profitieren werden, diejenigen sind, die klare Verantwortung zuweisen, Erfolg in Geschäftsbegriffen von Tag eins an definieren und das System nach dem gleichen Standard wie jedes andere Team-Mitglied behandeln.

Voice-AI in die Produktion zu bringen, ist der einfache Teil. Es dort zu halten, es verantwortlich zu machen und es dazu zu bringen, seinen Platz im Geschäft zu verdienen, das ist, wo die meisten Organisationen noch Arbeit zu leisten haben.

Jason Luo, CEO, Newo

Jason Luo ist CEO von Newo, einer Voice-AI-Infrastrukturplattform. Er war zuvor CEO von ALICE und CRO von Actabl.

Unite.AI

Wie Voice-AI von einer Neuheit zur Kerninfrastruktur wird

Anforderungen ändern sich, wenn die Einsätze real sind

Was Echtzeit-AI wirklich verlangt

Integriert vs. angebaut: Warum es alles ändert

Wie man AI-Systeme für den Produktions-Einsatz bewertet

You may like