Vordenker

Sind Banken auf AI-Stimmbetrug vorbereitet?

Veröffentlicht am 1. Juli 2026

Von

Satish Barot, Co-Founder & CTO, Klearcom

AI-generierte Stimmen haben die Ökonomie des Betrugs verändert. Was früher einen geschickten Nachahmer, ein überzeugendes Drehbuch oder eine kompromittierte Telefonnummer erforderte, kann jetzt mit Tools, die alarmierend menschlich klingen, im großen Maßstab versucht werden.

Und was noch besorgniserregender ist, sie haben den Finanzsektor fest im Visier. Anfang 2024 nahm eine Finanzmitarbeiterin bei dem Ingenieurbüro Arup an einem scheinbar routinemäßigen Videocall mit dem CFO und mehreren Kollegen teil. Die Stimmen waren vertraut, die Gesichter erkennbar und die Anfrage erschien plausibel genug, um eine grundlegende Überprüfung zu bestehen. Am Ende des Calls hatte sie 25 Millionen Dollar in Überweisungen autorisiert. Die Personen, von denen sie glaubte, dass sie mit ihnen sprach, einschließlich des CFO des Unternehmens, wurden später als AI-generierte Deepfakes gemeldet.

Für Finanzinstitute ist das Risiko nicht nur auf interne Zahlungsgenehmigungen beschränkt. Der gleiche Vertrauensverlust kann sich auch bei der Kundenauthentifizierung, der Callcenter-Eskalation, den Betrugsprüfungen und den Kontoverlust-Journeys auswirken.

Betrüger haben die relative Anonymität von Telefonanrufen ausgenutzt, um seit Jahrzehnten Betrug zu begehen. Mit AI jedoch ist der Aufwand, der dafür erforderlich ist, nun trivial geworden, und die Ergebnisse sind weit überzeugender. Für Banken und Finanztechnologie-Unternehmen führt diese Konvergenz zu einer unerforschten Risikokarte.

Es gibt eine unangenehmere Realität unter dieser Oberfläche. Selbst wenn Angreifer nach Möglichkeiten suchen, um in die Systeme einzudringen, macht die AI-Infrastruktur, die Finanzinstitute einsetzen, um ihre Kundenunterstützung zu modernisieren, den Betrug leichter zu begehen, und zwar direkt im Blickfeld.

Der Anruf, der wie ein gehöriger Anruf klingt

Bevor es AI gab, war Stimmbetrug relativ leicht zu identifizieren. Robocalls klangen flach und folgten einem Skript, und Vishing-Versuche verließen sich auf menschliche Operatoren, die Anrufblätter befolgten. In den meisten Fällen war der Umfang durch die Qualität des Betrügers, der das soziale Engineering ausführte, begrenzt. Mit ausreichender Schulung und ein wenig gesundem Menschenverstand konnten Mitarbeiter normalerweise die Anzeichen erkennen.

AI hat das jedoch geändert, indem es fast die technische Barriere für Nachahmung zusammengebrochen hat. Mit ausreichender Aufforderung kann AI extrem menschlich klingen, einschließlich Betonung, Emotion und Fehlern, die man von einer realen Person erwarten würde. Es wird noch schlimmer, da AI-Tools, die Stimmen kopieren können, auf kommerziellen Plattformen und Open-Source-Repositorys leicht verfügbar sind.

McAfee Labs fand heraus, dass drei Sekunden Audio ausreichen, um ein AI-Tool zu produzieren, das eine Stimme mit 85% Genauigkeit klont. Zehn Sekunden Aufnahme können diese Zahl über 95% treiben. Das Quellenmaterial ist überall: Social-Media-Beiträge, Voicemail-Begrüßungen, Konferenzaufzeichnungen, Gewinnmitteilungen oder LinkedIn-Videos.

Echtzeit-Stimmenkonvertierungstools wurden 2024 weit verbreitet, was bedeutet, dass Angreifer heute kein vorgezeichnetes Clip mehr benötigen. Sie können einfach in ein Mikrofon sprechen, und die Ausgabe klingt wie die Person, die sie nachahmen wollen.

Der Arup-Fall ist lehrreich: Die Finanzmitarbeiterin hatte Zweifel, aber die Anwesenheit vertrauter Stimmen und Gesichter auf dem Call überlagerte sie, und sie entschied sich, ihren Augen und Ohren zu vertrauen. Im selben Jahr entdeckten Ermittler in Hongkong eine separate Operation, die die Stimme eines Finanzmanagers geklont hatte, um einen 18,5-Millionen-Dollar-Kryptowährungsbetrug durchzuführen.

Eine vertraute Stimme, so stellt sich heraus, ist eine vertrauenswürdige Stimme, und AI hat diese Annahme zu einer gefährlichen gemacht.

Authentifizierungsfehler werden zu Betrugsmöglichkeiten

Finanzinstitute reagieren bereits auf externe Bedrohungen. Die Ausgaben für Governance- und Compliance-Tools für AI werden von 2,2 Milliarden Dollar im Jahr 2025 auf 9,5 Milliarden Dollar bis 2035 prognostiziert, ein Zeichen dafür, wie ernst der Markt diese Angelegenheit nimmt.

Das größere Risiko entsteht jedoch nicht außerhalb ihrer Mauern. Banken und Finanztechnologie-Unternehmen bauen AI in ihre Kundenunterstützungs-Stack ein, erstellen AI-gestützte IVR-Systeme, Voice-Biometrie-Authentifizierung und agentische Call-Flows, die Transaktionen ohne menschliche Agenten abwickeln. Diese Bemühungen zielen darauf ab, die Kundenerfahrung zu verbessern und den menschlichen Arbeitsaufwand zu reduzieren, aber wenn diese Systeme fehlschlagen, hinterlassen sie eine Schwachstelle, die Bedrohungsakteure allzu leicht ausnutzen können.

Routing-Fehler, Kontext, der zwischen Eskalationen verloren geht, und Authentifizierungssysteme, die unvorhersehbar verhalten, sehen wie Kundenunterstützungsprobleme aus und werden als solche protokolliert.

Diese CX-Probleme können jedoch zu etwas Schlimmerem mutieren. Ein Kunde, der durch Voice-Biometrie gesperrt wird, wird dies selten melden. Stattdessen ist es wahrscheinlich, dass er zurückruft, einen Weg findet, mit einem menschlichen Agenten zu sprechen, und ihn unter Druck setzt, die Protokolle zu umgehen, die diese Systeme errichten sollten.

Das größere Problem ist, dass ein Angreifer, der einen Kunden nachahmt, dies auch tun kann. Finanzinstitute sind sich dessen sehr bewusst. Tatsächlich überdenken 91% der US-Banken ihre Voice-Biometrie-Authentifizierungsstrategien im Lichte der AI-Klonrisiken.

Eine Überdenkung wird diese Probleme jedoch nicht lösen. Eine Institution, deren Voice-Authentifizierung regelmäßig legitime Kunden ablehnt, hat bereits die Bedingungen geschaffen, die ein entschlossener Hacker ausnutzen kann. Schließlich benötigt ein Hacker keine technische Schwachstelle, wenn die Reibung in der Kundenreise ihm einen Weg bietet.

Unternehmen müssen ihre Perspektive ändern, nicht ihren Sicherheitsstack

Tools, die AI-generierte synthetische Stimmen erkennen können, verbessern sich, aber ein Bedrohungsakteur, der die Systeme einer Bank nach Schwachstellen abtastet, sucht nicht nach einem einzigen Fehlerpunkt. Er sucht nach Bereichen, in denen Systeme stolpern und einander verfehlen, in denen Authentifizierungssysteme Signale nicht klar übermitteln. Eine bessere Erkennung am Perimeter kann diese Lücke nicht schließen.

Was helfen kann, ist die Überlegung, wie Führungskräfte die Voice-Infrastruktur behandeln. Wie bei jedem Teil des Software-Stacks erfordert die Voice-Infrastruktur die gleiche Ebene der Überprüfung wie die Perimetersicherheit.

In der Praxis erfordert eine solche Sicherheitsstrategie sowohl funktionale als auch Widerstandstests über die Bedingungen, denen IVR-, Biometrie-Authentifizierungs- und andere Voice-Systeme in der Produktion ausgesetzt sind: schlechte Audioqualität, verschiedene Akzente und Hintergrundgeräusche, Randfälle von Eskalationen und Authentifizierungsgrenzen, bei denen legitime Anrufer gerade außerhalb der Systemakzeptanzschwellen liegen.

Die Antwort ist nicht ein einmaliger Zertifizierungsprozess. Banken benötigen eine kontinuierliche Validierung der gesamten Voice-Reise, von IVR-Routing und Biometrie-Authentifizierung bis hin zu Eskalation, Übertragung und Rückfallpfaden. Egal, wie häufig Voice-Systeme aktualisiert werden, werden Betrugstaktiken sich natürlich entwickeln, um Schwachstellen in den Verteidigungen zu finden, die sie begegnen. Ein System, das bei der Bereitstellung validiert wird, muss häufig und wiederholt in realen Bedingungen getestet werden, um sicherzustellen, dass es auch dann noch sicher ist, wenn seine Leistung evolviert.

Es ist erwähnenswert, dass kontinuierliches Testen im großen Maßstab mit Budgetüberlegungen einhergeht. Es gibt auch die inhärente Spannung zwischen der schnellen Umsetzung neuer Fähigkeiten (um wettbewerbsfähig zu bleiben) und der gründlichen Validierung von Systemen, bevor sie mit realen Kunden interagieren und reale Betrugversuche unterliegen.

Während es schwierig ist, diese Spannung sauber aufzulösen, macht es deutlich, was die Kosten des Verzichts auf Validierung sind: Ein Versagen im System, das frustrierte Kunden bereits gefunden haben, ist ein schwacher Punkt, unabhängig davon, wie das Unternehmen es kategorisiert.

Bessere Kundenreisen werden zur Betrugsverteidigung

Die externen und internen Risiken, die oben beschrieben werden, sind keine getrennten Probleme mit unterschiedlichen Lösungen. Die Reibung, die durch unzuverlässige Kundenreisen erzeugt wird, schafft Verhaltenslücken, die soziales Engineering ausnutzen soll. Das ist ein lösbares Problem, aber nur, wenn Institutionen erkennen, dass die Auswirkungen einer schlechten Kundenerfahrung über die bloße Bindung oder den Umsatz hinausgehen können. Banken werden den AI-Stimmbetrug nicht lösen, indem sie ihn als einziges Erkennungsproblem behandeln. Sie müssen auch die Mehrdeutigkeit, Reibung und Fehlerpunkte in ihren eigenen Voice-Reisen beseitigen. In einer Ära, in der eine vertraute Stimme nicht länger per se vertrauenswürdig ist, wird die Zuverlässigkeit der Reise selbst Teil des Sicherheitsmodells.

Satish Barot, Co-Founder & CTO, Klearcom

Satish Barot ist der Co-Founder und Chief Technology Officer bei Klearcom. Mit seiner tiefen Expertise in Telekommunikations- und Cloud-Technologien leitet er die Produktinnovation und die technische Strategie des Unternehmens. Satish hat maßgeblich dazu beigetragen, Klearcoms künstlicher Intelligenz-getriebene Plattform aufzubauen, die globalen Unternehmen hilft, eine fehlerfreie IVR- und Kontaktcenterleistung zu gewährleisten.

Unite.AI

Sind Banken auf AI-Stimmbetrug vorbereitet?

Der Anruf, der wie ein gehöriger Anruf klingt

Authentifizierungsfehler werden zu Betrugsmöglichkeiten

Unternehmen müssen ihre Perspektive ändern, nicht ihren Sicherheitsstack

Bessere Kundenreisen werden zur Betrugsverteidigung

Mehr entdecken