人工知能
Vijay Balasubramaniyan、Pindropの共同創設者&CEO – インタビューシリーズ

Vijay Balasubramaniyanは、Pindropの共同創設者&CEOです。彼は、Google、Siemens、IBM Research、Intelで様々なエンジニアリングおよび研究役割を担ってきました。
Pindropのソリューションは、アイデンティティ、セキュリティ、信頼性の標準を確立することで、ボイスインタラクションの未来を牽引しています。Pindropのソリューションは、特許技術を使用して、すべての電話およびボイスデータからインテリジェンスを抽出することで、世界最大の銀行、保険会社、小売業者を保護しています。Pindropのソリューションは、詐欺者を検知し、真正な顧客を認証することで、詐欺および運用コストを削減し、顧客体験を向上させ、ブランドの評判を保護します。Pindropは、アトランタ、GAに本社を置くプライベート会社で、2011年にDr. Vijay Balasubramaniyan、Dr. Paul Judge、Dr. Mustaque Ahamadによって設立され、Andreessen Horowitz、Citi Ventures、Felicis Ventures、CapitalG、GV、IVP、Vitruvian Partnersによってベンチャー資金提供されています。詳細については、pindrop.comを訪問してください。
Pindropの2024ボイスインテリジェンスおよびセキュリティレポートによると、ボイスベースの詐欺およびセキュリティの現在の状況に関する主要な収穫は何ですか?
レポートでは、特に金融および非金融機関をサポートするコンタクトセンターにおけるセキュリティの問題および将来のトレンドについて詳細に説明しています。レポートの主な発見には、以下のものがあります:
- コンタクトセンター詐欺の著しい増加: コンタクトセンター詐欺は、過去2年間で60%増加し、2019年以来の最高レベルに達しています。今年末までに、コンタクトセンターへの電話のうち1件に730件が詐欺であると予想されます。
- ディープフェイク攻撃の増加: ディープフェイク攻撃、特に高度な合成音声クローンは、増加しており、アメリカのコンタクトセンターに対する詐欺リスクは約50億ドルと推定されています。この技術は、自動化された高スケールのアカウントの偵察、ボイスの擬装、ターゲット化されたスミッシング、ソーシャルエンジニアリングなどの詐欺戦術を強化するために使用されています。
- 伝統的な詐欺検出および認証方法の限界: 企業はまだ、消費者の手動認証に依存していますが、これは時間がかかり、費用がかかり、詐欺を阻止するのに効果が低いです。3.5億人のデータ漏洩被害者、年間12億ドルの認証費用、10億ドルの詐欺損失は、現在のセキュリティ方法が機能していないことを示しています。
- 新しいアプローチと技術の必要性: ライブネス検出は、悪意のあるAIとセキュリティの強化に不可欠です。ボイス分析は重要ですが、ライブネス検出とマルチファクタ認証と組み合わせる必要があります。
レポートによると、67.5%のアメリカ人消費者は銀行部門におけるディープフェイクについて懸念しています。金融機関が直面しているディープフェイクの脅威の種類について説明できますか。
電話チャネルを介した銀行詐欺は、複数の要因により増加しています。金融機関は、顧客に不正な活動を確認することに大きく依存しているため、コールセンターは詐欺者にとって主要な標的になり得ます。詐欺者は、ソーシャルエンジニアリングの戦術を使用して、カスタマーサービス担当者を欺き、制限を解除したり、オンラインバンキングの資格情報をリセットしたりします。Pindropの銀行顧客の1社によると、特定された詐欺電話の36%は、主に詐欺対策によって課せられたホールドを解除することを目的としていました。別のPindropの銀行顧客は、詐欺電話の19%はオンラインバンキングへのアクセスを目的としていたと報告しています。生成可能なAIとディープフェイクの登場により、これらの種類の攻撃はより強力でスケーラブルになりました。現在、1〜2人の詐欺者がガレージで何百万もの合成音声を生成し、複数の金融機関に対して同時攻撃を仕掛けることができます。これにより、消費者は銀行部門がこれらの高度な攻撃に対して準備されているかどうかについて、リスクと懸念のレベルが高まりました。
生成可能なAIの進歩は、ディープフェイクの増加にどのように貢献しましたか。また、これらはセキュリティシステムにどのような特定の課題をもたらしますか。
ディープフェイクは新しいものではありませんが、生成可能なAIの進歩により、過去1年間で大規模なベクトルになりました。生成可能なAIの進歩により、大規模な言語モデルはより信頼性の高いスピーチと言語の生成が可能になりました。現在、自然に聞こえる合成スピーチ(偽のスピーチ)を安価に大量に生成できます。これらの進歩により、ディープフェイクは誰もが利用できるようになりました。特に詐欺者にとってです。これらのディープフェイクは、非常に信頼性の高いフィッシング攻撃、誤情報の拡散、ボイスの擬装による金融詐欺を可能にし、伝統的な認証方法を損ないます。また、評判上の重大なリスクをもたらします。さらに、進化とスケーラビリティの速さに追いつくために、先進的な検出技術が必要です。
Pindrop Pulseは、President Bidenロボコール攻撃で使用されたTTSエンジンを特定するのにどのように貢献しましたか。これは将来のディープフェイク検出にどのような影響を与えますか。
Pindrop Pulseは、President Bidenロボコール攻撃で使用されたTTSエンジンを特定する上で重要な役割を果たしました。私たちの先進的なディープフェイク検出技術を使用して、4段階の分析プロセスを実施しました。これには、オーディオフィルタリングとクレンジング、特徴抽出、セグメント分析、および継続的なスコアリングが含まれます。このプロセスにより、ノンスピーチフレーム(例:沈黙、ノイズ、音楽)をフィルタリングし、機械生成と一般的な人間のスピーチを区別する低レベルのスペクトル時空間特徴を抽出することができました。
オーディオを155のセグメントに分割し、生存スコアを割り当てて、オーディオが一貫して人工的であることを判断しました。”偽の指紋”を使用して、オーディオを122のTTSシステムと比較し、ElevenLabsまたは同様のシステムが使用された可能性が99%であることを判断しました。この発見は、ElevenLabs SpeechAI Classifierを使用して84%の可能性で検証されました。詳細な分析により、特にPresident Bidenの不常な表現や豊かな摩擦音を含むフレーズにおけるディープフェイクのアーティファクトが明らかになりました。
この事例は、スケーラブルで説明可能なディープフェイク検出システムの重要性を強調しており、精度を高め、信頼性を構築し、新しいテクノロジーに適応しています。また、生成可能なAIシステムが、実際の個人からの同意なしに悪用されるのを防ぐための安全対策を組み込む必要性を強調しています。私たちのアプローチは、合成メディアの脅威に対処するためのベンチマークを設定し、進化するディープフェイク方法に対処するために継続的な監視と研究の必要性を強調しています。
レポートでは、ディープフェイクがメディアおよび政治機関に影響を与えることについて重大な懸念が述べられています。具体的な事例とその潜在的な影響について説明できますか。
私たちの調査では、アメリカの消費者は、銀行および金融部門におけるディープフェイクおよびボイスクローンのリスクについて最も懸念しています。しかし、それ以外に、メディアおよび政治機関へのディープフェイクの脅威は、同等の重大な課題をもたらします。アメリカ以外では、インドネシア(スハルトのディープフェイク)やスロバキア(ミハル・シメチュカとモニカ・トドバのボイスディープフェイク)でもディープフェイクの使用が観察されています。
2024年は、アメリカとインドで重要な選挙年です。40カ国で4億人が投票する予定です。人工知能技術の普及により、インターネット上で人々を欺くことは以前より簡単になりました。政府機関、ソーシャルメディア会社、他のニュースメディア、および一般大衆に対するターゲット化されたディープフェイク攻撃の増加を予想します。これらの攻撃は、機関への不信感を生み出し、公共の議論に誤情報を拡散することを目的としています。
Pindropは、リアルタイムでディープフェイクおよび合成音声を検出するために、どのような技術と方法論を使用していますか。
Pindropは、ディープフェイクおよび合成音声をリアルタイムで検出するために、以下の先進的な技術と方法論を使用しています:
-
- ライブネス検出:Pindropは、大規模なマシンラーニングを使用してノンスピーチフレーム(例:沈黙、ノイズ、音楽)を分析し、機械生成と一般的な人間のスピーチを区別する低レベルのスペクトル時空間特徴を抽出します。
- オーディオフィンガープリント: これには、各ボイスの音響特性(ピッチ、トーン、カデンスなど)に基づいてデジタルシグネチャを生成し、これらのシグネチャを使用して、さまざまな電話およびインタラクション間のボイスを比較および一致させます。
- 行動分析: これは、通常とは外れた行動パターン(異常なアクセス、ボットアクティビティ、データマイニング、ロボットダイヤルなど)を分析するために使用されます。
- ボイス分析: ボイス特徴(声帯特性、音韻変異、話し方スタイルなど)を分析することで、各個人にボイスプリントを生成できます。予想されるボイスプリントからの任何偏差は、アラートをトリガーできます。
- マルチレイヤードセキュリティアプローチ: これには、検出結果を相互参照して精度を高め、検出を確認するためにさまざまな検出方法を組み合わせることが含まれます。たとえば、オーディオフィンガープリントの結果は、疑念を確認するためにバイオメトリック分析と比較検討される場合があります。
- 継続的な学習と適応: Pindropは、モデルとアルゴリズムを継続的に更新しています。これには、新しいデータの組み込み、検出技術の改良、および新しい脅威への対応が含まれます。継続的な学習により、検出能力が時間の経過とともに改善され、新しいタイプの合成音声攻撃に適応します。
Pulse Deepfake Warrantyとは何ですか。また、Pindropのディープフェイク脅威に対処能力への顧客の信頼をどのように高めますか。
Pulse Deepfake Warrantyは、コールセンターの合成音声詐欺に対する補償を提供する、画期的な保証です。サイバーアタックの風景が大幅に変化する今、2025年までに10.5兆ドルの潜在的な損失が予想される中、Pulse Deepfake Warrantyは、以下の利点を提供することで顧客の信頼を高めます:
- 信頼の強化: Pulse Deepfake Warrantyは、Pindropの製品と技術に対する自信を示し、顧客に信頼できるセキュリティソリューションを提供します。
- 損失の補償: Pindropの顧客は、Pindrop Product Suiteによって検出されなかった合成音声詐欺イベントに対する補償を受けることができます。
- 継続的な改善: Pindropの顧客からの要望は、Pindropが進化する合成音声詐欺戦術に対応するのに役立ちます。
Pindropの技術がディープフェイクの脅威を効果的に軽減した著名な事例はありますか。その結果は何でしたか。
パイクスビル高校の事例: 2024年1月16日、バルティモアのパイクスビル高校の校長が登場するというオーディオレコーディングが、Instagramに登場しました。このオーディオには、黒人学生と教師に対する軽蔑的な発言が含まれており、大きな公衆の反発と深刻な懸念を引き起こしました。
これらの出来事を受けて、Pindropは包括的な調査を実施し、3つの独立した分析を実施して真実を明らかにしました。私たちの徹底的な調査の結果、ニュアンスのある結論に達しました。1月のオーディオは変更されていたが、AIによって生成された合成音声の明確な特徴が欠けていることがわかりました。私たちの分析メトリクスに基づく97%の確信度で、この決定を裏付けることができました。この重要な発見は、操作されたメディアの性質についての公的声明を出す前に、詳細で客観的な分析を実施することの重要性を強調しています。
大手アメリカの銀行では、Pindropが詐欺者がIVRの認証を回避するために合成音声を使用していることを発見しました。詐欺者は、機械生成の音声を使用して、IVRの認証を回避し、セキュリティ質問に正しい答えを提供し、場合によってはオンラインバンキングの資格情報をリセットすることができました。ボットは、IVRで認証に成功し、ターゲットとなるアカウントを特定しました。次の電話では、これらのアカウントにアクセスするために人間が関与しました。Pindropは、Pulseテクノロジーを使用して銀行にこの詐欺をリアルタイムで通知し、詐欺者を阻止することができました。
別の金融機関では、Pindropが詐欺者が銀行の自動応答システムを模倣するために独自のボイスボットをトレーニングしていることを発見しました。最初の電話では、ボイスボットがIVRプロンプトを繰り返すだけでしたが、1週間後、ボットはIVRの声とマナーを正確に繰り返しました。詐欺者がボイスボットをトレーニングして、スミッシング攻撃の開始点として使用することを計画していたと考えられます。Pindrop Pulseの助けにより、金融機関は被害が及ぶ前にこの攻撃を阻止することができました。
NPRオーディオディープフェイク実験: デジタルセキュリティは、詐欺者とセキュリティ技術プロバイダーとの間で不断に進化するアームズレースです。Pindropを含む複数のプロバイダーは、オーディオディープフェイクを一貫して検出できるという主張をしています。NPRは、これらの主張を検証するために、テストを実施しました。
Pindrop Pulseは、84のオーディオサンプルのうち81件を正しく検出し、96.4%の精度率を達成しました。さらに、Pindrop Pulseは、すべてのディープフェイクサンプルを100%検出しました。テストでは他のプロバイダーも評価されましたが、Pindropは、ディープフェイクおよび真正なオーディオの両方を信頼性高く正確に検出できることを実証し、リーダーシップを発揮しました。
ボイスベースの詐欺およびセキュリティの将来のトレンドについて、特にAIテクノロジーの急速な開発の観点から、どのようなものを予測していますか。Pindropはこれらの脅威に対処するためにどのように準備していますか。
2024年には、コンタクトセンター詐欺が継続的に増加することを予想しています。業界横断的な詐欺率の年間分析に基づいて、詐欺率は1件あたり730件の電話となり、現在のレベル比で4〜5%増加することを保守的に推定しています。
増加する詐欺のほとんどは、保険、ブローカー、その他の金融セグメントは現在のレベルに留まることが予想されるが、銀行部門に影響することが予想されます。アメリカの金融機関に対するこれらの詐欺率は、7億ドルの詐欺被害を表し、これを保護する必要があります。ただし、特に詐欺者がIVRを詐欺のテストベッドとして使用するという点で、大きな変化が予想されます。最近、詐欺者が個人情報(PII)を手動入力してアカウントの詳細を確認することが増えています。
これに対処するために、Pindropの現在のソリューションを進化させると同時に、Pulseのような新しい革新的なツールを立ち上げ、顧客を保護することを継続します。
現在のテクノロジーを超えて、ボイス詐欺の防止および認証を強化するために、どのような新しいツールやテクノロジーが開発されていますか。
ボイス詐欺の防止および認証テクノロジーは、テクノロジーの進歩と詐欺活動の複雑化に追いつくために継続的に進化しています。新しく開発されているツールやテクノロジーには、以下のものがあります:
- 継続的な詐欺検出および調査: 新しい情報が利用可能になったときに、過去の詐欺事例を「遡及」して分析することができます。詐欺分析者は、新しい詐欺シグナルを「傾聴」し、関連する過去の電話をスキャンし、これらの電話を再スコアすることができます。これにより、会社はリアルタイムで詐欺に対する包括的な視点を持ちます。
- インテリジェントボイス分析: 伝統的なボイスバイオメトリックスシステムはディープフェイク攻撃に対して脆弱です。これらの防御を強化するために、ボイスミスマッチやネガティブボイスマッチングなどの新しいテクノロジーが必要です。これらのテクノロジーは、複数のボイスを認識および区別し、異なる音のボイスが脅威をもたらす可能性があることを提供することで、追加の防御層を提供します。
- 早期詐欺検出: 詐欺検出テクノロジーは、会話の初期段階に迅速かつ信頼性の高い詐欺シグナルを提供するものです。ライブネス検出に加えて、キャリアメタデータ分析、コーラーIDスプーフ検出、およびオーディオベースのスプーフ検出などのテクノロジーは、会話の初期段階での詐欺攻撃から保護するのに役立ちます。
素晴らしいインタビュー、詳細についてはPindropの2024ボイスインテリジェンスおよびセキュリティレポートを読むか、Pindropを訪問してください。












