ืืืืืช ืกืืืืจ
ืชืจืืืช ืงืื ืืืืืฃ ืืขืืืช 35 ืืืืืื ืืืืจ ืืื ืง ื-2020

חקירה שנערכה בנוגע להונאת 35 מיליון דולר מבנק באיחוד האמירויות הערביות בינואר 2020, גילתה כי טכנולוגיית קול מזויף (Deepfaked) שימשה כדי לחקות את קולו של מנהל חברה, הידוע למנהל סניף הבנק, שאישר את העסקאות.
הפשע התרחש ב-15 בינואר שנה שעברה, ומתואר בבקשה (PDF) של איחוד האמירויות הערביות לרשויות האמריקניות לסיוע במעקב אחר חלק מהכספים שנשאבו, שנשלחו לארצות הברית.
הבקשה מציינת כי מנהל סניף הבנק באיחוד האמירויות הערביות קיבל שיחת טלפון מקול מוכר, שבשילוב עם דוא”ל מעורך דין בשם מרטין זלנר, שכנע את המנהל להעביר את הכספים, שנועדו לרכישת חברה.
הבקשה מציינת:
‘על פי הרשויות באיחוד האמירויות, ב-15 בינואר 2020, מנהל סניף החברה קיבל שיחת טלפון שטען כי הוא ממטה החברה. הקול נשמע כמו קולו של מנהל החברה, ולכן מנהל הסניף האמין כי השיחה היא לגיטימית.
‘מנהל הסניף קיבל גם מספר דוא”לים שחשב כי הם ממנהל החברה, הקשורים לשיחת הטלפון. הקול בטלפון אמר למנהל הסניף, הן בטלפון והן בדוא”ל, כי החברה עומדת לרכוש חברה אחרת, וכי עורך הדין מרטין זלנר (Zelner) הוסמך לתאם את הליכי הרכישה.’
מנהל הסניף קיבל את הדוא”לים מזלנר, יחד עם מכתב הרשאה ממנהל החברה (המזויף), שקולו היה מוכר לקורבן.
זיהוי תרמית קול מזויף
חוקרים מאיחוד האמירויות הערביות קבעו כי טכנולוגיית קול מזויף (Deepfake) שימשה כדי לחקות את קולו של מנהל החברה:
‘החקירה האמירатית גילתה כי הנאשמים השתמשו ב”קול עמוק” (Deep Voice) כדי לחקות את קולו של מנהל החברה. בינואר 2020, כספים הועברו מהחברה הקורבן למספר חשבונות בנק במדינות אחרות, במערכת מורכבת הכוללת לפחות 17 נאשמים ידועים ולא ידועים. הרשויות האמירטיות עקבו אחר תנועת הכספים דרך מספר חשבונות וזיהו שני עסקאות לארצות הברית.’
‘ב-22 בינואר 2020, שתי העברות של 199,987.75 דולר ו-215,985.75 דולר הועברו משניים מהנאשמים לחשבונות בנק Centennial, מספרים xxxxx7682 ו-xxxxx7885, בהתאמה, הממוקמים בארצות הברית.’
אין פרטים נוספים על הפשע, שהוא רק המקרה השני הידוע של תרמית פיננסית מבוססת קול מזויף. הראשון התרחש תשעה חודשים קודם לכן, במרץ 2020, כאשר מנהל בחברת אנרגיה בריטית הוטרד בטלפון על ידי מי שנשמע כמו המנכ”ל, שדרש העברה דחופה של 220,000 אירו (243,000 דולר), שאותה ביצע.
פיתוח קול מזויף
טכנולוגיית קול מזויף (Deepfake) כוללת אימון מודל למידת מכונה על מאות או אלפי דוגמאות של הקול “יעד” (הקול שיושתכלל). התאמה הכי מדויקת ניתן להשיג על ידי אימון הקול היעד ישירות נגד הקול של האדם שידבר בתרחיש המוצע, אם כי המודל יהיה “מעודן” לאדם שיגלם את היעד.
הקהילה המקוונת הפעילה ביותר למפתחי קול מזויף היא שרת Audio Fakes Discord, הכוללת פורומים רבים לאלגוריתמים שונים של קול מזויף, כגון Tacotron-2 של Google, Talknet, ForwardTacotron, Coqui-ai-TTS ו-Glow-TTS, בין היתר.
Deepfakes בזמן אמת
מאחר ששיחת טלפון היא בהכרח אינטראקטיבית, תרמית קול מזויף לא יכולה להיעשות באמצעות קטעי קול מוכנים מראש, ובשני המקרים של תרמית קול מזויף, ניתן להניח בהגיון כי הדובר משתמש במסגרת Deepfake בזמן אמת.
Deepfakes בזמן אמת זכו לתשומת לב לאחרונה בשל המצאת DeepFaceLive, יישום בזמן אמת של חבילת Deepfake פופולרית DeepFaceLab, היכולה להעלות זהויות של ידוענים או זהויות אחרות על צילום וebcam בזמן אמת. אם כי משתמשים ב- Audio Fakes Discord ו-DeepFaceLab Discord מעוניינים מאוד בשילוב שתי הטכנולוגיות לארכיטקטורת Deepfake חיה וידאו+קול, עד כה לא הופיע מוצר כזה בציבור.










