الذكاء الاصطناعي
كيف اكتشفت أداة الصحة النفسية التي تعتمد على الذكاء الاصطناعي بشكل غير متعمد كشفًا دقيقًا للتعرف على عمليات التزوير العميق

عندما أطلقت شركة التكنولوجيا العملاقة Open AI نظام الفيديو والصوت التوليدي سورا 2 في سبتمبر 2025، غمرت مقاطع الفيديو المزيفة منصات وسائل التواصل الاجتماعي، وجعلت الجماهير على دراية متزايدة بمحتوى الواقع الافتراضي المحتمل الخطورة.
على الرغم من أن شركة Open AI اعتبرت إطلاق سورا 2 مسؤولًا في المرتبة الأولى، زعمت أنه سيعطي المستخدمين “الأدوات والخيارات للسيطرة على ما يرونه في تغذيتهم” والسيطرة على شبههم من النهاية إلى النهاية، إلا أن دراسة أكتوبر 2025 وجدت أن النموذج أنتج مقاطع فيديو كاذبة 80٪ من الوقت.
من مقاطع الفيديو التي تقلدت تقارير الأخبار حول مسؤول انتخابي في مولدوفا يدمر بطاقات الاقتراع إلى مشاهد مزيفة لطفل يتم اعتقاله من قبل ضباط الهجرة أو مندوب كوكا كولا يعلن أن الشركة لن ترعى بطولة السوبر بول، فإن الرهانات لإنتاج معلومات خاطئة في عالم مترابط لا يمكن أن تكون أعلى.
ما وراء سورا: الفيشينج
حتى قبل إطلاق أداة شركة Open AI، كانت إنشاء وتوزيع ملفات الفيشينج على الإنترنت في تزايد. وفقًا لتقرير سبتمبر 2025 الصادر عن شركة الأمن السيبراني DeepStrike، زادت محتوى الفيشينج من 500000 في عام 2023 إلى 8 ملايين في عام 2025، وكان معظمها يستخدم لأغراض الاحتيال.
لا تظهر هذه الاتجاهات أي علامات على التوقف؛ من المتوقع أن يصل الاحتيال باستخدام الفيشينج في الولايات المتحدة وحدها إلى 40 مليار دولار أمريكي في عام 2027.
لا تقتصر هذه الزيادة على الكمية. مع أدوات مثل سورا 2 و فيو 3 من جوجل، أصبحت محتوى الوجوه والصوت والperformances الكاملة التي تم إنشاؤها بواسطة الذكاء الاصطناعي أكثر واقعية من أي وقت مضى. كما أشار عالم الحاسوب ومتخصص الفيشينج سيوي لي، النماذج المعاصرة قادرة على إنتاج وجوه مستقرة دون تشويه أو تشوه، في حين أن تقليد الصوت قد عبر عتبة غير قابلة للتمييز.
الحقيقة هي أن الفيشينج يتفوق على الكشف. ما يباعه شركات التكنولوجيا كأدوات ممتعة لإنشاء كل شيء من روتين الجمباز الأولمبي إلى خلفيات الصوت المتطورة، تم الاستفادة منه أيضًا من قبل المجرمين لاستهداف الشركات والأفراد على حد سواء. فقط في النصف الأول من عام 2025، أدت حوادث الفيشينج إلى خسائر بقيمة 356 مليون دولار أمريكي للشركات، و 541 مليون دولار أمريكي للأفراد.
الكشف عن الفيشينج التقليدية – بما في ذلك تحديد العلامات المائية والوجوه المطليّة وفحوصات البيانات الوصفية – تفشل. كما أن تقليد الصوت الفيشينج يبقى الشكل الثاني الأكثر شيوعًا للاحتيال باستخدام الذكاء الاصطناعي والفيشينج الصوتي، وازدادت 442٪ في عام 2025، والآثار已经 تظهر.
“بضع ثوانٍ من الصوت تكفي الآن لإنشاء نسخة مقنعة – كاملة مع نبرة طبيعية وايقاع وتنقيط وتنفس وضجيج تنفس”، كتب لي.
علم الاستماع إلى البشر
كينتسوغي، شركة صحة تكنولوجية ناشئة تعمل على تطوير تقنية العلامات البيولوجية الصوتية لتحديد علامات الاكتئاب السريري والقلق. بدأ عملهم من فرضية بسيطة: يجب علينا الاستماع إلى البشر.
“لقد بدأت كينتسوغي بسبب مشكلة واجهتها شخصيًا. قمت بمكالمة مع مقدمي الخدمة لمدة خمسة أشهر تقريبًا لتحديد موعد初ائي للعلاج النفسي، ولم يرد أحد على مكالماتي أبدًا. استمررت في المحاولة – لكنني تذكرت التفكير بوضوح أنني لو كنت أبي أو أخي، لكانوا قد توقفوا قبل أن أفعل ذلك”، قال الرئيس التنفيذي غريس تشانغ في حديث مع Unite.AI.
تأسست الشركة في كاليفورنيا في عام 2019 كحل لمشكلة وصفها تشانغ بأنها “حاجز التriage”. اعتقدت أن تحديد شدة الحالة في وقت مبكر وبالطريقة السلبية يمكن أن يساعد في الحصول على الرعاية المناسبة في وقت أقرب. ومن خلال كينتسوغي فويس، تعرف العلامات البيولوجية الصوتية على الاكتئاب السريري والقلق.
توجد أبحاث كثيرة تثبت استخدام النجاح لتحليل الكلام والصوت الذي يعتمد على الذكاء الاصطناعي كعامل بيولوجي لاضطرابات الصحة النفسية. على سبيل المثال، في ورقة مايو 2025، وجد أن العلامات البيولوجية الصوتية يمكن أن تكتشف علامات مبكرة للاضطرابات النفسية والتنوع العصبي، وادعى أن دمج تحليل الأغاني في الإعدادات السريرية لتقييم انحدار إدراكي محتمل للمرضى.
تعد مقاييس الصوت دقيقة بنسبة 78٪ إلى 96٪ في تحديد الأشخاص الذين يعانون من الاكتئاب مقارنةً بالذين لا يعانون منه، وفقًا للجمعية الأمريكية للأطباء النفسيين. دراسة أخرى استخدمت اختبار الكلام لمدة دقيقة واحدة حيث سمى الفرد尽可能 nhiều كلمات في فئة معينة – ووجدت دقة 70٪ إلى 83٪ في الكشف عن وجود الاكتئاب والقلق.
为了 تقييم صحة المستخدمين النفسية، تطلب كينتسوغي مقطع صوتي قصير، وبعد ذلك تقوم تقنية العلامات البيولوجية الصوتية بتحليل النبرة والتنغيم والصوت والتنفس – علامات توجد في حالات مثل الاكتئاب والقلق واضطراب ثنائي القطب والخرف.
ما لم تدرك تشانغ في البداية هو أن التكنولوجيا قد فككت واحدة من التحديات الحالية الأكثر إلحاحًا في صناعة الأمن: تحديد ما يجعل الأصوات البشرية بشرية.
من الرعاية الصحية النفسية إلى الأمن السيبراني
في حين كانت تشانغ تحضر قمة في نيويورك في أواخر عام 2025، ذكرت لصديق في مجال الأمن السيبراني أن تجربة فريقها مع الأصوات الاصطناعية كانت مخيبة للآمال.
“كنا نستكشف البيانات الاصطناعية لتعزيز التدريب على نماذج الصحة النفسية، ولكن الأصوات المولدة كانت مختلفة جدًا عن الكلام البشري الحقيقي لدرجة أننا يمكن أن ن告诉 100٪ من الوقت تقريبًا”، قالت.
“توقف عني وقال لي، ‘غريس – هذه ليست مشكلة محلولة في الأمن’. ذلك كان اللحظة التي كل شيء فيها انسجم. منذ ذلك الحين، أكدت محادثات مع شركات الأمن والخدمات المالية والاتصالات على مدى سرعة تزايد هجمات الفيشينج الصوتية – وعلى مدى الحاجة الحقيقية لتمييز الأصوات البشرية من الأصوات الاصطناعية في المكالمات الحية”، أضافت الرئيس التنفيذي.
في أبريل من العام الماضي، حذر مكتب التحقيقات الفيدرالي من حملة رسائل نصية وصوتية خبيثة ادعت أنها رسائل من مسؤولين أمريكيين كبيرين واستهدفت موظفي الحكومة السابقين وأصحابهم.
كما استهدفت البنوك الوطنية الكبيرة في الولايات المتحدة بمعدل 5.5 محاولات احتيال بتمييز الصوت يوميًا، وأبلغ موظفو المستشفى في مركز جامعة فاندربيلت الطبي هجمات الفيشينج من المزيفين الذين يتصنعون أنهم أصدقاء أو رؤساء أو زملاء.
على الرغم من ذلك، لم تكن الفيشينج في البداية جزءًا من عمل كينتسوغي. بينما كان فريق الشركة يستخدم نماذج جاهزة مثل Cartesia و Sesame و ElevenLabs لتحقيق الأصوات الاصطناعية لموظفي مركز الاتصال والعمليات الخارجية، لم يكن احتيال الفيشينج تركيزهم في سوق مزدحم ويمكن الوصول إليه يضم نماذج مثل سورا.
然而، الإشارات البشرية التي تشير إلى صحة الصوت هي نفس العلامات البيولوجية التي تجعل شخصًا بشريًا في المقام الأول. بغض النظر عن اللغة أو الدلالات، تعمل كينتسوغي فويس مع معالجة الإشارات والاتساع الزمني للكلام، وتلتقط دقة زمنية خفية وتنوع نبري وعبء إدراكي و علامات فيزيولوجية تعكس كيفية إنتاج الكلام… وليس ما قيل.
“الأصوات الاصطناعية يمكن أن ت звучит متدفقًا، لكنها لا تحمل نفس الآثار البيولوجية وال认知”، قال تشانغ. نموذج الشركة هو دائمًا أداء عالي الدقة في الكشف، باستخدام أقل من 3 إلى 5 ثوانٍ من الصوت.
كينتسوغي قد تكون ثورية لأولئك الذين يصارعون مع الصحة النفسية، خاصة في المناطق حيث يستغرق الحصول على علاج مع المحترفين وقتًا وموارد. بنفس القدر، تكنولوجيا الشركة تطرح ثورة لاكتشاف الفيشينج والأمن السيبراني بشكل عام: الكشف عن الصحة بدلاً من الكشف عن الفيشينج.
المستقبل يكمن في التكنولوجيا المتمركزة حول الإنسان
لقد ركز الأمن السيبراني لفترة طويلة على الاستخدام الخبيث للتكنولوجيا أو الجناة أنفسهم.然而، اكتشاف كينتسوغي العرضي يراهن على الإنسانية نفسها.
“نحن نعمل على سطح مختلف تمامًا: صحة الإنسان نفسها. لا يمكن للنماذج اللغوية الكبيرة الكشف بشكل موثوق عن المحتوى الذي تم إنشاؤه بواسطة النماذج اللغوية الكبيرة، والأساليب القائمة على الآثار هشة. 捕获 مجموعات بيانات كبيرة وموسومة سريريًا التي ترميز التباين البشري الحقيقي مكلفة وبطيئة وخارج خبرة معظم شركات الأمن – مما يجعل هذا النهج صعبًا للتكرار”، أشار تشانغ.
يقترح نهج الشركة أيضًا تحولًا أوسع: الابتكار عبر المجالات. قد يقود رواد الطليعة في مجال الرعاية الصحية حملة الكشف عن الفيشينج المدعوم بالذكاء الاصطناعي، كما قد تدعم المبتكرون في تكنولوجيا الفضاء آليات الاستجابة للطوارئ الجديدة، أو قد يصمم لاعبو الألعاب هندسة وتنظيم مدن جديدة.
فيما يتعلق تشانغ، تخطط لتصبح معيارًا لتحديد البشر الحقيقيين والنيات الحقيقية في النهاية من خلال التفاعلات الصوتية.
“مثل HTTPS أصبحت طبقة موثوقة افتراضية للويب، نعتقد أن ‘إثبات الإنسان’ ستصبح طبقة أساسية لأنظمة القائم على الصوت. إشارة هي بداية تلك البنية التحتية”، قالت.
مع استمرار تسارع الذكاء الاصطناعي التوليدي، قد تأتي الحماية الأكثر فعالية من فهم ما يجعل البشر… ببساطة بشر.












