زاوية Anderson
مزايا الحصول على الوزن الزائد من خلال الذكاء الاصطناعي

يمكن نظام الذكاء الاصطناعي الجديد تحويل أجسام الأشخاص في الصور بشكل واقعي ، مما يجعلها أكثر بدانة أو نحافة أو عضلات ، دون تغيير الوجه أو الملابس أو الخلفية. يتم تدريب النظام على مجموعة بيانات اصطناعية完全 ، تظهر كل الهوية عبر أنواع الجسم المتعددة.
بجانب استخدام الذكاء الاصطناعي بشكل متزايد كوسيلة لتحسين شكل الجسم على شبكات التواصل الاجتماعي ، أو (بوتيرة محتملة) لتعديل أنواع الجسم لأغراض التأثيرات البصرية ، يمكن أن يكون استخدام التعلم الآلي لتعديل مظهر الأفراد وظيفة أكثر أهمية: مساعدة الأفراد الذين يعانون من اضطرابات الأكل على فهم تفسيرهم غير المتناسب لمظهرهم ، بالإضافة إلى تقديم أداة мотивية محتملة لأغراض الرياضة واللياقة البدنية بشكل عام:

من ورقة ‘تقدير حجم الجسم في النساء المصابات bằngوريا العصبية والمقارنات الصحية باستخدام التماثل ثلاثي الأبعاد’ ، واجهة مستخدم لvisualize التغييرات في شكل الجسم. قد يجد الأفراد الذين يعانون من خلل الجسم صعوبة في ربط تفسير واقعي لجسدهم مع صورة مماثلة ، مما يوفر للمراجعين مقياسًا للاستجابات غير المتناسقة ، من بين أهداف أخرى. مصدر: https://www.nature.com/articles/s41598-017-15339-z.pdf
بالإضافة إلى ذلك ، فإن فرع المحاولة المكثفة لتحويل الموضة في أبحاث الرؤية الحاسوبية له مصلحة في تقديم تصورات دقيقة عبر مجموعة من أشكال الجسم:

بعض التحويلات الممكنة باستخدام تقنية DiffBody السابقة. مصدر: https://arxiv.org/pdf/2401.02804
منذ أن تم تحسين نماذج الأساس الذكاء الاصطناعي نحو الأشكال الجسمية التقليدية أو الجميلة ، فإن الأحجام غير العادية مثل ‘السمنة’ إما أن تكون متوفرة بشكل ضئيل في النماذج القياسية ، أو أن تأتي مع بعض التحيزات القاسية القاسية.
الضروريات المتزوجة
تعتبر واحدة من أكبر التحديات في إنشاء أنظمة الذكاء الاصطناعي التي يمكنها إضافة أو إزالة الدهون والعضلات من صور الأفراد بشكل واقعي – دون تغيير هويتهم أو بيئتهم أو ملابسهم – هي أن هذا يتضمن التدريب المزدوج ، حيث يتعلم نظام الذكاء الاصطناعي بشكل فعال الصور “قبل” و “بعد” التي تعرف أي تحويل يُقصد تنفيذه.
البيانات والطريقة
تتكون قاعدة البيانات التي أنشأها الباحثون من 7,615 صورة عالية الدقة (960x1280px) لكل نوع جسم مستهدف (سمين ، نحيف ، و عضلي).
تنفيذ التدريب
تم تدريب Odo على قاعدة بيانات المشروع ، المدمجة مع جزء من قاعدة بيانات DeepFashion-MultiModal ، مما أدى إلى إجمالي 20,000 زوج من الصور.
مقياس جديد
نظراً لعدم وجود قواعد بيانات من النوع المطلوب لهذا النوع من المشاريع ، لم تكن هناك أي معايير موجودة تتعامل مع التحدي. لذلك قام المؤلفون بتصميم مقياس جديد ، يتكون من 3,600 زوج من الصور ، ويتميز بصور وجه حقيقية ووصف خلفية ، بالإضافة إلى تنوع في أشكال الجسم.
الاستنتاج
مع ظهور Flux Kontext هذا العام ، وحتى أكثر 최근ًا ، إصدار الأوزان غير المكممة لـ Qwen Image Edit ، عاد البيانات المزدوجة إلى الواجهة في مجتمعات الهواة والمحترفين. في مناخ متزايد من الانتقاد والاستياء من عدم دقة الذكاء الاصطناعي ، تم تصميم نماذج من هذا القبيل لتحقيق إمكانية أعلى من الإ忠افة للصور المصدر (على الرغم من أن النماذج الصغيرة قد تكون مقيدة بأهدافها التدريبية المحددة).
في هذه الحالة ، يبدو أن فائدة نظام تشكيل الجسم تكمن في المجالات النفسية والطبية والازياء. ومع ذلك ، يبقى من الممكن أن تحقق أنظمة من هذا القبيل مستوى أعلى من البروز ، وربما استخدامات أكثر عفوية وربما حتى مثيرة للقلق.
نشر لأول مرة يوم الإثنين ، 25 أغسطس 2025












