زاوية Anderson
طرق غسيل البريد الإلكتروني في الذكاء الاصطناعي

إذا كان هناك حساب قانوني قادم بشأن استخدام الملكية الفكرية في تدريب الذكاء الاصطناعي، فهناك أيضًا عدة طرق لتحويل هذا الاستخدام.
الرأي الثورة الحالية في الذكاء الاصطناعي التوليدي تتطور في بيئة قانونية أكثر خطورة مما رافق أي تطور تكنولوجي تحولي منذ القرن التاسع عشر.
حتى قبل 3-4 سنوات، كانت مجتمع أبحاث التعلم الآلي يتمتع بترخيص ضمني (في كثير من الأحيان صريح) لاستغلال المواد المحمية بحقوق الطبع والنشر في تطوير أنظمة جديدة؛ منذ أن لم تكن هذه الأنظمة ناجحة بعد، من حيث النضج أو القابلية للتسويق، كانت النتائج في كل معنى، أكاديمية.
في ذلك الفترة، أشار نجاح فجوي لجيل جديد من نماذج اللغة الكبيرة القائمة على الانتشار (LLMs، مثل ChatGPT و Claude) و نماذج اللغة والرؤية (VLMs، مثل Sora) إلى أن هذه الخيوط المجردة وسابقة العدوانية من البحث قد طورت إلى مجال تجاري قابل للتسويق، وخرجت من “المرور المجاني”، فيما يتعلق باستغلال ملكية الآخرين الفكرية.
من الآن فصاعدًا، سيتطلع أصحاب الحقوق إلى الحصول على حصة في ثمار أنظمة الذكاء الاصطناعي التي تم تدريبها بشكل كبير أو جزئي على بياناتهم المحمية بحقوق الطبع والنشر أو غيرها، مما يؤدي إلى سيل متواصل من القضايا القانونية التي تتطلب جهدًا للبقاء على اطلاع.

Here limited only to cases brought in the US, new cases emerge at a frenetic pace in the United States and beyond. Source
إلزام “الغداء المجاني”
الالتزام المالي الذي يحدث حاليًا فيما يتعلق ببنية تحتية لخدمات الذكاء الاصطناعي قد تم وضعه من قبل بعض الأصوات كجهد لتعزيز “الذكاء الاصطناعي المعرض للخطر بحقوق الطبع والنشر” بشكل 深 في اقتصاد المجتمع بحيث يصبح ليس فقط “كبيرًا جدًا ليهزم”، ولكن أيضًا “قويًا جدًا لمقاضاته” – أو قويًا جدًا، على الأقل، بحيث لا يمكن السماح للقضايا الناجحة بأن تعرقل الثورة.
نحو هذا المزاج العام، يلتزم الرئيس الحالي للولايات المتحدة بسياساته رأيه بأن لا يمكن توقع أن يكون لديك برنامج ذكاء اصطناعي ناجح عندما كل مقال أو كتاب أو أي شيء آخر تقرأه أو دراسته، يجب عليك دفع ثمنه.
هل حقًا؟ لم يحدث شيء مشابه أو قابل للمقارنة في العصر الصناعي الغربي، وهذا يمثل حركة تتعارض بشدة مع الثقافة التقليدية الأمريكية للتقاضي والتعويض؛ ربما يكون المواقف الأكثر تشابهًا هي انتهاء صلاحية براءات الاختراع الطبية بعد 20 عامًا (التي herself مهاجمة بشكل متكرر)، و الlimitation على التوقعات من الخصوصية في الأماكن العامة.
ومع ذلك، تتغير الأوقات؛ في غياب أي ضمان بأن الاتجاه الحالي نحو “المنفعة العامة” ضد حماية الملكية الفكرية لن يتراجع، أو يُ đảo فيما بعد، هناك العديد من المناهج الثانوية التي أصبحت معايير قياسية في تطوير أنظمة الذكاء الاصطناعي، وعلاج البيانات المتنازع عليها التي تدفعها.
مجموعات البيانات بالوكالة
تتخذ واحدة من هذه المناهج نهجًا مشابهًا جدًا للدفاع الذي تقدمه مواقع قوائم التورنت بأنها لا تستضيف أي مواد متنازع عليها – أو أي مواد على الإطلاق.
除了 إلغاء الحاجة إلى تخزين وتقديم كميات كبيرة من بيانات الصور أو الفيديو التي لا يمكن ضغطها، تتيح مجموعات هذا النوع إمكانية التحديث السريع – مثل إزالة المواد عند طلب أصحاب الحقوق – وتحديث الإصدارات.
مثل التورنت، التي هي فقط إشارات إلى حيث يمكن العثور على المواد المحمية بحقوق الطبع والنشر، هناك العديد من مجموعات البيانات المؤثرة التي هي في حد ذاتها فقط قوائم “مؤشر” لبيانات موجودة؛ إذا أراد المستخدم استخدام هذه القوائم كقائمة تحميل لبياناتهم الخاصة، فهذا على مسؤوليتهم، فيما يتعلق بالمسؤولية القانونية للمحافظين.
من بين هذه المجموعات، مجموعة Conceptual 12M من Google Research، التي توفر تعليقات للصور، ولكنها تشير فقط إلى مواقع على الويب حيث توجد هذه الصور (أو كانت موجودة في وقت التحضير):

Two examples from Google Research’s Conceptual 12M curation. Source
مثال آخر بارز، والذي يعتبر الآن له مطالب شرعية في تاريخ الذكاء الاصطناعي، هو مجموعة بيانات LAION التي ساهمت في ظهور نظام التوليد المستقر في عام 2022 – أول إطار من هذا القبيل يقدم صورًا توليدية مفتوحة المصدر إلى المستخدمين النهائيين، كما بدا أن الأنظمة المملوكة تؤسس هذه الخدمات كمنطقة تجارية خاضعة للرقابة:

One of the many variants of the LAION project, featuring modern and copyrighted artworks. Source
في العديد من الحالات، يشير حجم الملفات الكبير لبعض هذه المجموعات “الوكالة” إلى وجود محتوى صورة في ملف قابل للتنزيل والمضيف؛ ومع ذلك، فإن أحجام التنزيل غير المهمة غالبًا ما تكون بسبب حجم كبير من المحتوى النصي، وأحيانًا ما يتم تضمين التضمين المستخرج أو الميزات – ملخصات أو عقدة من المحتوى المعمول به المستخدمة أثناء عملية التدريب.
الفيديو المتميز
تقدم مجموعات الفيديو حالة أقوى لنهج “مجموعة البيانات بالوكالة” أو الإشارة، منذ أن يكون حجم تخزين البيانات المطلوب لتجميع عدد كبير ومفيد من الفيديوهات في مجموعة قابلة للتنزيل كبيرًا، وطريقة “موزعة” مرغوبة.
ومع ذلك، في كلتا الحالتين – ولكن بشكل خاص مع الفيديو – تمثل روابط التنزيل الموجودة في المصدر بيانات ستحتاج إلى انتباه كبير قبل استخدامها في عمليات التدريب. سيتعين على الصور والفيديوهات أن يتم تحجيمها، أو اتخاذ قرارات القص، من أجل إنشاء عينات ستتسع إلى مساحة متاحة للوحدة المركزية للرسومات. حتى الفيديوهات المضغوطة بشدة ستحتاج أيضًا إلى قصها إلى أطوال قصيرة جدًا، مثل 3-5 ثواني، عادة.
تتضمن مجموعات الفيديو البارزة التي تستخدم مراجع إلى مقاطع فيديو على الإنترنت (بدلاً من تحضير وتنظيم الفيديو بشكل مباشر) مجموعة بيانات الفيديو Kinetics Human Action من Google، ومجموعة YouTube-8M من شركة جوجل، التي تستخدم التنقيح الجزئي لتحديد كيفية التعامل مع كل فيديو عند التنزيل – ولكنها تترك للمستخدم الحصول على الفيديوهات من عناوين URL الموردة.
مغلق و مفتوح
أخيرًا، في هذه الفئة، قد يتم توليد بيانات الفكس المفتوحة باستخدام منصات مغلقة التي تنشر فيما بعد وتجعل مجموعة البيانات متاحة.
من الأمثلة على ذلك مجموعة بيانات Omni-VFX، التي تتضمن العديد من نقاط البيانات من مجموعة بيانات Open-VFX (التي تشير في حد ذاتها إلى العديد من المنصات المغلقة وشبه المغلقة، مثل Pika و PixVerse).
لدى Omni-VFX ليس حتى محاولة جيدة:

In the open source Omni-VFX dataset, a familiar face. Source
مسؤولية الأجداد
النهج الرئيسي الثاني لتنظيف الملكية الفكرية هو من خلال استخدام المواد المحمية بحقوق الطبع والنشر على بعد واحد أو أكثر.
واحدة من الطرق في هذه الفئة هي استخدام بيانات اصطناعية تم تدريبها، في مرحلة ما في مجرى النهر، على بيانات محمية بحقوق الطبع والنشر. في مثل هذه الحالات، و特别 حيث يمكن لبيانات اصطناعية الحصول على نتائج تبدو حقيقية، توفر الأعمال المحمية بحقوق الطبع والنشر تحويلات لا يمكن توقعها أو تقديرها بشكل معقول بواسطة نماذج العالم العامة أو النماذج غير المتخصصة.
هذا هو الحال بالتأكيد حيث يتطلب نظام التوليد التوليدي إنتاج “أحداث مستحيلة” وأحداث تنتمي بشكل عام إلى فئة “التأثيرات البصرية” (VFX).
في الواقع، ما جعل هذا الموضوع يأتي إلى الذهن هو أحدث الأوراق البحثية التي تقدم القدرة على “تجريد” أنواع مختلفة من التأثيرات البصرية، مثل إنتاج أشعة الليزر من أجزاء غير محتملة من الجسم، إما عن طريق التدريب على مقاطع فيديو VFX المطلوبة بشكل مخصص أو “مفتوح المصدر” (بدلاً من المصدر الأكثر وضوحًا، مثل اللقطات المكلفة من سلسلة أفلام Marvel السينمائية):
أمثلة من موقع EffectMaker، حيث يتم تطبيق “الحركة” في الشريط المصدر (اليسار البعيد) على صورة مصدر (المركز). Source
تأتي الأمثلة السابقة من صفحة المشروع لمشروع EffectMaker. EffectMaker ليس حتى أول عرض هذا العام ي寻ى إلى استخراج ديناميات VFX من شريط فيديو واحد وتركيبها في شريط جديد، و事实ًا هذا يتحول إلى مهمة فرعية في أبحاث VFX للذكاء الاصطناعي*.
على دراية بأن كيانات الإعلام الكبيرة مثل Marvel لديها فرصة أعلى من المعدل الطبيعي للفوز في القضايا القانونية المتعلقة بحقوق الطبع والنشر (حتى في المناخ المذكور من “التسامح القسري)، فإن شركات التأثيرات البصرية والشركات الناشئة تتخذ حاليًا خطوات كبيرة لضمان أن إطارات التأثيرات البصرية التوليدية الخاصة بهم خالية من ملكية الشركات الأخرى الفكرية.
أول هذه الخطوات هي Meta، التي تم الإبلاغ عنها على subreddit r/vfx أنها ذهبت في جولة توظيف مدفوعة الأجر جيدًا في الشتاء إلى عام 2026، وتقدم فنانين VFX عملًا لتدريب نماذج الذكاء الاصطناعي على إنتاج لقطات تأثيرات بصرية من مستوى هوليوود. على الرغم من أن الأجر لم يُذكر عبر المنشورات المختلفة، وصف أحدها إنه “مONEY للتقاعد”.
اتبع المال
ومع ذلك، يجب أن نتساءل كم المال الذي يستطيع حتى شركة مثل Meta دفعه مقابل تنوع حقيقي ووفرة من لقطات VFX المخصصة، بالنظر إلى أن متوسط سعر لقطة VFX واحدة لفيلم سينمائي هو حوالي 42,000 دولار أمريكي – ويتجاوز العديد منها هذا الرقم بكثير.
علاوة على ذلك، من المعقول أن نعتقد أن نماذج VFX التوليدية المخصصة ستستجيب لطلبات شائعة، بما في ذلك各种 تأثيرات شائعة من فئات الأفلام الأكثر شعبية والأكثر تكلفة.
بصرف النظر عن حقيقة أن محترفي VFX “المتبقية” قد ي结束ون بإعادة إنشاء لقطات عملوا عليها في فهرس أفلام موجود، والتي في حد ذاتها توفر سياقًا للعمل على مجموعة البيانات المخصصة على أنها محاكاة – هناك في أي حال لا يوجد ضمان بأن هذه العينات الجديدة باهظة الثمن ستتدرب “من الصفر” في هيكل جديد.
في الواقع، إذا تم تحويل هذه التكرارات إلى وحدات فرعية مثل LoRAs، التي تعتمد على نموذج قاعدي، فإن العملية ليست أكثر من الدفاع كما هو نموذج قاعدي “نظيف من الناحية القانونية” – ولا يوجد العديد منها.
كما أنه إذا استخدمت العملية “الhibryd” تقنيات مثل التحسين الدقيق، حيث يعتمد قيمة التأثير البصري على نماذج أو سابقات أو تضمين من مجموعات أو نماذج سابقة من دون صحة، فإن أصالة العمل هي موضع تساؤل، ويمكن أن تكون عرضة للتحدي.
مهمات مستحيلة
مجال إخراج VFX هو دراسة حالة مثيرة للاهتمام بشكل خاص فيما يتعلق بغسيل الملكية الفكرية المحتمل في مجموعات بيانات الذكاء الاصطناعي، لأن لقطات التأثيرات البصرية غالبًا ما تصور “أشياء مستحيلة” التي لن يكون هناك بديل مفتوح المصدر متاح.
على سبيل المثال، بينما يمكن تدريب نموذج توليدي على إنتاج هدم مبنى من مقاطع فيديو مجانية أو منخفضة التكلفة، إذا كنت تريد تدريب نموذج على إنتاج أشعة ليزر بشرية، ستحتاج إلى التدريب على لقطات VFX، مسروقة أو مفوضة؛ هذه الأشياء لا تحدث في أي مكان آخر.
حتى في حالة أنواع أخرى من الكوارث الطبيعية، مثل فيضانات دراماتيكية، من غير المحتمل أن تكون قادرًا على إعادة إنتاج وجهات نظر دراماتيكية على أحداث كارثية من مصادر العالم الحقيقي، لأن (باستثناء بعض الاستثناءات) الناس لا يعرضون عادةً مباشرة من مواقع كارثية. لذلك، فإن “المناظر الباردة” على الكوارث نادرة في مجموعات بيانات العالم الحقيقي، ونموذج الذكاء الاصطناعي الذي يمكن أن يولدها يحتمل أن حصل على المعلومات من مكان آخر.
معظم تدفقات المهام المرغوبة في الذكاء الاصطناعي لا تملك هذا المستوى من الخصوصية، وفي مثل هذه الحالات، قد لا يتطلب غسيل ملكية الآخرين الفكرية جهدًا كبيرًا.
الخلاصة: شبكة معقدة
فقط أولئك الذين استخدموا الذكاء الاصطناعي التوليدي على نطاق واسع ولفترة مستدامة سيفهمون بinstinctively أن هذه الأنظمة تعاني من الجمع بين مفاهيم متعددة عندما لا توجد أمثلة قابلة للمقارنة في بيانات التدريب.
هذا القيد يعرف باسم الارتباط، حيث تميل جوانب المفاهيم المُدرَّبة إلى التجمع مع عناصر ذات صلة، بدلاً من التحلل إلى قطع بناء لего مفيدة يمكن تركيبها في أي تكوين جديد يرغب المستخدم في إنشائه.
الارتباط هو حفرة جاذبية معمارية من الصعب الهروب منها، على الأقل对于 المناهج القائمة على الانتشار التي تميز جميع الإطارات الرئيسية الحالية للذكاء الاصطناعي. ومع ذلك، قد تظهر مناهج جديدة خلال السنوات القليلة القادمة التي تكون أفضل في تفكيك المفاهيم المُدرَّبة بحيث يمكن تجميعها بمهارة أكبر، وتقديم أدلة أقل حول أصلها.
* أنا لا أتهم EffectMaker، ولكن أعلق هنا على عمومية ممارسة متصاعدة في أبحاث فيديو الذكاء الاصطناعي.
† لأن هذه اللقطات، في هذه الأنواع من الأفلام، أ.generated وأستمرت في توليد الأموال.
نشر لأول مرة يوم الإثنين، 16 مارس 2026










