زاوية أندرسون
أساليب غسل الملكية الفكرية في الذكاء الاصطناعي

إذا كان هناك حساب قانوني قادم بشأن استخدام الملكية الفكرية في تدريب الذكاء الاصطناعي، فهناك أيضًا عدة طرق لإخفاء هذا الاستخدام.
مراجعة إن الثورة الحالية والمتسارعة في مجال الذكاء الاصطناعي التوليدي تتكشف في بيئة هي الأكثر هشاشة من الناحية القانونية التي رافقت أي تطور تكنولوجي تحويلي. منذ القرن التاسع عشر.
حتى قبل 3-4 سنوات، كان مجتمع أبحاث التعلم الآلي يتمتع بتفويض ضمني (غالباً صريح) لاستغلال المواد المحمية بحقوق الملكية الفكرية في سياق تطوير أنظمة جديدة؛ ولأن هذه الأنظمة لم تكن ناجحة بعد، من حيث كونها ناضجة أو قابلة للتطبيق تجارياً، كانت النتائج، بكل معنى الكلمة، أكاديمية.
في تلك الفترة، حقق جيل جديد من نماذج اللغة الكبيرة القائمة على الانتشار نجاحًا مفاجئًا (ماجستير(مثل ChatGPT و Claude) ونماذج اللغة المرئية (أجهزة VLM، مثل سوراأشارت هذه النتائج إلى أن هذه الخيوط البحثية المجردة والتي كانت حتى الآن "غير ضارة" قد تطورت إلى جدوى تجارية، وتجاوزت "إذنها المجاني" فيما يتعلق باستغلال الملكية الفكرية للآخرين.
من الآن فصاعدًا، سيسعى أصحاب الحقوق إلى الحصول على حصة في ثمار أنظمة الذكاء الاصطناعي التي يتم تدريبها بشكل كبير أو جزئي على بياناتهم المحمية بحقوق الطبع والنشر أو غيرها من البيانات المحمية، مما يؤدي إلى سيل متواصل من القضايا القانونية يتطلب بعض الجهد حتى أن الأمر يصعب تتبعه.

يقتصر هذا التقرير على الحالات التي تم الإبلاغ عنها في الولايات المتحدة فقط، بينما تظهر حالات جديدة بوتيرة محمومة في الولايات المتحدة وخارجها. مصدر
فرض "غداء مجاني"
الالتزام المالي يحدث حاليًا فيما يتعلق بالبنية التحتية التي تخدم الذكاء الاصطناعي، طرحت بعض الأصوات كمحاولة لترسيخ الذكاء الاصطناعي "الذي يشكل خطراً على حقوق النشر" بعمق في المجتمع الاقتصادي بحيث لا يصبح "أكبر من أن يفشل" فحسب، بل "أقوى من أن تتم مقاضاته" أيضاً - أو على الأقل أقوى من أن تسمح الدعاوى القضائية الناجحة بقلب الثورة رأساً على عقب.
وفي ضوء هذا الشعور العام، فإن الرئيس الحالي للولايات المتحدة هو الالتزام بالسياسة رأيه أن لا يمكن توقع نجاح برنامج الذكاء الاصطناعي عندما يُفترض بك أن تدفع ثمن كل مقال أو كتاب أو أي شيء آخر قرأته أو درسته..
حقاً؟ لم يحدث شيء مشابه أو قابل للمقارنة في العصر الصناعي الغربي، وهذا يمثل حركة تتعارض بشدة مع ثقافة التقاضي والتعويض التقليدية في الولايات المتحدة؛ ولعل أقرب المواقف المشابهة هي انتهاء صلاحية براءات اختراع الأدوية إلزاميًا بعد 20 عامًا (في حد ذاته). يتعرضون للهجوم بشكل متكرر)، و ال تحديد بشأن توقعات الخصوصية في الأماكن العامة.
ومع ذلك، تتغير الأوقات؛ في غياب أي ضمان بأن الاتجاه الحالي نحو "الاستملاك" ضد حماية الملكية الفكرية لن يتعثر، أو يتم عكسه لاحقًا، هناك العديد من الأساليب الثانوية التي أصبحت ممارسة قياسية في تطوير أنظمة الذكاء الاصطناعي، ومعالجة بيانات التدريب المتنازع عليها بشدة والتي تغذيها.
مجموعات البيانات بالوكالة
إحدى هذه الأساليب تتخذ نهجاً مشابهاً بشكل ملحوظ للدفاع (غير الناجح دائماً) الذي تقوم به مواقع قوائم التورنت بأنها لا تستضيف في الواقع أي مواد متنازع عليها - أو أي مواد على الإطلاق.
إلى جانب تجنب الحاجة إلى تخزين وتقديم كميات كبيرة من بيانات الصور أو الفيديو ذات الضغط المنخفض، تسمح مجموعات من هذا النوع بالتحديث السريع - مثل إزالة المواد بناءً على طلبات أصحاب حقوق الطبع والنشر - والتحكم في الإصدارات.
وكما أن ملفات التورنت ليست سوى علامات تشير إلى مكان وجود المواد المحمية بحقوق الملكية الفكرية، فإن عدداً من مجموعات البيانات المؤثرة للغاية هي في حد ذاتها مجرد قوائم "مؤشر" للبيانات الموجودة؛ إذا رغب المستخدم النهائي في استخدام هذه القوائم كقائمة تنزيل لمجموعة البيانات الخاصة به، فهذا شأنه، فيما يتعلق بمسؤولية القائمين على هذه المجموعات.
ومن بين هذه الشركات شركة جوجل للأبحاث. مفاهيمي 12 شهرًا مجموعة البيانات التي توفر تعليقات توضيحية للصور، ولكنها تشير فقط إلى مواقع على الإنترنت أين توجد هذه الصور (أو كانت موجودة وقت إعدادها):

مثالان من مجموعة "المفاهيمية 12 مليون" التي أعدتها شركة جوجل للأبحاث. مصدر
ومن الأمثلة البارزة الأخرى، والتي باتت تحظى بمكانة مرموقة في تاريخ الذكاء الاصطناعي، ما يلي: مجموعة بيانات LAION مما سهّل ظهور نظام التوليد بالانتشار المستقر في 2022 – أول إطار عمل من نوعه يقدم صورًا توليدية قوية مفتوحة المصدر للمستخدمين النهائيين، في الوقت الذي بدت فيه الأنظمة الاحتكارية وكأنها ستؤسس مثل هذه الخدمات كمجال تجاري مغلق تمامًا:

أحد المتغيرات العديدة لمشروع LAION، والذي يعرض أعمالاً فنية حديثة ومحمية بحقوق الطبع والنشر. مصدر
في كثير من الحالات، تشير أحجام الملفات الكبيرة لبعض مجموعات "المؤشرات" هذه إلى تضمين محتوى صور في ملف قابل للتنزيل ومُستضاف؛ ومع ذلك، فإن أحجام التنزيل غير البسيطة غالبًا ما تكون بسبب الحجم الكبير لمحتوى النص، وأحيانًا بسبب تضمين التضمينات المستخرجة أو ملامح – ملخصات أو عقد مشتقة من محتوى قابل للتطبيق تم استخراجه من بيانات المصدر أثناء عملية التدريب.
خدمة الفيديو المميزة
تقدم مجموعات بيانات الفيديو حالة أقوى لنهج "مجموعة البيانات بالوكالة" أو نهج المؤشر، حيث أن الحجم الكبير لبيانات التخزين المطلوبة لتجميع عدد ذي معنى ومفيد من مقاطع الفيديو في مجموعة واحدة قابلة للتنزيل أمر باهظ، والطريقة "الموزعة" مرغوبة.
مع ذلك، في كلتا الحالتين - وخاصةً مع الفيديو - تمثل روابط المصدر القابلة للتنزيل بيانات تحتاج إلى مزيد من الاهتمام قبل استخدامها في عمليات التدريب. يجب تغيير حجم كل من الصور والفيديوهات، وإلا قرارات الزراعة تم صنعها، من أجل إنشاء عينات تتناسب مع مساحة GPU المتاحة. حتى مقاطع الفيديو التي تم تقليل حجمها بشكل كبير ستتطلب أيضًا تقطيعها إلى أطوال قصيرة جدًا، مثل 3-5 ثوانٍ، عادةً.
تتضمن مجموعات بيانات الفيديو البارزة التي تستخدم مراجع لمقاطع الفيديو عبر الإنترنت (بدلاً من تنظيم الفيديو وتغليفه مباشرةً) بيانات جوجل. مجموعة بيانات فيديو حركية الإنسانومحرك البحث العملاق مجموعة يوتيوب - 8 ملايين، والذي يستخدم شرح المقطع لتوضيح كيفية التعامل مع كل فيديو بمجرد تنزيله - ولكن هذا يترك مرة أخرى للمستخدم النهائي الحصول على مقاطع الفيديو من عناوين URL المقدمة.
أغلق وافتح
أخيرًا، في هذه الفئة، قد تُنتَج بيانات المؤثرات البصرية "المفتوحة" باستخدام منصات مغلقة، ثم تُنشر هذه البيانات وتُتاح للجمهور. من المنطقي التساؤل عن سبب ذلك، والنظر فيما إذا كان السبب هو رغبة الشركة المُنتِجة في تنقيح نموذج المصدر الأصلي غير المتوافق مع حقوق الملكية الفكرية لاستخدامها الخاص، أو ربما طُلِبَت مجموعة بيانات "مُنقّحة" من جهة خارجية.
يمكن القول إن إحدى حالات "التبييض عبر الأجيال" هي مجموعة بيانات Omni-VFX، والذي يتضمن العديد من نقاط البيانات من مجموعة بيانات Open-VFX (والذي يشير في حد ذاته إلى العديد من المنصات المغلقة وشبه المغلقة، مثل Pika و PixVerse).
بصراحة، شركة Omni-VFX لا تبذل أي جهد حقيقي:

في مجموعة بيانات Omni-VFX مفتوحة المصدر، وجه مألوف. مصدر
المسؤولية الموروثة
يتمثل النهج الرئيسي الثاني لغسل حقوق الملكية الفكرية في استخدام مواد محمية بحقوق الطبع والنشر على مستوى واحد أو عدة مستويات. ومن بين الأساليب في هذه الفئة استخدام البيانات الاصطناعية تم تدريب هذه النماذج، في مرحلة ما، على بيانات محمية بحقوق الطبع والنشر. في مثل هذه الحالات، وخاصةً عندما تتمكن البيانات الاصطناعية من الحصول على نتائج تبدو أصلية، فإن العمل المحمي بحقوق الطبع والنشر يوفر تحولات لا يمكن تخمينها أو تقريبها بشكل معقول بواسطة نماذج العالم العامة، أو النماذج غير المتخصصة.
وهذا ينطبق بشكل قاطع عندما تكون أنظمة الفيديو التوليدية مطلوبة لتوليد أحداث "مستحيلة"، وأحداث تندرج عمومًا ضمن فئة "المؤثرات البصرية" (VFX).
في الواقع، ما دفعني إلى التفكير في هذا الموضوع هو أحدث سلسلة من الأبحاث التي تقدم القدرة على "تجريد" أنواع متنوعة من المؤثرات البصرية، مثل إنتاج أشعة الليزر من أجزاء غير محتملة من الجسم، إما عن طريق التدريب على مقاطع فيديو مؤثرات بصرية مصممة خصيصًا أو "مفتوحة المصدر" (بدلاً من المصدر الأكثر وضوحًا، مثل لقطات المؤثرات البصرية باهظة الثمن الموجودة في إنتاجات عالم مارفل السينمائي):
أمثلة من موقع EffectMaker الإلكتروني، حيث يتم تطبيق "الإجراء" في مقطع المصدر (أقصى اليسار) على صورة المصدر (الوسط). مصدر
الأمثلة المذكورة أعلاه مأخوذة من صفحة المشروع ل صانع المؤثرات المشروع. إن EffectMaker ليس حتى أول منتج هذا العام يسعى إلى استخراج ديناميكيات المؤثرات البصرية من مقطع فيديو واحد ونقلها إلى مقطع جديد، وفي الواقع يتحول هذا إلى مهمة فرعية منفصلة في أبحاث المؤثرات البصرية للذكاء الاصطناعي*.
إدراكًا منها أن شركات الإعلام العملاقة مثل مارفل لديها فرصة أكبر من المتوسط للفوز في القضايا القانونية المتعلقة بالملكية الفكرية (حتى في ظل المناخ المذكور أعلاه من "التسامح المفروض")، فإن شركات المؤثرات البصرية والشركات الناشئة تبذل حاليًا جهودًا ملحوظة لضمان خلو أطر عمل المؤثرات البصرية التوليدية الخاصة بها من الملكية الفكرية للشركات الأخرى.
وأبرزها ميتا، التي تم الإبلاغ عنها على منتدى r/vfx يبدو أن الشركة قد أطلقت حملة توظيف شتوية مجزية استمرت حتى عام 2026، حيث عرضت على فناني المؤثرات البصرية وظائف لتدريب نماذج الذكاء الاصطناعي لإنتاج لقطات مؤثرات بصرية بمستوى هوليوود. ورغم أن الأجور لم تُحدد في مختلف الوظائف، إلا أن إحداها... وصفها بأنها "أموال التقاعد".
اتبع المال
ومع ذلك، يتساءل المرء عن مقدار الأموال التي ترغب حتى شركات مثل ميتا في دفعها مقابل تنوع حقيقي ووفرة في مخصص لقطات المؤثرات البصرية، بالنظر إلى أن متوسط لقطة المؤثرات البصرية الواحدة لفيلم ضخم يبلغ حوالي 42,000 دولار أمريكي - ويأتي الكثيرون في مرتبة أعلى بكثير.
علاوة على ذلك، من المنطقي أن تستجيب نماذج الذكاء الاصطناعي المصممة خصيصًا لتوليد المؤثرات البصرية للطلب الشعبي، بما في ذلك مختلف أساليب المؤثرات القياسية من أكثر فئات الأفلام شعبية وتكلفة.
بصرف النظر عن وجهة النظر القائلة بأن محترفي المؤثرات البصرية "المتبقين" قد ينتهي بهم الأمر بإعادة إنشاء لقطات عملوا عليها لكتالوج أفلام موجود† - وهو ما يضع في حد ذاته العمل على مجموعة البيانات "المخصصة" على أنه عمل تقليدي - على أي حال، لا يوجد ضمان بأن هذه العينات الجديدة المكلفة ستنتهي بالتدريب "من الصفر" في بنية جديدة تمامًا.
في الواقع، إذا تم تحويل هذه الاستعادات إلى وحدات إضافية مثل LoRAs، والتي تعتمد على نموذج أساسي، فإن العملية لا تكون قابلة للدفاع إلا بقدر ما يكون النموذج الأساسي "خاليًا من الملكية الفكرية" - وليس الكثير منها كذلك.
وبالمثل، إذا كانت العملية "الجديدة" تستخدم تقنيات "هجينة" أخرى مثل الكون المثالىحيث تعتمد قيمة التأثير البصري على النماذج، برايورأو تضمينات من مجموعات أو نماذج قديمة ذات سلامة غير مثبتة، فإن أصالة العمل يمكن القول إنها تجميلية، وتخضع للطعن.
مهمات مستحيلة
يُعد مجال مخرجات المؤثرات البصرية دراسة حالة مثيرة للاهتمام بشكل خاص فيما يتعلق بإمكانية تبييض الملكية الفكرية في مجموعات بيانات الذكاء الاصطناعي، حيث أن لقطات المؤثرات البصرية غالبًا ما تصور أشياء "مستحيلة" والتي ستكون موجودة لا توجد بدائل مفتوحة المصدر متاحة.
على سبيل المثال، في حين أنه يمكن تدريب نموذج توليدي على هدم مبنى من مقاطع فيديو متنوعة متاحة للجمهور أو بأسعار معقولة، إذا كنت ترغب في تدريب نموذج لإنتاج أشعة ليزر بشرية، فستحتاج إلى التدريب على مقاطع فيديو للمؤثرات البصرية، سواء كانت مسروقة أو تم تكليفها؛ أشياء كهذه لا تحدث في أي مكان آخر.
حتى في حالة أنواع أخرى من الكوارث الطبيعية، مثل الفيضانات العارمة، فمن غير المرجح أن تتمكن المصادر الواقعية المتاحة من إعادة إنتاج وجهات النظر الدرامية حول الأحداث الكارثية، لأن (مع بعض الاستثناءاتلا يقوم الناس عادةً بالبث المباشر من مواقع الكوارث. لذلك، فإن "المشاهد المميزة" للكوارث نادرة في مجموعات البيانات الواقعية، وأي نموذج ذكاء اصطناعي قادر على توليدها من المرجح أنه حصل على المعلومات من مصدر آخر.
معظم تدفقات مهام الذكاء الاصطناعي المرغوبة لا تتمتع بهذا المستوى من التحديد، وفي مثل هذه الحالات قد لا يتطلب إخفاء فوائد البيانات المحمية بحقوق الملكية الفكرية بذل جهد كبير.
الخلاصة: شبكة متشابكة
لن يفهم غريزياً إلا أولئك الذين استخدموا الذكاء الاصطناعي التوليدي على نطاق واسع وعلى مدى فترة طويلة، أن هذه الأنظمة تكافح من أجل الجمع بين مفاهيم متعددة عندما لا توجد أمثلة مماثلة في بيانات التدريب الخاصة بها.
يُعرف هذا القيد باسم تشابك، حيث تميل الجوانب المختلفة للمفاهيم المدربة إلى التجمع مع العناصر ذات الصلة، بدلاً من أن تتفكك إلى مكعبات بناء سهلة الاستخدام على غرار مكعبات الليغو والتي يمكن ترتيبها في أي تكوين جديد قد يرغب فيه المستخدم.
التشابك هو بئر جاذبية معمارية يصعب التخلص منها، على الأقل بالنسبة للمناهج القائمة على الانتشار التي تميز جميع أطر الذكاء الاصطناعي العام الرئيسية الحالية. ومع ذلك، قد تظهر مناهج جديدة خلال السنوات القليلة المقبلة أكثر كفاءة في تجزئة المفاهيم المدربة بحيث يمكن دمجها معًا بمهارة أكبر، وتقدم مؤشرات أقل حول مصدرها.
* لا أوجه أي اتهامات ضد شركة EffectMaker، ولكنني أعلق هنا على عمومية ممارسة ناشئة في أبحاث الفيديو باستخدام الذكاء الاصطناعي.
† لأن هذه اللقطات، في هذا النوع من الأفلام، قد ولّدت ولا تزال تولد المال.
نُشرت لأول مرة يوم الاثنين 16 مارس 2026










