اتصل بنا للحصول على مزيد من المعلومات

هل سينجح الذكاء الاصطناعي في نهاية المطاف خارج نطاق الحماية؟

زاوية أندرسون

هل سينجح الذكاء الاصطناعي في نهاية المطاف خارج نطاق الحماية؟

mm
صورة كرتونية للعبة شبيهة بلعبة سيمز، حيث ينظر لورد اسكتلندي في قلعته إلى القرويين المزدهرين خلف خندقه في حيرة. GPT-1.5.

إن تكاليف وقيود الذكاء الاصطناعي الضخم، فضلاً عن تأثيره على تكاليف الأجهزة، تجبر المستخدمين على بناء أنظمتهم الخاصة - تمامًا كما يهدد التنظيم المتزايد بإغلاق "اقتصاد الذكاء الاصطناعي الخفي".

 

مراجعة من بين العديد من "المزالق" التي تظهر في أوراق البحث العلمي، فإن أحد أكثرها شيوعًا هو أن المشكلة التي تتناولها الورقة كانت تم حل هذه المشكلة بالفعل في مكان آخروأن مساهمة البحث الجديد هي مجرد مساهمة عرضية أو تدريجية.

قد يحدث هذا لعدة أسباب: كان الباحثون يأملون في تحقيق قفزة نوعية، لكنهم حصلوا على تقدم طفيف بدلاً من ذلك؛ أو أن الحلول السابقة للمشكلة كانت تستهلك موارد أكثر من الحل الجديد؛ أو ببساطة أن أهداف المشروع فشلت تمامًا، لكن ثقافة "النشر أو الفناء" في البحث الأكاديمي أجبرت الفريق على إصداره على أي حال (غالبًا ما يُدفن). وسط الانهيار الجليدي (في أكثر أيام النشر ازدحامًا على البوابة الإلكترونية).

لكن في أدبيات التعلم الآلي، أصبح سبب جديد نسبياً وغير اعتذاري أكثر شيوعاً: وهو أن الميزة أو الوظيفة المعروضة هي متاح حاليًا فقط من خلال بوابات مغلقة المصدر ومرتبطة بواجهة برمجة التطبيقات (API)..

كنت أفكر في إحدى هذه الأوراق البحثية هذا الصباح – أ للاتعاون بين الجامعات الصينية وشركة أمازون، لمعالجة المشكلة المتكررة المتمثلة في فشل إزالة الكائن في أنظمة تحرير الصور القائمة على الانتشار، والتي غالباً ما تقوم ببساطة "بإعادة ملء" المساحة المستهدفة بكائن مشابه بدلاً من ذلك:

في أقصى اليسار توجد الصورة الأصلية؛ وإلى يمينها قناع التجزئة الأحمر الذي يُحدد للذكاء الاصطناعي الجزء المطلوب إزالته من الصورة؛ ثم تظهر صورة "خاصتنا" التي تُظهر أسلوبًا ناجحًا لإزالة الكائن – أما الصورتان المتبقيتان فتُظهران أنظمة مماثلة، حيث تقوم هذه الأنظمة، بدلًا من إزالة الحافلة، بإدخال حافلة أخرى بدلاً منها. المصدر - https://arxiv.org/pdf/2603.27599v1

في أقصى اليسار توجد الصورة الأصلية؛ وإلى يمينها قناع التجزئة الأحمر الذي يُحدد للذكاء الاصطناعي الجزء الذي يجب إزالته من الصورة؛ ثم تظهر صورة "خاصتنا" التي تُظهر أسلوبًا ناجحًا لإزالة الكائن – أما الصورتان المتبقيتان فتُظهران أنظمة مماثلة تقوم، بدلًا من إزالة الحافلة، بإدخال حافلة أخرى.. مصدر

في المثال أعلاه، تُظهر الصورة المركزية الطريقة الجديدة التي نجحت في إزالة الحافلة ووضع خلفية معقولة، مقارنةً بالطريقتين السابقتين (الصورتين الموجودتين في أقصى اليسار)، واللتين تزيلان الحافلة، ولكنهما تضعان بعد ذلك... مختلف الحافلة تعود إلى الصورة!

مسكتك!

دعونا نؤجل الخوض في أسباب هذا التحدي وتفاصيله إلى وقت آخر (وهو كذلك بالفعل). وكتابة مواضيع مثيرة للاهتمام موضوع ثم صادفتُ مغالطةً كلاسيكيةً أثناء قراءة الورقة البحثية الجديدة: اعتراف المؤلفين بأن الأنظمة الاحتكارية باهظة الثمن يمكنها بالفعل أداء هذه المهمة بكفاءة عالية - وهو أمر أعرفه من خلال سنوات قليلة من استخدامي لبرامج أدوبي. يراعة في برنامج فوتوشوب، من بين أنظمة أخرى مغلقة المصدر:

غالباً ما تخدع الطرق القائمة على الانتشار عن طريق إدخال كائنات غير مقصودة بعد إزالة الكائنات المستهدفة، مما يؤدي إلى نتائج غير متسقة سياقياً.

من ناحية أخرى، فإن النماذج متعددة الوسائط المغلقة المصدر الحديثة مثل ChatGPT و Nano Banana، على الرغم من أنها أكثر قوة في محو الكائنات، إلا أنها تتضمن عددًا كبيرًا من المعلمات وتكاليف حسابية عالية، مما يعيق نشرها العملي على الأجهزة الطرفية.

"لذا، من الضروري تطوير نموذج مخصص لمحو الكائنات لا يتيح فقط أداءً فائقًا في المحو، بل يتميز أيضًا بانخفاض زمن الاستدلال وعدد أقل بكثير من المعلمات."

هذا التفسير، الذي يركز على العقبات التقنية، يتجاهل الحقيقة الواضحة المتمثلة في عدم توفر بنى مغلقة المصدر مثل ChatGPT و Nano Banana في جميع للتثبيت المحلي. على الرغم من أن هذه الأنظمة القدرة على إنتاج مواد مثيرة للجدل وقد منحت هذه الجهات سلطتها في إدارة البوابات مبرراً عاماً إضافياً خلال العام الماضي، وتُعد البوابات من هذا النوع ملكية خاصة بشكل أساسي بسبب الضرورات التجارية.

باختصار، تشير الورقة البحثية الجديدة إلى أنه على الرغم من حل المشكلة المستهدفة في الأنظمة التجارية، قد يكون هذا غير ذي صلة بالنسبة لنا جميعًا.، الذين يحتاجون إلى تعلم كيفية حلها في "العالم الحقيقي" - أي في أنظمة المصادر المفتوحة، سواء كان من الممكن تثبيتها محليًا بشكل واقعي أم لا.

التنمية الموازية

لكن، لماذا نحل مشكلة لا تزال تعتمد على نظام مدفوع، ليس بسبب قيود الملكية الفكرية، بل لأن متطلبات الحوسبة لوحدة معالجة الرسومات تتجاوز ما يمكن لأي إعداد محلي تحمله بشكل واقعي؟ معظم هذه الأوراق البحثية ومستودعات الأكواد "المفتوحة" الجديدة تتضمن إعدادات تدريب/استدلال تتطلب موارد هائلة، مثل مجموعات من وحدات معالجة الرسومات A100.

حسناً، هذا يعتمد على الغاية التي تعتقد أن كل هذه الأمور ستصل إليها مراكز بيانات الذكاء الاصطناعي قيد الإنشاء والتي ستؤثر على الاقتصاد ستتحقق هذه التوقعات عندما يتم تشغيلها في نهاية المطاف. تتصور مخاوف عامة الناس وآمال النخب على حد سواء أنظمة احتكارية محصورة، على غرار ChatGPT، تحل محل الوظائف، مع رفع تكاليف الاشتراك باستمرار وخفض مستويات الخدمة، لإرضاء رأس المال الاستثماري المبكر الذي كان عليه الانتظار من 3 إلى 5 سنوات حتى يتم تشغيلها.

لكن يبدو أن هناك اتجاهاً متزايداً في الأدبيات يدعم مستقبلاً بديلاً، وروح "العمل الفردي" والهامشية للعديد من المجتمعات عبر الإنترنت مثل منتدى r/stablediffusion الفرعي، الذي يضم حالياً 920,000 مستخدم، والذي حظر منذ فترة طويلة المنشورات المتعلقة بأنظمة توليد الصور/الفيديو ذات المصادر المغلقة.

في هذا المستقبل البديل، سيسهل الإمداد العالمي الجديد لمراكز بيانات الذكاء الاصطناعي الحوسبة الخام للأنظمة التي يقوم المستخدم بتكوينها وتحديدها، بدلاً من تلبية متطلبات أطر العمل الضخمة "ذات الصندوق الأسود" مثل ChatGPT و Adobe Firefly.

الاحتكاك السطحي

بالنظر إلى شروحات استخدام وحدة معالجة الرسومات عن بُعد المعقدة، التي تم جمعها عبر منصة باتريون، على منتدى r/stablediffusion، يبدو كل شيء مستحيلاً في الوقت الحالي: النماذج هي تغيير الأهداف باستمرار مع كل تحديث؛ يصعب نشرها محليًا، حتى في أسهل الأطر وأكثرها ملاءمة للمستخدم؛ وبشكل عام، يشير مقدار الاحتكاك المتضمن إلى مسعى مخصص لهواة التقنية فقط، وللفئة الأكثر مغامرة من الشركات غير المنخرطة بشكل مباشر في الذكاء الاصطناعي، ولكنها ترغب في تطوير وصيانة أنظمتها المحلية الخاصة، بدلاً من استئجار مثل هذه القدرات.

مع ذلك، على مدى الثلاثين عامًا الماضية، شهدت كل تقنية طلبًا هائلاً على التبسيط المفتوح والديمقراطي وتحويلها إلى سلعة. يميل إلى الحصول عليه، حيث تظهر الحلول الأكثر انتشاراً عادةً من التوترات بين الأنظمة التجارية والبدائل والمبادرات مفتوحة المصدر.

لقد تطورت جميع المساعي التي كانت في السابق عبارة عن جيوب متخصصة "للمهووسين"، مثل اتصالات الإنترنت وأنظمة إدارة المحتوى وأطر التدوين، بالإضافة إلى أمن الإنترنت والتصوير الفوتوغرافي وإدارة الوسائط، من التعقيد المربك إلى البساطة والفائدة.

لذلك، قد يكون المشهد اللاحق للذكاء الاصطناعي أكثر تنوعًا ومليئًا باللاعبين الأصغر حجمًا والمتنافسين بشكل حقيقي أكثر مما قد يفضله قادة سوق الذكاء الاصطناعي الحاليون.

تحقيق الذات، بالضرورة

ومن المفارقات أن "الذكاء الاصطناعي الضخم" يساهم بشكل كبير في ظهور روح الاستقلالية بين المستخدمين النهائيين، من خلال الاستحواذ على جميع مكونات الكمبيوتر لمراكز البيانات الخاصة به. وخاصة ذاكرة الوصول العشوائي الديناميكية (DRAM) - والتي كانت ستذهب لولا ذلك إلى المستهلكين "العاديين".

ونتيجة لذلك، يتصور الكثيرون مستقبلاً يتم فيه الوصول إلى موارد "الذكاء الاصطناعي العالمي" المغلقة المصدر عبر أجهزة عملاء خفيفة ذات قدرات محدودة، و تنمية اهتمام متزايد في صيانة معداتهم الحالية.

كما تسبب هجوم الذكاء الاصطناعي على سلاسل توريد التكنولوجيا في دفع مزودي خدمات التكنولوجيا إلى رفع أسعارها في الأشهر الثلاثة إلى الستة الماضية، إما لأن الشركات الصغيرة تعاني بالفعل من ضغوط بسبب نقص الأجهزة، أو ببساطة بسبب الذكاء الاصطناعي.

وقد أدى هذا إلى أ تزايد الاهتمام بالاستضافة الذاتية وفي الموقع - بما في ذلك شبكات التعلم الآلي ذاتية الاستضافة.

لقد انخرطتُ في هذا الأمر مؤخرًا، حيث انتقلتُ إلى استخدام التخزين المحلي عبر الشبكة المحلية (LAN) للصور والفيديوهات، بالإضافة إلى نسخ الملفات الاحتياطية. بالنسبة للصور والفيديوهات، أستخدم خادم الوسائط متعدد المنصات المجاني والمفتوح المصدر Immich، مما ساعدني على تجنب ارتفاع الأسعار (و قضايا أخرى مثيرة للقلق) من iCloud وموفري خدمات التخزين السحابي الآخرين:

تتيح لك منصة Immich المجانية حفظ ملفات الوسائط على جهازك، مع الحفاظ على خصوصيتها ضمن قنواتك الخاصة. في هذه الحالة، أستخدم أيضًا Immich على Docker لتشغيل معالج الرسوميات NVIDIA 3090 عبر الشبكة المحلية، حيث يتم حفظ الصور والفيديوهات، مما يُمكّن معالج الرسوميات الأقوى من التعامل مع أي عمليات معالجة مكثفة للصور والفيديوهات.

تتيح لك منصة Immich المجانية حفظ ملفات الوسائط على جهازك، مع الحفاظ على خصوصيتها ضمن قنواتك الخاصة. في هذه الحالة، أستخدم أيضًا Immich على Docker لتشغيل معالج الرسوميات NVIDIA 3090 عبر الشبكة المحلية، حيث يتم حفظ الصور والفيديوهات، مما يُمكّن معالج الرسوميات الأقوى من التعامل مع أي عمليات معالجة صور/فيديوهات تتطلب ذكاءً اصطناعيًا عاليًا.

إذا كانت تجربتي الشخصية مؤشراً نموذجياً، ترميز الاهتزاز - حالياً ملعون في العديد من المجتمعات الإلكترونية التي كانت تُعتبر "نقية" في السابق، يُغذي هذا التيار موجة الاستقلال هذه (حتى لو كان قد يشكل تهديدا (مستودعات المصادر المفتوحة التي يعتمد عليها).

على سبيل المثال، لطالما كانت الشبكات نقطة ضعفي في مجال الحوسبة، لذلك كان استخدام الذكاء الاصطناعي ضروريًا بالنسبة لي لتشغيل خادم افتراضي خاص آمن، لدعم مجموعة من الخدمات الجديدة ذاتية الاستضافة.

وبهذا المعنى، يمكن القول إن "الذكاء الاصطناعي الضخم" يُعزز "الذكاء الاصطناعي الصغير"؛ لذا ربما يمكننا اعتبار الصعود الحالي لشركات الذكاء الاصطناعي فائقة الحجم والقيمة حالةً ضرورية ولكنها انتقالية فقط قبل ظهور مجتمع ذكاء اصطناعي أكثر ديمقراطية وتمكينًا للمستخدمين، يتخلص من الشركات الساعية إلى تحقيق مكاسب هائلة كما لو كانت صواريخ معززة مستهلكة - تمامًا كما حدث مع انهيار فقاعة الإنترنت عام 2000. البنية التحتية التي تم تركها قابلة للاستغلال الأمر الذي من شأنه أن يسرع بشكل كبير من نمو الإنترنت لفترة طويلة بعد انهيار الشركات التي دفعت ثمنه.

عصر الامتثال

حسنًا، من المحتمل ألا يتكرر ذلك هذه المرة.

حتى لو كنا . يميل إلى تكوين نوع من الخندق السابق المجتمع الهامشي، واللوائح المتعلقة بالذكاء الاصطناعي، بالإضافة إلى الاتجاه العالمي الحالي نحو التحقق من العمريبدو من المرجح أن يتوقع هذا الأمر ويمنع هذه السبل التنموية.

إنّ الركيزة الأساسية لمنع "اقتصاد الذكاء الاصطناعي الخفي" هي التنظيم. وقد بدأت بالفعل مستودعات مركزية مثل GitHub جيثب: و وجه يعانق غالباً ما تتطلب تسجيل الدخول عبر الإنترنت قبل السماح للمستخدمين باستنساخ المستودعات محلياً، وذلك حسب إعدادات المستودع.

لذلك، توجد بالفعل آليات لفرض مراقبة أطر الذكاء الاصطناعي على نطاق أوسع مما هو عليه الحال في الممارسة الحالية؛ و سوف إن زيادة هذه الرقابة تتعزز الآن من خلال مبادرات حكومية فردية إلى زخم عالمي.

لذا، إذا كان من المفترض أن تعمل قوى السوق وبراعة حركة البرمجيات الحرة والمفتوحة المصدر على إزالة العقبات التي تحول دون نشر الذكاء الاصطناعي بشكل غير رسمي، فمن المرجح أن تعود العقبات في شكل متطلبات الحوكمةمتطلبات الامتثال التي، على الرغم من كونها مرهقة، إلا أنها مجدية للشركات، ولكن ربما ليس للأفراد - على غرار الاحتكاك الذي أضيف إلى أنظمة الدفع الإلكتروني على مستوى المستهلك منذ العصر الذهبي لباي بال في 2000s.

سواء كان ميتا أنفقت ملياري دولار في الضغط من أجل التحكم في العمر على مستوى نظام التشغيل بسبب استثماراتهم الكبيرة في الذكاء الاصطناعي، أو مصالحهم في جمع البيانات، فإن نتيجة شركات التكنولوجيا الكبرى دعم تحديد السن يكمن الأمر في أن الذكاء الاصطناعي "المحلي" قد يخضع للتنظيم مثل المواد المصنفة من الفئة (أ)؛ ومثلما كان قانون الألفية الرقمية لحقوق المؤلف (DMCA) مصمم لتجريم نية بدلاً من أي آلية معينة للتهرب من حقوق الطبع والنشر، يمكن للوائح الذكاء الاصطناعي الدولية، في مثل هذا السيناريو، أن تجعل كل استخدام غير متوافق مع التعلم الآلي عملاً محظوراً، بتكلفة قليلة جداً (من حيث الرقابة الفعالة).

ربما بدت هذه النظرة متشائمة للغاية قبل عام - لكن ذلك كان قبل كاليفورنيا و سيستم دي أيدوا فكرة التحقق من العمر على مستوى الأجهزة، حالياً كما يراه الكثيرون كبديل لنمط الحزب الشيوعي الصيني حظر حول إخفاء الهوية على الإنترنت.

خاتمة

لذا، في حين أن الخلفية القانونية والتشريعية تستعد، ربما، لدمج الذكاء الاصطناعي في مجال شديد التنظيم، بحيث لا يستطيع المستخدمون العاديون "صنع منتجاتهم الخاصة" أكثر مما يستطيعون زراعة أو تخمير المواد الخاضعة للتنظيم دون إذن، فإن قطاع البحث يحافظ على موقفه الأكثر تفاؤلاً - وهو أن الذكاء الاصطناعي سيصبح قوة ديمقراطية ومفيدة في المجتمع الأوسع نطاقًا وليس فقط أتباع مزود المصدر المغلق الأكثر شيوعًا في الوقت الحالي.

يعتمد الكثير على مصير الأنقاض بعد انفجار فقاعة الذكاء الاصطناعي - على الأقل بقدر ما يقوم مقدمو الخدمات إما بالاندماج، أو يستقر السوق في حالة من التفتت طويل الأجل - الأمر الذي من المرجح أن يتطلب لمسة تنظيمية أكثر لطفًا.

 

نُشر لأول مرة يوم الأربعاء 1 أبريل 2026

كاتب في مجال التعلم الآلي، متخصص في مجال تركيب الصور البشرية. رئيس سابق لمحتوى الأبحاث في Metaphysic.ai.
الموقع الشخصي: martinanderson.ai
اتصال: [البريد الإلكتروني محمي]
تويتر:manders_ai