Connect with us

د. يائير أداتو، الرئيس التنفيذي ومؤسس بрайا – سلسلة المقابلات

مقابلات

د. يائير أداتو، الرئيس التنفيذي ومؤسس بрайا – سلسلة المقابلات

mm

د. يائير أداتو، الرئيس التنفيذي ومؤسس بрайا، هو خبير في التعلم الآلي والرؤية الحاسوبية يتمتع بقدرة على ربط التكنولوجيا المتقدمة بالتطبيقات التجارية في العالم الحقيقي. قبل تأسيس بрайا، شغل منصب الرئيس التقني في ريتايل، حيث لعب دورًا مركزيًا في تحويل الشركة من شركة ناشئة تضم 20 شخصًا إلى شركة وحيدة تضم أكثر من 850 موظفًا. على مدار مسيرته، ساهم يائير أيضًا كمسؤول في العديد من المشاريع التي تعتمد على الذكاء الاصطناعي، بما في ذلك سباركس وVICOMI وTASQ وDataGen وAnima. يتميز قيادته bằng التزام قوي بالابتكار المسؤول وملكية البيانات ودمقرطة تكنولوجيا الذكاء الاصطناعي.

بрайا هي شركة رائدة في مجال الذكاء الاصطناعي التوليدي المرئي المسؤول، تأسست بهدف إنشاء منصة مفتوحة ومتينة لإنشاء الصور. تقوم شركة بрайا بمنح مالكي البيانات مكافآت على مساهمتهم من خلال محرك الإسناد، مما يضمن الشفافية والعدالة في نظام الذكاء الاصطناعي. من خلال التركيز على الإبداع والتعاون والامتثال، تمكن بрайا المنظمات من دمج الذكاء الاصطناعي التوليدي بأمان في سير عملها مع وضع معايير جديدة للمساءلة والثقة في صناعة المحتوى المرئي.

لقد أسست بрайا لإنشاء منصة مسؤولة ومفتوحة للذكاء الاصطناعي التوليدي المرئي. ما الذي ألهمك لتأسيس الشركة، وما هي التحديات المبكرة أو الرؤى التي شكلت اتجاهها؟

لقد شاهدت غودفيلو يقدم ورقة GAN في عام 2014، وكان من الواضح على الفور أن الإنتاج الإبداعي سيتغير بشكل جوهري. عند مشاهدة هذا العرض، كانت الآثار واضحة – لم يكن هذا مجرد تحسين تدريجي، بل كان نموذجًا مختلفًا لطريقة عمل الآلات في تعلم إنشاء المحتوى المرئي.

لكنني أدركت من البداية وجود فجوة أساسية في كيفية بناء هذه الأنظمة: لا مساءلة لبيانات التدريب، ولا إطار لتنفيذ مسؤول، ولا اعتبار للمبدعين الذين جعلوا كل هذا ممكنًا.

التحديات المبكرة لم تكن تقنية – كانت هيكلية. كيف يمكنك بناء الذكاء الاصطناعي التوليدي الذي يعزز العمل الإبداعي دون تقويض الأشخاص الذين يخلقونه؟ كيف يمكنك جعل هذه الأنظمة قابلة للاستخدام في بيئات الإنتاج حيث يهم اليقين القانوني مثل جودة الإخراج؟ هذه الأسئلة شكلت كل ما بنيناه. أسسنا بрайا على مبدأ أن الابتكار والمسؤولية ليسا قوتين متضادتين – يجب أن تتقدما معًا، أو تفشل التكنولوجيا الجميع.

خلفيةك الأكاديمية في الرؤية الحاسوبية وبراءات الاختراع التي تزيد عن 50 تعبر بين البحث والابتكار في العالم الحقيقي. كيف أثرت هذه الخبرة على خارطة طريق بрайا الفنية و استراتيجيتها الطويلة الأجل؟

لقد علمتني خلفية البحث التفكير في الأنظمة – كيف ترتبط طبقات مختلفة من الفهم لتشكيل المعنى. تركز العديد من براءات الاختراع الخاصة بي على كيفية تفسير الآلات هيكل المعلومات المرئية، وتترجم هذه العقلية بشكل طبيعي إلى نهج بрайا. ننظر إلى إنشاء الصور على أنه عملية تركيبية، وليست عشوائية.

لكن براءات الاختراع لا تتعلق فقط بالتكنولوجيا – إنها تتعلق بتقنيات ربط التكنولوجيا بالواقع التجاري. جزء كبير من محفظة براءات الاختراع الخاصة بنا يعالج طبقة الأنظمة: كيف يمكنك إنشاء إطارات الإسناد التي تربط المحتوى المولَّد بالمراجع الخاصة به؟ كيف يمكنك بناء نماذج اقتصادية تتعويض المبدعين على نطاق واسع؟ هذه ليست مشاكل تقنية خالصة – إنها أسئلة البنية والتخطيط التجاري وتصميم السوق.

شكلت هذه الرؤية الأوسع استراتيجيتنا الطويلة الأجل. الابتكار ليس فقط عن تقدم النماذج الأساسية. إنه عن إنشاء هياكل اقتصادية جديدة، وإطارات عقدية جديدة، وطرق جديدة للصناعة للعمل بشكل مستدام. الهدف ليس فقط إنتاج نتائج أفضل – إنه لفهم كيفية تشكيل هذه النتائج، ومن ساهم فيها، وكيف يتدفق القيمة من خلال النظام. هذا هو حيث يلتقي العلم بالتفكير في المنتج بالهندسة التجارية.

أعلنت بрайا مؤخرًا عن FIBO، الذي يُوصف بأنه أول نموذج أساسي مرئي محدد للذكاء الاصطناعي التوليدي للمهنيين. ما الذي يجعله مختلفًا بشكل أساسي عن الأنظمة الحالية للذكاء الاصطناعي المرئي؟

اسمه نفسه يُشير إلى نهجنا: FIBO هو اختصار لفيبوناتشي، التسلسل الرياضي الشهير بخصائصه الجمالية الداخلية. النسبة الذهبية – النسبة بين الأرقام المتتالية في تسلسل فيبوناتشي – تظهر في ما نراه على أنه أبعاد مرئية جميلة عبر الرياضيات والفن المرئي والهندسة والمعمارية. يمكنك رؤيته في أبعاد بانثيون روما وبيت الأبيض، وفي الجسم البشري والوجه كما هو موضح في رسم ليوناردو دا فينشي للرجل الفيتروفي، وعبر الأشكال الطبيعية. هذا الارتباط بين الهيكل الرياضي والجمال المرئي هو ما يجسده FIBO: الجودة الجمالية من خلال الهيكل الشكلي.

FIBO يغير العلاقة بين النية والإخراج. معظم أنظمة الذكاء الاصطناعي المرئي تدرج طبقات التفسير بين ما تريده وما تحصل عليه – تكتب تعليمات، وترجمها النموذج من خلال مشفرات اللغة، وتضيعها من خلال الضوضاء، وتأمل أن تكون النتيجة مطابقة لرؤيتك. يزيل FIBO هذه الطبقات تمامًا.

لقد جعلنا الذكاء الاصطناعي المرئي يعمل مثل الكود – كل عنصر إبداعي يصبح قابلًا للتحرير والإعادة. هذا هو اختراق للprofessionals الذين ظلوا عالقين مع لعبة التلميح. هذا يعني أن كل عنصر، إضاءة، اتجاه الكاميرا، لوحة الألوان، التكوين، الأسلوب، يوجد كخاصية قابلة للتحكم بشكل صريح. يسمح هيكل JSON بتعديل المعلمات التي تريدها فقط، مع قفل كل ما تبقى. يمكنك تعديل الإضاءة دون التأثير على التكوين، أو تغيير زاوية الكاميرا دون تغيير لوحة الألوان. النظام يفعل بالضبط ما ت指定ه، كل مرة.

نحن ننظم مسابقات هاكاثون مع فال وNVIDIA لإظهار للمطورين كيف يعمل التوليد المحدد في الواقع. هيكل JSON نفسه يفتح الصندوق الأسود – يمكنك رؤية بالضبط ما المعلمات التي أنتجت صورة، وإعادة إنتاجها، وتعديلها بدقة. إنه نموذج مختلف تمامًا عن هندسة التلميح.

النظم التقليدية للنص إلى الصورة تعتمد على تلميحات متزايدة التعقيد لتحقيق نتائج محددة. كيف يحل نهج FIBO مشكلة تعقيد التلميح؟

هناك مشكلتان يجب حلها. أولًا، مشاكل عشوائية التلميح موجودة لأن النماذج الحالية تحاول استخراج نية المستخدم وإضافة ما يعتقد النموذج أنه جميل أو مرغوب فيه من خلال تعزيز التلميح. ثانيًا، عدم وجود سيطرة على الخصائص المهنية.

FIBO يقلب هذا. تم تدريب النموذج على أكثر من 1000 كلمة من الوصف المرئي لكل صورة، والذي يشفر أكثر من 100 سمة مستقلة في صيغة JSON. لم يتم بعد المعالجة أو استخراجها – كان هذا هو الشكل الأصلي للتدريب. لأن كل سمة تمثل هيكليًا من البداية، تعلم النموذج التكوين المرئي كعاملات قابلة للتحكم بدلاً من تفسير غامض للنص.

ما يعنيه هذا في الممارسة: يمكنك تحديد النية الجمالية من خلال الهيكل، لا من خلال “تلميح والصلاة”. مستوى محاذاة النص إلى الصورة هو أعلى بشكل أساسي لأن هناك لا طبقة ترجمة. أنت تتحدث لغة النموذج الأصلية. وبسبب أن الخصائص مستقلة، يمكنك التكرار على الإضاءة دون تغيير التكوين، أو تعديل لوحة الألوان دون التأثير على الأسلوب. السيطرة هي جراحية.

FIBO يطرح سير عمل “تعديل” يختلف عن التوليد التكراري النمطي. كيف يتغير هذا نهج المهنيين تجاه الإنتاج المرئي؟

معظم سير العمل التوليدي هي تكرارية بطريقة محبطة – تنتج، وتقيم، وتعدل تلميحك، وتنتج مرة أخرى، وتأمل أن تكون أقرب. هذا “تلميح والصلاة”. أنت لا تعرف أبدًا ما تغير أو لماذا.

Refine يتحول التجربة إلى تصميم. أنت لا تخمين ما قد يفعله تلميح جديد – أنت توجيه الصورة، بالضبط كما تفعل مع ضبط الضوء أو اللون في أدوبي فوتوشوب. لا تحتاج إلى العمل على مستوى JSON مباشرة – نموذج لغة رؤية يعدل JSON من أجلك بناءً على تعليمات اللغة الطبيعية. لكن JSON نفسه يسمح لك بفهم بالضبط ما حدث. أنت تنتج صورة أولية، وتفحص تمثيلها JSON، وتحدد الخصائص التي تحتاج إلى تعديل – ربما الإضاءة شديدة القوة، أو زاوية الكاميرا تحتاج إلى تغيير 15 درجة – وتعدل فقط هذه القيم من خلال تعليمات بسيطة. كل شيء آخر يبقى مقفلًا.

هذا الهيكل مثالي للعمليات الوكيلية. يمكن للوكيل تحليل JSON، وفهم حالة الصورة الكاملة، وإجراء تعديلات مستهدفة، وشرح منطقه – كل ذلك لأن المعلمات صريحة وقابلة للتفسير. الوكيل لا يخمين ما قد يفعله تغيير التلميح – إنه يجري تعديلات دقيقة على خصائص معروفة.

هذا يزيل عدم اليقين الذي أبقى المحترفين متشككين في الذكاء الاصطناعي التوليدي. عندما يمكنك رؤية مجموعة المعلمات الكاملة التي أنتجت صورة، وفهم ما تتحكم فيه كل خاصية، وتعديل الخصائص الفردية بثقة أن لا شيء آخر سيتغير، أنت لا تختبر – أنت تصمم. وضوح JSON يفتح الصندوق الأسود تمامًا.对于 سير العمل الإنتاجية المهنية حيث يهم الاستمرارية والسيطرة أكثر من الابتكار، هذا هو الفرق بين أداة إبداعية واداة إنتاج.

أصبحت أخلاقيات البيانات وأمان العلامة التجارية محورًا مركزيًا للذكاء الاصطناعي في الشركات. كيف يضمن استخدام بрайا لبيانات مُICENSE وواضحة حقوقها كلاً من الامتثال واحترام حقوق المبدعين؟

من اليوم الأول، قررنا أن إذا كانت الصناعة ستنمو بشكل مسؤول، فلا بد أن تبدأ بسلامة البيانات. كل صورة تدرب FIBO عليها تأتي من مصادر مُICENSE وواضحة حقوقها من خلال شراكات مع قادة المحتوى مثل جيتي إيميدج وإنفاتو. هذا يضمن أن نماذجنا متوافقة و عادلة. نرى احترام المبدعين كجزء من سلسلة القيمة، لا كقيود. تستفيد الشركات من هذه السلامة لأنها توفر لهم اليقين القانوني والاخلاقي الذي يحتاجونه للاستفادة بثقة.

تم تدريب FIBO على تعلم أسلوب كل شركة فريد و هويته. كيف يتغير هذا القدرة نهج العلامات التجارية العالمية لإنشاء المحتوى والتوافق المرئي؟

العلامات التجارية لها لغة مرئية فريدة – طريقة فريدة للتعبير عن العواطف والثقة والغرض من خلال التصميم. يمكن لـFIBO تعلم هذه اللغة. بمجرد التدريب، يولد محتوى مرئي يعكس نفس التكوين والطابع والجو الذي يحدد هوية العلامة التجارية. هذا يتحول الذكاء الاصطناعي من مساعد إبداعي إلى مورد للعلامة التجارية. يساعد الفرق العالمية على الإبداع بالاتساق دون فقدان الفردية.

مع اعتماد المبتكرين في وقت مبكر لاستخدام FIBO لتأتمة تصميم التعبئة وصور المنتج والحملات الإبداعية، ما هي النتائج أو الملاحظات التي لفتت انتباهك أكثر حتى الآن؟

التغيير في العقلية. الفرق بدأت في معاملة الذكاء الاصطناعي كجزء من أدواتها التشغيلية، لا كأداة جديدة. علامة تجارية عالمية تنتج متغيرات إقليمية لأغلفة التعبئة بسرعة أكبر مع الحفاظ على الاتساق مع العلامة التجارية. وكالة إبداعية رائدة تسريع تطوير الحملة بعشر مرات من خلال التكرار الخاضع للسيطرة. لكن الإشارة الحقيقية تأتي من المديرين الإبداعيين الذين يخبروننا بأنهم يشعرون بالسيطرة أكثر؛ أن النموذج يفهم نيتتهم المرئية. هذا هو نقطة تحول للصناعة.

تضع بрайا نفسها كقائدة في الذكاء الاصطناعي الأخلاقي والقابل للسيطرة. كيف ترى هذه الفلسفة تشكيل اللوائح أو المعايير الصناعية المستقبلية للذكاء الاصطناعي المرئي؟

لقد وصلنا إلى مرحلة حيث يحتاج الابتكار والحوكمة إلى التحرك معًا. التنظيم ليس عقبة، بل البنية التحتية لنمو مستدام. نهجنا – بيانات شفافة، مخرجات محددة، أصول واضحة – يتوافق بشكل وثيق مع ما تطلب السياسات الناشئة. أعتقد أننا سوف نرى معايير جديدة تؤثر على تتبع الأصول، وشرح، وحماية الحقوق. فلسفة بрайا هي مساعدة في تعريف هذه المعايير من خلال الممارسة، لا через بيانات السياسة.

متطلعًا إلى الأمام، ماذا يأتي بعد FIBO لبрайا؟ هل تتوقع توسيع نطاق العمل إلى الذكاء الاصطناعي متعدد الوسائط الذي يجمع بين الصور والفيديو والجاذبية في إطار قابل للسيطرة واحد؟

نعم. نفس المبادئ التي تعمل FIBO – الهيكل، والسيطرة، والشفافية – تطبق عبر جميع المجالات المرئية. نحن نستكشف بالفعل التوسعات في الفيديو والجاذبية، حيث يمكن أن يأتي التحديد بالموثوقية نفسها التي تتمتع بها الشركات الآن مع الصور. هدفنا بسيط: جعل إبداع الذكاء الاصطناعي قابلًا للسيطرة وأمنًا مثل كتابة الكود – وتمديد ذلك عبر كل الوسائط المرئية، من الصور إلى الفيديو إلى الجاذبية.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يمكنهم زيارة بрайا.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.