رطم ليئور حكيم، المؤسس المشارك والمدير التنفيذي للتكنولوجيا في Hour One - سلسلة المقابلات - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

مقابلات

ليئور حكيم، المؤسس المشارك والمدير التنفيذي للتكنولوجيا في Hour One – سلسلة المقابلات

mm

تم النشر

 on

ليئور حكيم، المؤسس المشارك والمدير الفني لشركة الساعة الأولى، شركة رائدة في مجال صناعة البشر الافتراضيين لاتصالات الفيديو الاحترافية. تنقل الشخصيات الافتراضية النابضة بالحياة، والتي تم تصميمها حصريًا على غرار أشخاص حقيقيين، تعبيرًا يشبه الإنسان من خلال النص، مما يمكّن الشركات من رفع مستوى رسائلها بسهولة وقابلية للتوسع لا مثيل لها.

هل يمكنك مشاركة قصة نشأة الساعة الأولى؟

يمكن إرجاع أصل الساعة الأولى إلى مشاركتي في مجال العملات المشفرة. بعد هذا المسعى، بدأت أفكر في الشيء الكبير التالي الذي يمكن للحوسبة السحابية الجماعية الاستفادة منه، ومع اكتساب التعلم الآلي شعبية في التوصيات والتحليلات التنبؤية، كنت أعمل على عدد قليل من المشاريع المتعلقة بالبنية التحتية لتعلم الآلة. من خلال هذا العمل، تعرفت على الأعمال التوليدية المبكرة وكنت مهتمًا بشكل خاص بشبكات GAN في ذلك الوقت. كنت أستخدم كل الحوسبة التي أمكنني الحصول عليها لاختبار تلك التقنيات الجديدة آنذاك. عندما عرضت نتائجي على صديق لديه شركة في هذا المجال، أخبرني أنه يجب علي مقابلة أورين. عندما سألته عن السبب، أخبرني أنه ربما سيتوقف كل منا عن إضاعة وقته وإضاعة وقت بعضنا البعض. كان أورين، المؤسس المشارك والرئيس التنفيذي لشركة Hour One، من أوائل المستثمرين في الذكاء الاصطناعي في ذلك الوقت. وبينما كنا نقف في أماكن مختلفة كنا نتحرك في نفس الاتجاه، وكان تأسيس الساعة الأولى لتكون موطن الإنسان الافتراضي رحلة حتمية.

ما هي بعض خوارزميات التعلم الآلي المستخدمة، وأي جزء من العملية هو الذكاء الاصطناعي التوليدي؟

في عالم إنشاء الفيديو، تعد خوارزميات التعلم الآلي مفيدة في كل مرحلة. في مرحلة البرمجة النصية، تقدم نماذج اللغات الكبيرة (LLMs) دعمًا لا يقدر بثمن، حيث تقوم بصياغة المحتوى أو تحسينه لضمان تقديم روايات مقنعة. بينما ننتقل إلى الصوت، تقوم خوارزميات تحويل النص إلى كلام (TTS) بتحويل النص إلى أصوات عضوية وعاطفية. بالانتقال إلى التمثيل المرئي، يحتل النموذج التأسيسي متعدد الوسائط الخاص بنا للإنسان الافتراضي مركز الصدارة. هذا النموذج، المعزز بشبكات الخصومة التوليدية (GANs) وأجهزة التشفير التلقائي المتغيرة (VAEs)، بارع في نقل المشاعر السياقية، والنطق، والتسليم المفصل والآسر والأصيل. تعمل مثل هذه التقنيات التوليدية على تحويل الإشارات النصية والصوتية إلى صور واقعية للبشر الافتراضيين، مما يؤدي إلى مخرجات فيديو واقعية للغاية. إن تنسيق LLMs وTTS وGANs وVAEs ونموذج الوسائط المتعددة الخاص بنا يجعل الذكاء الاصطناعي التوليدي ليس مجرد جزء من إنتاج الفيديو الحديث، بل العمود الفقري له.

كيف تميز شركة Hour One نفسها عن شركات إنتاج الفيديو المنافسة؟

في Hour One، لا ينبع تميزنا عن غيرنا من مولدات الفيديو من انشغالنا بالمنافسة، بل من فلسفة عميقة الجذور تحكم نهجنا تجاه الجودة، وتصميم المنتج، واستراتيجية السوق. المبدأ التوجيهي لدينا هو إعطاء الأولوية دائمًا للعنصر البشري، مما يضمن أن تكون إبداعاتنا ذات صدى مع الأصالة والعاطفة. نحن نفخر بتقديم أفضل جودة في الصناعة دون أي تنازلات. من خلال الاستفادة من عرض الفيديو ثلاثي الأبعاد المتقدم، فإننا نوفر لمستخدمينا تجربة سينمائية حقيقية. علاوة على ذلك، فإن استراتيجيتنا تتمتع برأي فريد من نوعه؛ نبدأ بمنتج مصقول ثم نكرره بسرعة نحو الكمال. ويضمن هذا النهج أن تكون عروضنا دائمًا خطوة إلى الأمام، وتضع معايير جديدة في مجال إنشاء الفيديو.

بفضل خلفيتك الواسعة في وحدات معالجة الرسومات، هل يمكنك أن تشاركنا بعض الأفكار حول وجهات نظرك حولها منصة NVIDIA للجيل القادم GH200 Grace Hopper Superchip?

لقد غيرت بنية Grace Hopper قواعد اللعبة حقًا. إذا تمكنت وحدة معالجة الرسومات من العمل بفعالية من ذاكرة الوصول العشوائي (RAM) الخاصة بمضيفها دون اختناق العمليات الحسابية تمامًا، فإنها تفتح نسب النموذج/المسرّع المستحيلة حاليًا في التدريب، ونتيجة لذلك، المرونة المطلوبة كثيرًا في أحجام مهام التدريب. بافتراض أن مخزون GH200 بالكامل لن يتم ابتلاعه من خلال تدريب LLM، فإننا نأمل في استخدامه لتقليل تكاليف النماذج الأولية بشكل كبير لبنياتنا متعددة الوسائط في المستقبل.

هل هناك أي شرائح أخرى موجودة حاليًا على رادارك؟

هدفنا الرئيسي هو تزويد المستخدم بمحتوى فيديو بسعر تنافسي. نظرًا للطلب على وحدات معالجة الرسومات ذات الذاكرة الكبيرة في الوقت الحالي، فإننا نعمل باستمرار على تحسين وتجربة أي عرض سحابي لوحدة معالجة الرسومات على أفضل موفري الخدمات السحابية. علاوة على ذلك، فإننا نسعى جاهدين لنكون مستقلين جزئيًا على الأقل عن النظام الأساسي في بعض أعباء العمل لدينا. وبالتالي، فإننا نتطلع إلى وحدات TPU وغيرها من أجهزة ASIC، كما نولي اهتمامًا وثيقًا لـ AMD. في نهاية المطاف، سيتم استكشاف أي مسار تحسين يعتمد على الأجهزة والذي يمكن أن يؤدي إلى نسبة FLOPs/$ أفضل.

ما هي رؤيتك للتطورات المستقبلية في مجال إنتاج الفيديو؟

خلال 24 شهرًا لن نكون قادرين على التمييز بين الإنسان المولود والآخر المأسور. وهذا من شأنه أن يغير الكثير من الأشياء، ونحن هنا في طليعة تلك التطورات.

في الوقت الحالي، معظم مقاطع الفيديو التي تم إنشاؤها مخصصة لأجهزة الكمبيوتر والأجهزة المحمولة، ما الذي يجب تغييره قبل أن يكون لدينا صور رمزية وعوالم تم إنشاؤها بشكل واقعي لكل من الواقع المعزز والواقع الافتراضي؟

اعتبارًا من الآن، نحن نمتلك القدرة على إنشاء صور رمزية وعوالم واقعية لكل من الواقع المعزز (AR) والواقع الافتراضي (VR). العائق الرئيسي هو الكمون. في حين أن تسليم رسومات عالية الجودة في الوقت الفعلي إلى الأجهزة المتطورة مثل سماعات الواقع المعزز والواقع الافتراضي أمر حيوي، فإن تحقيق ذلك بسلاسة يعتمد على عدة عوامل. قبل كل شيء، نحن نعتمد على التطورات في تصنيع الرقائق لضمان معالجة أسرع وأكثر كفاءة. إلى جانب ذلك، يعد تحسين استهلاك الطاقة أمرًا بالغ الأهمية لضمان الاستخدام لفترة أطول دون المساس بالتجربة. وأخيرًا وليس آخرًا، نتوقع حدوث اختراقات برمجية يمكنها سد الفجوة بين الإنشاء والعرض في الوقت الفعلي بكفاءة. ومع اجتماع هذه العناصر معًا، سنشهد طفرة في استخدام الصور الرمزية والبيئات الواقعية عبر منصات الواقع المعزز والواقع الافتراضي.

ماذا تتوقع أن يكون الإنجاز الكبير التالي في الذكاء الاصطناعي؟

عندما يتعلق الأمر بالإنجاز المهم التالي في مجال الذكاء الاصطناعي، هناك دائمًا جو من الإثارة والترقب. على الرغم من أنني أشرت إلى بعض التطورات سابقًا، إلا أن ما يمكنني مشاركته هو أننا نعمل بنشاط على العديد من الابتكارات الرائدة في هذه اللحظة بالذات. أود الخوض في التفاصيل، لكن في الوقت الحالي، أشجع الجميع على مراقبة إصداراتنا القادمة. يحمل مستقبل الذكاء الاصطناعي وعودًا هائلة، ويسعدنا أن نكون في طليعة هذه الجهود الرائدة. ابقوا متابعين!

هل هناك أي شيء آخر ترغب في مشاركته حول الساعة الأولى؟

يجب عليك بالتأكيد التحقق من قناة Discord الخاصة بنا وواجهة برمجة التطبيقات (API)، والإضافات الجديدة إلى عرض منصتنا على الساعة الأولى.

شريك مؤسس في unite.AI وعضو في مجلس تكنولوجيا فوربس ، أنطوان أ المستقبلي من هو شغوف بمستقبل الذكاء الاصطناعي والروبوتات.

وهو أيضًا مؤسس Securities.io، موقع ويب يركز على الاستثمار في التكنولوجيا الثورية.