مقابلات
ليور حكيم، المؤسس المشارك والمدير التقني لشركة Hour One – سلسلة المقابلات

ليور حكيم، المؤسس المشارك والمدير التقني لشركة Hour One، شركة رائدة في صناعة البشر الافتراضيين للاتصالات المرئية المهنية. يتميز البشر الافتراضيون المتحركون، الذين تم تصميمهم حصريًا بعد الناس الحقيقيين، بالتعبير الإنساني من خلال النص، مما يتيح للشركات تعزيز رسائلها بسهولة وتنوع غير مسبوقين.
يمكنك مشاركة قصة نشأة Hour One؟
يمكن تتبع أصل Hour One إلى مشاركتي في مجال العملات المشفرة. بعد هذا المشروع، بدأت أفكر في ما سيكون التالي الكبير الذي يمكن أن تستفيد منه الحوسبة السحابية الجماعية، و由于 أن التعلم الآلي كان يكتسب شعبية في التوصيات والتحليلات التنبؤية، كنت أعمل على بعض مشاريع البنية التحتية للتعلم الآلي. من خلال هذا العمل، أصبحت على دراية بأعمال التوليد المبكرة وكنت مهتمًا بشكل خاص bằng GANs في ذلك الوقت. كنت أستخدم جميع الحوسبة التي يمكنني الحصول عليها لاختبار تلك التقنيات الجديدة. عندما عرضت نتائجي على صديق كان لديه شركة في هذا المجال، قال لي أنني يجب أن ألتقي مع Oren. عندما سألته لماذا، قال لي أننا ربما سن停止 تضييع وقتنا وسنضيعه معًا. Oren، شريكي المؤسس والمدير التنفيذي لشركة Hour One، كان مستثمرًا مبكرًا في مجال الذكاء الاصطناعي في ذلك الوقت، وبالرغم من أننا كنا في أماكن مختلفة، كنا ننتقل في نفس الاتجاه، وكان تأسيس Hour One ليكون منزل الإنسان الافتراضي رحلة لا مفر منها.
ما هي بعض خوارزميات التعلم الآلي التي يتم استخدامها، وما هو الجزء الذي يلعب فيه الذكاء الاصطناعي التوليدي دورًا؟
في مجال إنشاء الفيديو، تكون خوارزميات التعلم الآلي حاسمة في كل مرحلة. في مرحلة الكتابة، تقدم نماذج اللغة الكبيرة (LLMs) دعمًا قيّمًا، حيث تقوم بإنشاء أو تحسين المحتوى لضمان قصص جذابة. عند الانتقال إلى الصوت، يتم تحويل النص إلى أصوات حيوية ومؤثرة باستخدام خوارزميات النص إلى الكلام (TTS). عند الانتقال إلى التمثيل المرئي، يأخذ نموذجنا التأسيسي المتعدد الوسائط للبشر الافتراضيين مركز الصدارة. يتم تعزيز هذا النموذج بخوارزميات الشبكات التوليدية المعارضة (GANs) والمتغيرات التوليدية (VAEs)، وهو ماهر في نقل المشاعر واللفظ والتسليم المحدد والمؤثر والصادق. تتحول هذه التقنيات التوليدية النص والصوت إلى تمثيلات مرئية حيوية للبشر الافتراضيين، مما يؤدي إلى إنتاج فيديو واقعي للغاية. تكوين LLMs و TTS و GANs و VAEs ونموذجنا المتعدد الوسائط يجعل الذكاء الاصطناعي التوليدي ليس فقط جزءًا من عملية الإنتاج الفيديوية الحديثة، بل أيضًا العمود الفقري لها.
كيف تتميز Hour One عن مولدي الفيديو التنافسيين الآخرين؟
في Hour One، لا تنبع تميزنا عن مولدي الفيديو الآخرين من اهتمامنا بالمنافسة، بل من فلسفة عميقة تتحكم في نهجنا لجودة المنتج وتصميمه واستراتيجية السوق. مبدأنا التوجيهي هو أن نrioritize دائمًا العنصر البشري، وضمان أن创ATIONSنا تتوافق مع الصدق والعاطفة. نعتز بتقديم أفضل جودة في الصناعة دون أي تنازلات. من خلال استخدام تقنيات التصيير الفيديوي ثلاثي الأبعاد المتقدمة، نقدم لمستخدمينا تجربة سينمائية حقيقية. بالإضافة إلى ذلك، تكون استراتيجيتنا فريدة من نوعها؛ نبدأ بمنتج متقن ثم ن.iter nhanhًا نحو الكمال. هذا النهج يضمن أن عروضنا دائمًا تكون خطوة إلى الأمام، مما يحدد معايير جديدة في توليد الفيديو.
مع خلفيتك الواسعة في وحدات معالجة الرسومات، هل يمكنك مشاركة بعض الأفكار حول منصة NVIDIA الجيل التالي من منصة GH200 Grace Hopper Superchip؟
هي منصة حقيقية تغيير اللعبة. إذا كان يمكن لوحدات معالجة الرسومات (GPU) العمل بشكل فعال من ذاكرة الرام بدون حدوث انسداد في الحساب، فسيتم فتح نسبة نموذجية غير ممكنة في التدريب، ونتيجة لذلك، مرونة مرغوبة في حجمงาน التدريب. افتراضًا أن جميع مخزون GH200 لن يتم استهلاكه بواسطة تدريب LLM، نأمل أن نستخدمه لتقليل تكاليف الاختراع لمعمارياتنا المتعددة الوسائط في المستقبل.
هل هناك أي شريحة أخرى حاليًا على رادارك؟
الهدف الرئيسي هو تقديم محتوى فيديو للمستخدم بأسعار تنافسية. نظرًا للطلب الحالي على وحدات معالجة الرسومات الكبيرة، نحن دائمًا ما نضبط ونجرب أي عرض سحابي لوحدات معالجة الرسومات على مقدمي الخدمات السحابية الرئيسيين. بالإضافة إلى ذلك، نسعى جاهدين ليكون مستقلًا عن المنصة في بعض حمولات العمل لدينا. لذلك، نحن نتابع وحدات معالجة الرسومات (TPU) ووحدات معالجة التطبيقات المخصصة (ASICs) ونحن نتابع أيضًا شركة AMD. في النهاية، سوف نستكشف أي طريق تقليل التكلفة الذي يمكن أن يؤدي إلى تحسين نسبة الفلوبس/الدولار.
ما هو رؤيتك لتطورات المستقبل في توليد الفيديو؟
في غضون 24 شهرًا، لن نتمكن من التمييز بين الإنسان المتحرك والمنقول. هذا سوف يغير الكثير من الأشياء، ونحن هنا في طليعة تلك التطورات.
في الوقت الحالي، معظم الفيديوهات المتحركة هي لأجهزة الكمبيوتر والأجهزة المحمولة، ما الذي يحتاج إلى التغيير قبل أن نحصل على أفاتار و عوالم متحركة واقعية للواقع المعزز وواقع الافتراضي؟
حاليًا، نحن拥有 القدرة على إنشاء أفاتار وعوالم واقعية للواقع المعزز (AR) وواقع الافتراضي (VR). العائق الرئيسي هو التأخير. في حين أن تقديم رسومات عالية الجودة في الوقت الفعلي إلى أجهزة الحافة مثل سماعات AR و VR هو أمر حيوي، فإن تحقيق ذلك بسلاسة يعتمد على عدة عوامل. أولاً وقبل كل شيء، نحن نعتمد على تقدم تصنيع الشريحة لضمان المعالجة الأسرع والأكثر كفاءة. إلى جانب ذلك، تحسين استهلاك الطاقة هو أمر حيوي لضمان استخدام أطول بدون المساس بالتجربة. أخيرًا، نتوقع اختراقات برمجية يمكن أن تصل جسورًا بين التوليد والترndering في الوقت الفعلي. مع تقارب هذه العناصر، سنرى زيادة في استخدام الأفاتار والعوالم الواقعية في منصات AR و VR.
ماذا تتوقع أن يكون الاختراق التالي الكبير في مجال الذكاء الاصطناعي؟
عندما يتعلق الأمر بالاختراق الكبير التالي في مجال الذكاء الاصطناعي، دائمًا ما يكون هناك جو من الحماس والترقب. في حين أنني لفتت إلى بعض التطورات السابقة، ما يمكنني مشاركته هو أننا نعمل حاليًا على عدة ابتكارات رائدة. سأحب أن أتعمق في التفاصيل، ولكن الآن، أ鼓ب الجميع على متابعة إصداراتنا القادمة. مستقبل الذكاء الاصطناعي يحمل وعودًا كبيرة، ونحن سعداء أن نكون في طليعة هذه الجهود الرائدة. انتظر!
هل هناك أي شيء آخر تريد مشاركته حول Hour One؟
يجب عليك بالتأكيد زيارة قناة ديسكورد و API الجديدة، إضافات جديدة إلى منصتنا في Hour One.












