الذكاء الاصطناعي
أداة جديدة مدعومة بالذكاء الاصطناعي تمكن من تحرير الفيديو من وثائق نصية مواضيعية

فريق من باحثي العلوم الحاسوبية من جامعة تسينغهوا وجامعة بيهاند في الصين، و IDC هرتسليا في إسرائيل، وجامعة هارفارد قد أنشأ مؤخرًا أداة تُنشئ فيديوهات محررة بناءً على وصف نصي ومستودع من مقاطع فيديو.
تُسجل كميات هائلة من لقطات الفيديو كل يوم من قبل مصورين محترفين، ومحترفين، وأشخاص عاديين. ومع ذلك، فإن تحرير هذا الفيديو إلى عرض يعني شيئًا ما لا يزال استثمارًا مكلفًا في الوقت، وغالبًا ما يتطلب استخدام أدوات تحرير معقدة يمكنها تعديل اللقطات الخام. وقد طوّر فريق الباحثين الدولي مؤخرًا أداة تُقبل وصفات نصية مواضيعية وتُنشئ فيديوهات بناءً عليها. يمكن للأداة فحص مقاطع الفيديو في المستودع واختيار المقاطع التي تتوافق مع النص المدخَل الذي يصف القصة. والهدف هو أن تكون الأداة سهلة الاستخدام وقوية بدرجة كافية لإنتاج فيديوهات جيدة دون الحاجة إلى مهارات تحرير فيديو مكثفة أو برامج تحرير فيديو مكلفة.
في حين أن منصات تحرير الفيديو الحالية تتطلب معرفة بتقنيات تحرير الفيديو، فإن الأداة التي أنشأها الباحثون تتيح للمبتدئين في إنشاء فيديو إنشاء تركيبات تروي قصصًا بطريقة أكثر طبيعية و直觉ية. وسمّيت “كتاب فيديو” من قبل منشئيها، تتيح للأداة للمستخدمين تحرير الفيديوهات ببساطة عن طريق تحرير النص الذي يرافق الفيديو. إذا حذف المستخدم نصًا أو أضاف نصًا أو نقل جملًا، فإن هذه التغييرات ستُ反عكَس في الفيديو. ستُقطع أو تُضاف اللقطات المقابلة مع تعديل المستخدم للنص، والفيديو النهائي المُنتج مُصمَم وفقًا لوصف المستخدم.
أوضح أرييل شامير، عميد مدرسة إفي أرازي للعلوم الحاسوبية في IDC هرتسليا، أن أداة “كتاب الفيديو” تتيح للمستخدم التفاعل مع الفيديو chủ yếu من خلال النص، باستخدام تقنيات معالجة اللغة الطبيعية لمطابقة لقطات الفيديو بناءً على المعنى الدلالي المُقدم. ثم يُستخدم خوارزمية تحسين لتركيب الفيديو عن طريق قص وتبديل اللقطات. وتتيح الأداة للمستخدمين أيضًا تجربة أسلوبات بصرية مختلفة، وضبط كيفية عرض المشاهد باستخدام معاني فيلمية محددة سوف تسرع أو تبطئ الإجراء، أو تجعل المزيد أو الأقل من القص.
تختار البرنامج اللقطات المحتملة بناءً على جمالها. يعتبر البرنامج كيفية إطار اللقطات، والتركيز عليها، والضوء عليها من أجل تحديد جمالها. وستختار الأداة اللقطات التي تركز بشكل أفضل، بدلاً من تلك التي تكون غامضة أو غير مستقرة، وستفضل أيضًا اللقطات التي تُضاء جيدًا. وفقًا لمُنشئي “كتاب الفيديو”، يمكن للمستخدم تقديم الفيديو المُنشئ في أي وقت ومعاينةه مع سرد صوتي يصف النص المستخدم لتحديد اللقطات.
وفقًا لفريق البحث، أظهرت تجربتهم أن التقنيات الرقمية التي تجمع بين جوانب الرؤية الحاسوبية ومعالجة اللغة الطبيعية يمكن أن تساعد المستخدمين في العمليات الإبداعية مثل تحرير الفيديوهات.
قال شامير لتقني إكسبلور: “يعكس عملنا إمكانية المطابقة البصرية الدلالية التلقائية في تحرير الحاسوب القائم على المعاني، ويوفر طريقة ذكية لجعل إنشاء الفيديو أكثر سهولة لغير المحترفين”.
جرب الباحثون أداتهم على مستودعات فيديو مختلفة مع وثائق نصية مواضيعية. وأُجريت دراسات المستخدمين وتقييم كمي لتحليل نتائج التجربة. ووجدت نتائج دراسات المستخدمين أن غير المحترفين يمكنهم في بعض الأحيان إنتاج فيديوهات محررة عالية الجودة باستخدام الأداة أسرع من المحترفين الذين يستخدمون برامج تحرير إطارية. كما ذكرت تقني إكسبلور، سيقدم الفريق عملهم بعد بضعة أيام في مؤتمر SIGGRAPH Asia الذي سيُقام في أستراليا. كما أن هناك كيانات أخرى تستخدم الذكاء الاصطناعي لتعزيز تحرير الفيديو. تعمل أدوبي أيضًا على مُكبراتها الخاصة القائمة على الذكاء الاصطناعي لبرنامج بريميير برو، منصتها للتحرير. تساعد الأداة الناس على ضمان ألا تقطع التغييرات في نسبة العرض أجزاء مهمة من الفيديو.












