قام باحثون في شركة إنفيديا Nvidia بتدريب نظام ذكاء اصطناعي لتوفير فيديوهات الحركة البطيئة بشكل دقيق، وذلك عبر إنشاء إطارات إضافية وسيطة لملء فجوات الفيديوهات، بحيث أن تأثير الحركة البطيئة يعد واحدًا من تأثيرات الفيديو التي يصعب تقليديها، ويأتي هذا النظام مع تحويل الشركة تركيزها خلال السنوات الأخيرة نحو تطبيقات الذكاء الاصطناعي، بحيث أن أحد أحدث مشاريع الأبحاث في إنفيديا يعمل على تحويل الفيديوهات العادية إلى فيديوهات حركة بطيئة لا يمكن تمييزها عن الفيديوهات الحقيقية.
وتتعلق مسألة التقاط فيديوهات حركة بطيئة باستخدام عدد كبير من الإطارات في الثانية، إذ في حال لم يتم تسجيل ما يكفي، فسوف تصبح الفيديوهات متقطعة وغير قابلة للتبديل بمجرد إبطاء الفيديو، وهو ما عملت الشركة على تغييره من خلال استخدام الذكاء الاصطناعي لملء إطارات إضافية، بحيث قد تسهل الأبحاث الجديدة إمكانية التقاط فيديوهات حركة بطيئة على الهاتف الذكي.
ويمكن لنظام التعلم العميق العامل بواسطة وحدات معالجة الرسوميات التابعة للشركة Tesla V100 تحويل ملفات الفيديو الملتقطة بمعدل 30 إطار في الثانية إلى مقاطع فيديو ذات حركة بطيئة عالية الجودة، حيث استخدم الفريق ما يزيد عن 300 ألف إطار فيديو فردي ضمن 11 ألف مقطع فيديو ملتقط بمعدل 240 إطار في الثانية لتعليم نظام التعلم العميق كيفية التعرف على الإطارات الإضافية والتنبؤ بها بدقة عالية.
ويعمل نظام الذكاء الاصطناعي الجديد من خلال إطارين مختلفين ثم ينشئ لقطات وسيطة من خلال تتبع حركة الأشياء من إطار إلى آخر، وبالرغم من أن النتيجة ليست كما هي في الواقع أو مشابهة لإمكانية تخيل اللقطات مثلما يفعل دماغ الإنسان، لكنها تنتج نتائج دقيقة ليست مثالية، وتحتاج العملية إلى تحسينات قبل إمكانية استخدامها تجاريًا، ولكن بمجرد تحسينها، يمكن استخدامها لإضافة تأثيرات بطيئة الحركة على لقطات الهاتف الذكي بعد تسجيلها.
وكتب الباحثون في ورقة البحث العلمي “هناك العديد من اللحظات التي لا تنسى في حياتك والتي قد ترغب في تسجيلها بتقنية الحركة البطيئة لأنه من الصعب رؤيتها بوضوح من خلال العين البشرية مثل المرة الأولى التي يمشي فيها الطفل، وفي حين أنه من الممكن التقاط مقاطع فيديو بمعدل 240 إطار في الثانية باستخدام الهاتف الذكي، إلا أن تسجيل كل شيء بمعدل إطارات عالية أمر غير عملي، حيث أنه يتطلب ذاكرة كبيرة وكثيفة الاستخدام للأجهزة المحمولة، ولهذه الأسباب وغيرها، فإنه من الأهمية بمكان إنشاء فيديوهات بطيئة الحركة من خلال مقاطع الفيديو الحالية”.
وكان على الباحثين تدريب نظام التعلم العميق من أجل التعامل مع أنواع محددة من اللقطات، إذ من أجل إبطاء فيديو لسيارة تنزلق عبر الماء، توجب عليهم أولًا تدريب النظام على لقطات مماثلة، وقد يحد ذلك من مدى إمكانية استخدام نسخة تجارية من البحث للتعامل مع فيديوهات الحركة البطيئة المستهدفة.
وللتوضيح فإن عملية تحويل مقطع فيديو مدته أربع ثوان مسجل بمعدل 30 إطار في الثانية إلى مقطع فيديو حركة بطيئة يحتاج إلى إنشاء 210 إطار إضافي لمزجها وتحريكها قبل وبعد الإطارات الأصلية من أجل إنشاء التأثير المزيف للحركة البطيئة، وبالرغم من ذلك فإن هذا الأمر لا يكفي للحفاظ على الحركة بشكل سلس كما تظهر فيديوهات الحركة البطيئة الأصلية، ولهذا السبب تظهر فيديوهات الحركة البطيئة الرياضة أنها أقل بكثير من الناحية السينمائية بالمقارنة مع الأفلام.
ويعمل نظام التعلم العميق الجديد من إنفيديا على إنتاج لقطات سلسة يتم إعادة إنتاجها بطرية صحيحة بين الإطارات الحقيقية، ويتمثل نهج الفريق في استخدام أكبر عدد ممكن من الإطارات الوسيطة اللازمة للتشغيل السلس، مما قد يؤدي إلى إلغاء الحاجة إلى معدل إطارات مرتفع غير ضروري واستخدام عالي للبيانات أثناء التصوير.
تجدر الإشارة إلى أن مثل هذه التقنية لا يمكنها إنتاج عدد لا حصر له من الإطارات الوسيطة، إذ يصبح من المستحيل لأجهزة الحاسب بدون وجود بيانات أن تتنبأ بحركة وسلوك كائنات العالم الحقيقي، ومع ذلك يمكن لنظام إنفيديا إنتاج ما يصل إلى سبع إطارات وسيطة، وهي أكثر من كافية لخلق حركة بطيئة، وتبدو تقنية إنفيديا أسرع وأسهل من الأساليب الحالية لتقليد لقطات الحركة البطيئة، ومن المتوقع أن تظهر ميزات مثل هذه ضمن الهواتف الذكية القادمة.