بعد النجاح الفيروسي الذي حققه ChatGPT، بدأ OpenAI الآن في عالم الفيديو

جالب الأخبار15 فبراير,2024

56 2 دقائق

امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة كجزء من مقطع فيديو تم إنشاؤه بواسطة نموذج Sora AI من OpenAI.

OpenAI

تعمل شركة OpenAI، التي أصبحت سائدة العام الماضي بفضل شعبية ChatGPT، على جلب تكنولوجيا الذكاء الاصطناعي الخاصة بها إلى الفيديو.

قدمت الشركة يوم الخميس سورا، نموذج الذكاء الاصطناعي التوليدي الجديد. يعمل Sora بشكل مشابه لأداة الذكاء الاصطناعي لإنشاء الصور من OpenAI، DALL-E. يقوم المستخدم بكتابة المشهد المطلوب وسيقوم Sora بإرجاع مقطع فيديو عالي الدقة. يستطيع Sora أيضًا إنشاء مقاطع فيديو مستوحاة من الصور الثابتة، وتوسيع مقاطع الفيديو الموجودة أو ملء الإطارات المفقودة.

يمكن أن يكون الفيديو هو الحدود التالية للذكاء الاصطناعي التوليدي الآن بعد أن شقت روبوتات الدردشة ومولدات الصور طريقها إلى عالم المستهلكين والأعمال. في حين أن الفرص الإبداعية ستثير حماسة المتحمسين للذكاء الاصطناعي، فإن التقنيات الجديدة تثير مخاوف خطيرة بشأن المعلومات المضللة مع اقتراب الانتخابات السياسية الكبرى في جميع أنحاء العالم. ارتفع عدد التزييف العميق الناتج عن الذكاء الاصطناعي بنسبة 900% على أساس سنوي، وفقًا لبيانات من شركة Clarity للتعلم الآلي.

مع Sora، تتطلع OpenAI إلى التنافس مع أدوات الذكاء الاصطناعي لإنشاء الفيديو من شركات مثل ميتا و جوجلالذي أعلن لوميير الشهر الماضي. تتوفر أدوات الذكاء الاصطناعي المماثلة من الشركات الناشئة مثل Stability AI، التي لديها منتج يسمى Stable Video Diffusion. أمازون أصدرت أيضًا إنشاء باستخدام Alexa، وهو نموذج متخصص في إنشاء محتوى رسوم متحركة قصير للأطفال يعتمد على السرعة.

يقتصر Sora حاليًا على إنشاء مقاطع فيديو مدتها دقيقة أو أقل. OpenAI، بدعم من مايكروسوفتجعلت تعدد الوسائط – الجمع بين إنشاء النصوص والصور والفيديو – هدفًا في جهودها لتقديم مجموعة أوسع من نماذج الذكاء الاصطناعي.

وقال براد لايت كاب، المدير التنفيذي للعمليات في OpenAI، لـ CNBC: “إن العالم متعدد الوسائط”. في نوفمبر. “إذا فكرت في الطريقة التي نتعامل بها كبشر مع العالم ونتفاعل معه، فنحن نرى الأشياء ونسمعها ونقول أشياء – العالم أكبر بكثير من النص. لذلك، بالنسبة لنا، كان يبدو دائمًا غير مكتمل بالنسبة لنا النص والكود هما الوسيلة الوحيدة، والواجهات الوحيدة التي يمكن أن نمتلكها لمعرفة مدى قوة هذه النماذج وما يمكنها فعله.”

لم يكن Sora متاحًا حتى الآن إلا لمجموعة صغيرة من مختبري السلامة، أو “الفريق الأحمر”، الذين يختبرون النموذج بحثًا عن نقاط الضعف في مجالات مثل المعلومات الخاطئة والتحيز. ولم تصدر الشركة أي عروض توضيحية عامة تتجاوز 10 عينات متاحة على موقعها الإلكتروني، وقالت إن الورقة الفنية المصاحبة لها ستصدر في وقت لاحق يوم الخميس.

قالت OpenAI أيضًا إنها تقوم ببناء “مصنف اكتشاف” يمكنه التعرف على مقاطع الفيديو التي تم إنشاؤها بواسطة Sora، وأنها تخطط لتضمين بيانات وصفية معينة في مخرجاتها والتي من شأنها أن تساعد في تحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. انها ال نفس النوع من البيانات الوصفية التي تتطلع Meta إلى استخدامها لتحديد الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي في هذا العام الانتخابي.

Sora هو نموذج للذكاء الاصطناعي المنتشر، مثل ChatGPT، يستخدم بنية Transformer، التي قدمها باحثو Google في ورقة بحثية عام 2017.

وكتبت OpenAI في إعلانها: “إن Sora بمثابة أساس للنماذج التي يمكنها فهم ومحاكاة العالم الحقيقي”.

يشاهد: OpenAI على طريق تحقيق “اختراق تكنولوجي حقيقي”