الصين ديبسيك لديها بعض ادعاءات منظمة العفو الدولية الكبيرة ؛ ليس كل الخبراء مقتنعين
شركة الذكاء الاصطناعي الصينية ديبسيك الأسواق الراكية هذا الأسبوع مع المطالبات ، يتفوق نموذج الذكاء الاصطناعي الجديد على Openai ويكلف جزءًا بسيطًا من السعر.
أثارت التأكيدات – على وجه التحديد أن نموذج اللغات الكبير في Deepseek 5.6 مليون دولار فقط للتدريب – أثارت مخاوف بشأن مبالغ تواتر العيان التي ينفقها عمالقة التكنولوجيا حاليًا على البنية التحتية الحاسوبية المطلوبة لتدريب أعباء عمل AI المتقدمة وتشغيلها.
يخشى المستثمر من تأثير ديبسيك التخريبي تمحى ما يقرب من 600 مليار دولار من القيمة السوقية في NVIDIA الاثنين-أكبر انخفاض ليوم واحد لأي شركة في تاريخ الولايات المتحدة.
لكن ليس الجميع مقتنعين بادعاءات ديبسيك.
طلبت CNBC خبراء الصناعة عن آرائهم حول Deepseek ، وكيف يقارن فعليًا بـ Openai ، منشئ Chatbot Viral ChatGpt الذي أثار ثورة الذكاء الاصطناعي.
ما هو ديبسيك؟
في الأسبوع الماضي ، أصدر Deepseek R1 ، نموذج التفكير الجديد أن المنافسين Openai’s O1. نموذج التفكير هو نموذج لغة كبير يحطم يطالب بأسفل إلى قطع أصغر وينظر في مقاربات متعددة قبل إنشاء استجابة. إنه مصمم لمعالجة المشكلات المعقدة بطريقة مماثلة للبشر.
تأسست Deepseek في عام 2023 من قبل Liang Wenfeng ، المؤسس المشارك لصندوق التحوط الكمي الذي يركز على الذكاء الاصطناعى ، للتركيز على نماذج اللغة الكبيرة والوصول إلى الذكاء العام الاصطناعي ، أو AGI.
يشير Agi كمفهوم فضفاض إلى فكرة الذكاء الاصطناعي الذي يساوي أو يتجاوز الفكر الإنساني في مجموعة واسعة من المهام.
الكثير من التكنولوجيا وراء R1 ليست جديدة. ومع ذلك ، فإن ما يلفت الانتباه هو أن Deepseek هو أول من نشره في نموذج AI عالي الأداء مع-وفقًا للشركة-تخفيضات كبيرة في متطلبات الطاقة.
وقال Xiaomeng Lu ، مدير ممارسة التكنولوجيا الجيولوجية في Euroasia Group: “إن الوجبات الجاهزة هي أن هناك العديد من الاحتمالات لتطوير هذه الصناعة. إن الطريقة المكثفة للرقائق/رأس المال المتطورة هي طريقة تكنولوجية واحدة”.
“لكن Deepseek يثبت أننا ما زلنا في المرحلة الناشئة من تطوير الذكاء الاصطناعى وقد لا يكون المسار الذي وضعته Openai هو الطريق الوحيد إلى الذكاء الاصطناعي للغاية.”
كيف يختلف عن Openai؟
لدى Deepseek نظامين رئيسيين حصلوا على ضجة من مجتمع الذكاء الاصطناعى: V3 ، نموذج اللغة الكبير الذي يلف منتجاتها ، و R1 ، نموذج التفكير.
كلا النموذجين مفتوح المصدر ، مما يعني أن الكود الأساسي الخاص بهما مجاني ومتاح للجمهور للمطورين الآخرين لتخصيص وإعادة التوزيع.
نماذج Deepseek أصغر بكثير من العديد من نماذج اللغة الكبيرة الأخرى. V3 لديه ما مجموعه 671 مليار معلمة ، أو المتغيرات التي يتعلمها النموذج أثناء التدريب. وعلى الرغم من أن Openai لا يكشف عن المعلمات ، إلا أن الخبراء يقدرون أحدث نموذج له على الأقل تريليون.
من حيث الأداء ، ديبسيك يقول يحقق طراز R1 الخاص به أداءً قابلاً للمقارنة مع Openai’s O1 على مهام التفكير ، مشيراً إلى المعايير بما في ذلك AIME 2024 و Codeforces و GPQA Diamond و Math-500 و MMLU و SWE-BENCED.
في تقرير فني ، قالت الشركة إن طراز V3 الخاص بها كان لديه تكلفة تدريب بقيمة 5.6 مليون دولار فقط – وهو جزء صغير من المليارات من الدولارات التي أنفقتها مختبرات AI الغربية البارزة مثل Openai و Anthropic لتدريب وتشغيل نماذج الذكاء الاصطناعي. ليس من الواضح بعد مقدار تكاليف Deepseek التي يجب تشغيلها.
إذا كانت تكاليف التدريب دقيقة ، فهذا يعني أن النموذج قد تم تطويره على جزء صغير من تكلفة النماذج المنافسة بواسطة Openai ، الأنثروبور ، جوجل وغيرهم.
وقال دانييل نيومان ، الرئيس التنفيذي لشركة Tech Insight The Futurum Group ، إن هذه التطورات تشير إلى “اختراق هائل” ، على الرغم من أنه ألقى بعض الشكوك في الأرقام الدقيقة.
وقال “أعتقد أن اختراقات ديبسيك تشير إلى انعطاف ذي معنى لتوسيع القوانين وضرورة حقيقية”. “بعد قولي هذا ، لا يزال هناك الكثير من الأسئلة والشكوك حول الصورة الكاملة للتكاليف لأنها تتعلق بتطوير Deepseek.”
وفي الوقت نفسه ، أشار بول تريوليو ، نائب الرئيس الأول لسياسة الصين والتكنولوجيا في شركة DGA Group الاستشارية ، أنه كان من الصعب إجراء مقارنة مباشرة بين تكلفة نموذج Deepseek وتكلفة المطورين الأمريكيين الرئيسيين.
وقال “كان الرقم 5.6 مليون لـ Deepseek V3 فقط لشراء تدريب واحد ، وشددت الشركة على أن هذا لا يمثل التكلفة الإجمالية للبحث والتطوير لتطوير النموذج”. “من المحتمل أن تكون التكلفة الإجمالية أعلى بكثير ، لكنها لا تزال أقل من المبلغ الذي تنفقه شركات الذكاء الاصطناعى الأمريكيين.”
لم يكن Deepseek متاحًا على الفور للتعليق عند الاتصال به من قبل CNBC.
مقارنة Deepseek ، Openai على السعر
يكشف كل من Deepseek و Openai عن أسعار حسابات موديلاتهم على مواقع الويب الخاصة بهم.
يقول Deepseek إن R1 يكلف 55 سنتًا لكل مليون رمز من المدخلات – “الرموز” التي تشير إلى كل وحدة فردية من النص المعالج بواسطة النموذج – و 2.19 دولار لكل مليون رمز من الإنتاج.
وبالمقارنة ، تُظهر صفحة التسعير الخاصة بـ Openai لـ O1 أن الشركة تتقاضى 15 دولارًا لكل مليون رموز إدخال و 60 دولارًا لكل مليون رموز إخراج. بالنسبة إلى GPT-4O Mini ، النموذج اللغوي الأصغر والمنخفض التكلفة في Openai ، تتقاضى الشركة 15 سنتًا لكل مليون رموز إدخال.
الشك على الرقائق
لقد أدى كشف Deepseek عن R1 بالفعل إلى نقاش عام ساخن حول صحة مطالبته – ليس أقلها لأن نماذجها تم تصميمها على الرغم من ضوابط التصدير من الولايات المتحدة التي تقيد استخدام رقائق الذكاء الاصطناعى المتقدمة إلى الصين.
تدعي Deepseek أنها حققت اختراقها باستخدام مقاطع NVIDIA الناضجة ، بما في ذلك رقائق H800 و A100 ، والتي هي أقل تقدماً من H100s المتطورة في صانع الرقائق ، والتي لا يمكن تصديرها إلى الصين.
ومع ذلك ، في تعليقات على CNBC الأسبوع الماضي، قال المدير التنفيذي لشركة Scale AI Alexandr Wang ، إنه يعتقد أن Deepseek استخدم الرقائق المحظورة – وهو الادعاء الذي ينكره Deepseek.
منذ ذلك الحين خرجت Nvidia وقالت إن وحدات معالجة الرسومات التي استخدمها Deepseek كانت متوافقة تمامًا مع التصدير.
الصفقة الحقيقية أم لا؟
يبدو أن خبراء الصناعة يتفقون على نطاق واسع على أن ما حققه ديبسيك مثير للإعجاب ، على الرغم من أن البعض حث على الشكوك على بعض مطالبات الشركة الصينية.
“ديبسيك مثير للإعجاب بشكل شرعي ، لكن مستوى الهستيريا هو لائحة اتهام للكثيرين” ، كتب رجل الأعمال الأمريكي بالمر لوكي ، الذي أسس Oculus و Anduril على X.
“إن رقم 5 ملايين دولار هو زائف. يتم دفعه من قبل صندوق تحوط صيني لإبطاء الاستثمار في الشركات الناشئة الأمريكية ، وخدمة شورتاتهم ضد جبابرة أمريكية مثل NVIDIA ، وإخفاء تهرب العقوبات”.
قال Seena Rejal ، كبير المسؤولين التجاريين في NetMind ، وهي شركة ناشئة مقرها لندن والتي توفر إمكانية الوصول إلى نماذج Deepseek من الذكاء الاصطناعي عبر شبكة GPU الموزعة ، إنه لم ير أي سبب لعدم تصديق Deepseek.
وقال ريجال لـ CNBC في مقابلة عبر الهاتف في وقت سابق من هذا الأسبوع: “حتى لو تم إيقاف تشغيله بعامل معين ، فإنه لا يزال يأتي فعالًا إلى حد كبير”. “منطق ما شرحوه معقول للغاية.”
ومع ذلك ، فقد ادعى البعض أن تقنية Deepseek ربما لم يتم بناؤها من الصفر.
وقال فينود خوسلا المستثمر الملياردير في X ، دون إعطاء مزيد من التفاصيل: “يرتكب Deepseek نفس الأخطاء التي ترتكبها O1 ، وهي مؤشر قوي على أن التكنولوجيا قد انفصلت”.
إنه مطالبة بأن Openai نفسها قد أشارت إليها ، حيث أخبرت CNBC في بيان يوم الأربعاء أنها تقوم بمراجعة التقارير التي قد يكون لها Deepseek “استخدام بيانات الإخراج بشكل غير لائق من نماذجها لتطوير نموذج الذكاء الاصطناعي الخاص بها ، وهي طريقة يشار إليها باسم” التقطير “.
وقال متحدث باسم Openai لـ CNBC “إننا نأخذ تدابير مضادة عدوانية واستباقية لحماية تقنيتنا وسنواصل العمل عن كثب مع حكومة الولايات المتحدة لحماية النماذج الأكثر قدرة التي يتم بناؤها هنا”.
سلعة الذكاء الاصطناعي
ومع ذلك ، فإن التدقيق المحيط بـ Deepseek يتفوق ، يتفق علماء الذكاء الاصطناعى على نطاق واسع على أنه يمثل خطوة إيجابية لهذه الصناعة.
يان ليكون ، كبير علماء الذكاء الاصطناعي في ميتاقال إن نجاح Deepseek يمثل انتصارًا لنماذج الذكاء الاصطناعى مفتوح المصدر ، وليس بالضرورة فوزًا للصين على التعريف الأمريكي هو وراء نموذج AI شهير مفتوح المصدر يسمى Llama.
“للأشخاص الذين يرون أداء Deepseek ويفكرون:” الصين تتفوق على الولايات المتحدة في الذكاء الاصطناعي “. أنت تقرأ هذا الخطأ.
“لقد استفاد Deepseek من الأبحاث المفتوحة والمصدر المفتوح (على سبيل المثال Pytorch و Llama من Meta). لقد توصلوا إلى أفكار جديدة وقاموا ببناءها على رأس عمل الآخرين. نظرًا لأن عملهم يتم نشره ومصدر مفتوح ، يمكن للجميع الاستفادة منها. هذه هي قوة البحث المفتوح والمصدر المفتوح. “
– ساهمت كاترينا بيشوب وهايدن فيلد في سي إن بي سي في هذا التقرير