أخبار التقنية

NVIDIA تدعو نموذج Deepseek R1 الصيني “تقدم AI ممتاز”


Jensen Huang ، المؤسس المشارك والمدير التنفيذي لشركة Nvidia Corp ، خلال مؤتمر صحفي في تايبيه ، تايوان ، يوم الثلاثاء ، 4 يونيو 2024. لا تزال Nvidia تعمل على عملية إصدار الشهادات لشركة Samsung Electronics Co. رقائق الذاكرة ، وهي خطوة نهائية مطلوبة قبل أن تتمكن الشركة الكورية من البدء في توفير مكون أساسي لتدريب منصات الذكاء الاصطناعي.

أنابيل تشيه | بلومبرج | غيتي الصور

نفيديا يسمى نموذج R1 الخاص بـ Deepseek “AI Advancement” ، على الرغم من ظهور بدء التشغيل الصيني مما تسبب في انخفاض سعر سهم صانع الرقائق بنسبة 17 ٪ يوم الاثنين.

وقال متحدث باسم NVIDIA لـ CNBC يوم الاثنين “Deepseek هو تقدم ممتاز من الذكاء الاصطناعي ومثال مثالي لقياس وقت الاختبار”. “يوضح عمل Deepseek كيف يمكن إنشاء نماذج جديدة باستخدام هذه التقنية ، والاستفادة من النماذج المتاحة على نطاق واسع وحساب تمثل التحكم بالكامل في التصدير.”

تأتي التعليقات بعد أن أصدرت Deepseek الأسبوع الماضي R1 ، وهو نموذج تفكير مفتوح المصدر يتفوق على أفضل النماذج من الشركات الأمريكية مثل Openai. كانت تكلفة التدريب التي تم الإبلاغ عنها ذاتيا لـ R1 أقل من 6 ملايين دولار ، وهو جزء صغير من المليارات التي تنفقها شركات وادي السيليكون لبناء نماذج الذكاء الاصطناعية.

يشير بيان NVIDIA إلى أنه يرى إنجاز Deepseek على أنه يخلق المزيد من العمل لوحدات معالجة الرسومات الخاصة بـ American Chip Maker ، أو وحدات معالجة الرسومات.

اقرأ المزيد من تغطية Deepseek

وأضاف المتحدث باسم المتحدث: “يتطلب الاستدلال أعدادًا كبيرة من وحدات معالجة الرسومات Nvidia والشبكات عالية الأداء”. “لدينا الآن ثلاثة قوانين تحجيم: ما قبل التدريب وما بعد التدريب ، والتي تستمر ، وتوسيع وقت الاختبار الجديد.”

وقال نفيديا أيضا أن وحدات معالجة الرسومات التي استخدمها ديبسيك كانت متوافقة مع التصدير بالكامل. أن العدادات مقياس منظمة العفو الدولية ألكساندر وانغ تعليقات على CNBC الأسبوع الماضي أنه يعتقد أن ديبسيك استخدم نماذج وحدات معالجة الرسومات NVIDIA التي تم حظرها في الصين البر الرئيسي. تقول ديبسيك إنها تستخدم إصدارات خاصة من وحدات معالجة الرسومات في NVIDIA المخصصة للسوق الصينية.

يسأل المحللون الآن ما إذا كانت الاستثمارات الرأسمالية بمليارات الدولارات من شركات مثل Microsoftو جوجل و ميتا بالنسبة للبنية التحتية القائمة على NVIDIA يتم إهدارها عندما يمكن تحقيق نفس النتائج بثمن بخس.

في وقت سابق من هذا الشهر ، قالت Microsoft إنها كذلك إنفاق 80 مليار دولار على البنية التحتية لمنظمة العفو الدولية في عام 2025 وحده بينما قال الرئيس التنفيذي لشركة Meta Mark Zuckerberg الأسبوع الماضي إن شركة التواصل الاجتماعي تخطط استثمر ما بين 60 إلى 65 مليار دولار في النفقات الرأسمالية في عام 2025 كجزء من استراتيجية الذكاء الاصطناعي.

“إذا أثبتت تكاليف التدريب النمطية أنها أقل بشكل كبير ، فإننا نتوقع فائدة تكلفة على المدى القريب للإعلان والسفر وشركات تطبيقات المستهلك الأخرى التي تستخدم خدمات الذكاء الاصطناع كتب جوستين بوست ، محلل Bofa Securities ، في مذكرة يوم الاثنين.

يعكس تعليق NVIDIA أيضًا موضوعًا جديدًا ناقشه الرئيس التنفيذي لشركة NVIDIA Jensen Huang ، الرئيس التنفيذي لشركة Openai Sam Altman و Microsoft Satya Nadella في الأشهر الأخيرة.

كان الكثير من طفرة الذكاء الاصطناعى والطلب على وحدات معالجة الرسومات Nvidia مدفوعة بـ “قانون التحجيم” ، أ مفهوم في تطوير الذكاء الاصطناعي اقترحه باحثو Openai في عام 2020. هذا المفهوم يشير إلى أنه يمكن تطوير أنظمة AI الأفضل من خلال توسيع نطاق الحساب والبيانات التي دخلت في بناء نموذج جديد ، مما يتطلب المزيد والمزيد من الرقائق.

منذ نوفمبر ، ركزت هوانغ و Altman على تجاعيد جديدة لقانون التحجيم ، الذي يسميه هوانغ “قياس وقت الاختبار”.

يقول هذا المفهوم أنه إذا كان نموذج الذكاء الاصطناعى المدربين تدريباً كاملاً يقضي المزيد من الوقت في استخدام طاقة كمبيوتر إضافية عند إجراء التنبؤات أو إنشاء نص أو صور للسماح له بـ “العقل” ، فسيوفر إجابات أفضل مما سيكون عليه إذا كان يعمل لفترة أقل.

يتم استخدام أشكال قانون تحجيم وقت الاختبار في بعض نماذج Openai مثل O1 وكذلك نموذج Deepseek النموذج R1.

يشاهد: يقول مدير الصندوق إن الإحساس الصعب بالتحدي من الاستثنائية في الأسواق



Source link

زر الذهاب إلى الأعلى