أخبار التقنية

ما هو جديد في أحدث طراز Deepseek: Deepseek-V3.2-EXP


آنا باركلي | Getty Images News | غيتي الصور

يعد النموذج التجريبي للبدء الصيني في Deepseek بزيادة الكفاءة وتحسين قدرة الذكاء الاصطناعى على التعامل مع الكثير من المعلومات في جزء صغير من التكلفة ، ولكن تظل الأسئلة حول مدى فعالية البنية.

أرسل Deepseek وادي السيليكون إلى جنون عندما أطلقت أول طراز R1 من العدم من أي مكان في العام الماضي ، مما يدل على أنه من الممكن تدريب نماذج اللغة الكبيرة (LLMS) بسرعة ، على رقائق أقل قوة ، باستخدام موارد أقل.

أصدرت الشركة Deepseek-V3.2-EXP يوم الاثنين ، وهي نسخة تجريبية من طرفها الحالي Deepseek-V3.1 ، والتي تعتمد على مهمتها لزيادة الكفاءة في أنظمة الذكاء الاصطناعي ، وفقا لنشر على وجه المنتدى الذكاء الاصطناعى الوجه.

وقالت أدينا ياكافو ، الجالية الصينية في Hugging Face ، لـ CNBC: “تواصل Deepseek v3.2 التركيز على الكفاءة ، وخفض التكاليف ، ومشاركة المصدر المفتوح”. “التحسن الكبير هو ميزة جديدة تسمى DSA (Deepseek Excess Eminted) ، مما يجعل الذكاء الاصطناعى أفضل في التعامل مع المستندات والمحادثات الطويلة. كما أنه يقلل تكلفة تشغيل الذكاء الاصطناعى إلى النصف مقارنة بالإصدار السابق.”

وقال نيك بادي ، نائب الرئيس وممارسة الممارسة لمجموعة فوتوروم: “إنه أمر مهم لأنه يجب أن يجعل النموذج أسرع وأكثر فعالية من حيث التكلفة لاستخدامه دون انخفاض ملحوظ في الأداء”. “هذا يجعل من الذكاء الاصطناعي القوي أكثر سهولة للمطورين والباحثين والشركات الأصغر ، مما قد يؤدي إلى موجة من التطبيقات الجديدة والمبتكرة.”

إيجابيات وسلبيات الاهتمام المتفر

يتخذ نموذج الذكاء الاصطناعي قرارات بناءً على بيانات التدريب والمعلومات الجديدة ، مثل موجه. قل أن شركة طيران تريد العثور على أفضل طريق من A إلى B ، في حين أن هناك العديد من الخيارات ، ليست كلها ممكنة. من خلال تصفية الطرق الأقل قابلية للتطبيق ، فإنك تقلل بشكل كبير من الوقت والوقود ، وفي نهاية المطاف ، المال ، اللازم للقيام بالرحلة. هذا هو الاهتمام المتفرع بالضبط ، إنه فقط العوامل في البيانات التي تعتقد أنها مهمة بالنظر إلى المهمة المطروحة ، على عكس النماذج الأخرى التي طغت حتى الآن جميع البيانات في النموذج.

وقالت إيكاترينا ألاسك ، المؤسس والشريك الإداري لصندوق رأس المال الاستثماري الجديد “لذلك ، أنت تقطع الأشياء التي تعتقد أنها ليست مهمة”.

الانتباه المتفرّق هو نعمة للكفاءة والقدرة على توسيع نطاق موارد أقل ، لكن أحد الشواغل هو أنه يمكن أن يؤدي إلى انخفاض في مدى نماذج موثوقية بسبب عدم وجود إشراف في كيفية خصومات المعلومات.

“الحقيقة هي ، هم [sparse attention models] قال Almasque ، الذي كان مؤيدًا مبكرًا لـ Dataiku و DarkTrace ، ومستثمر في GraphCore ، “لقد فقدت الكثير من الفروق الدقيقة.” ثم السؤال الحقيقي هو ، هل لديهم الآلية الصحيحة لاستبعاد البيانات غير المهمة ، أو هل هناك آلية باستثناء بيانات مهمة حقًا ، وبعد ذلك ستكون النتيجة أقل أهمية؟ “

وأشار المستثمر إلى أن هذا قد يكون مشكلة خاصة بالنسبة لسلامة الذكاء الاصطناعي والشمولية ، مضيفًا أنه قد لا يكون “النموذج الأمثل أو النموذج الأكثر أمانًا” لاستخدامه مقارنة بالمنافسين أو البنية التقليدية.

ومع ذلك ، يقول ديبسيك إن النموذج التجريبي يعمل على قدم المساواة مع طرف V3.1. على الرغم من التكهنات تشكيل فقاعة، لا يزال الذكاء الاصطناعي في مركز المنافسة الجيوسياسية مع الولايات المتحدة والصين تتنافس على المركز الفائز. أشار Yakefu إلى أن نماذج Deepseek تعمل “مباشرة خارج الصندوق” مع رقائق AI الصينية الصينية ، مثل Ascend و Cambricon ، مما يعني أنها يمكن أن تعمل محليًا على الأجهزة المحلية دون أي إعداد إضافي.

وقالت إن ديبسيك شاركت أيضًا رمز البرمجة الفعلي والأدوات اللازمة لاستخدام النموذج التجريبي. “هذا يعني أن الآخرين يمكنهم التعلم منه وبناء تحسيناتهم الخاصة.”

ولكن بالنسبة إلى Almasque ، فإن طبيعة هذا يعني أن التقنية قد لا يمكن الدفاع عنها. وقالت “هذا النهج ليس جديدًا للغاية” ، مشيرة إلى أن الصناعة كانت “تتحدث عن النماذج المتفرقة منذ عام 2015” وأن Deepseek غير قادر على براءة اختراع تقنيتها بسبب كونها مفتوحة المصدر. وأضافت أن ميزة Deepseek التنافسية يجب أن تكمن في كيفية تحديد المعلومات التي يجب تضمينها.

تعترف الشركة نفسها بأن V3.2-EXP هي “خطوة وسيطة نحو بنية الجيل التالي” ، وفقًا لما قاله Face Post.

كما أشار الصبر ، “هذا هو دعم قيمة Deepseek في كل مكان: أصبحت الكفاءة مهمة مثل القوة الخام.”

وأضاف Yakefu: “يلعب Deepseek اللعبة الطويلة للحفاظ على استثمار المجتمع في تقدمه”. “سوف يذهب الناس دائمًا إلى ما هو رخيص وموثوق وفعال.”



Source link

زر الذهاب إلى الأعلى