الذراع والميتا: تخطيط مسار لتخفيف سعة GPU

أخبار أن ARM تشرع في تطوير معالجات مركز البيانات الخاصة بها لـ META ، مثل ذكرت في الأوقات المالية، يدل على انتقال مصمم الرقائق للاستفادة من شهية صناعة التكنولوجيا للذكاء الاصطناعي الميسور التكلفة والفعال في الطاقة (AI).
يستخدم فرط الفصح وعمالقة التواصل الاجتماعي مثل Meta صفائف واسعة من باهظة الثمن وحدات معالجة الرسومات (وحدات معالجة الرسومات) لتشغيل أعباء العمل التي تتطلب تسارع الذكاء الاصطناعي. ولكن إلى جانب التكلفة ، تميل وحدات معالجة الرسومات إلى استخدام الكثير من الطاقة وتتطلب الاستثمار في البنية التحتية للتبريد السائل.
يرى Meta من الذكاء الاصطناعي مبادرة تكنولوجيا استراتيجية تمتد منصاتها ، بما في ذلك Facebook و Instagram و WhatApp. يقوم المدير التنفيذي مارك زوكربيرج بوضع Meta AI كذكاء الاصطناعي الذي سيستخدمه الجميع. في أحدث مكالمة أرباح الشركة ، قال: “في الذكاء الاصطناعى ، أتوقع أن يكون هذا هو العام الذي يصل فيه مساعد الذكاء الاصطناعى ذكيًا للغاية وشخصيًا إلى أكثر من مليار شخص ، وأتوقع أن يكون ميتا منظمة العفو الدولية ذلك المساعد القيادي. “
للوصول إلى هذا المجلد من الأشخاص ، تعمل الشركة على توسيع نطاق البنية التحتية الخاصة بها منظمة العفو الدولية وتخطط للترحيل من تسارع الذكاء الاصطناعى القائم على GPU إلى رقائق السيليكون المخصصة ، وتم تحسينها لأعباء العمل والتجاريات.
خلال مكالمة الأرباح ، مديرة مالية ميتا سوزان لي قال الشركة “استثمرت للغاية في تطوير السيليكون المخصص الخاص بنا لأعباء عمل فريدة من نوعها ، حيث السيليكون الجاهز ليس بالضرورة الأمثل”.
في عام 2023 ، بدأت الشركة مشروعًا طويل الأجل يسمى Meta Training and Interference Accelerator (MTIA) لتوفير العمارة الأكثر كفاءة لأعباء العمل الفريدة.
وقال لي إن ميتا بدأت في تبني MTIA في النصف الأول من عام 2024 لاستنتاج الترتيب الأساسي والتوصيات. وأضافت: “سنواصل ترشيح تبني أعباء العمل هذه على مدار عام 2025 حيث نستخدمه لكل من السعة الإضافية واستبدال بعض الخوادم المستندة إلى GPU عندما يصلون إلى نهاية حياتها المفيدة”. “في العام المقبل ، نأمل في توسيع MTIA لدعم بعض أعباء العمل التدريبية الخاصة بنا من الذكاء الاصطناعي ، ومع مرور الوقت على بعض Genai [generative AI] استخدام الحالات. “
كفاءة القيادة والتكلفة الإجمالية للملكية
وقد سبق أن قال Meta إن الكفاءة هي واحدة من أهم العوامل لنشر MTIA في بياناتها. يتم قياس هذا في مقياس الأداء لكل وات (TFLOPS/W) ، والذي قال إنه مكون رئيسي في التكلفة الإجمالية للملكية. تم تجهيز رقاقة MTIA بوحدة المكونات الإضافية المنصة المفتوحة (OCP) ، والتي تستهلك حوالي 35 واط. لكن بنية MTIA تتطلب وحدة معالجة مركزية (CPU) مع الذاكرة والرقائق للاتصال.
يمكن أن يساعد العمل الذي تم الإبلاغ عنه مع ARM الشركة على الانتقال من الدوائر المتكاملة المخصصة للتطبيق (ASICS) التي طورتها لشريحة الجيل الأول ، MTIA 1 ، إلى بنية من الجيل التالي بناءً على نوى معالج الذراع للأغراض العامة للأغراض العامة .
بالنظر إلى أحدث أرباح ARM ، تقوم الشركة بوضع نفسها لتقديم الذكاء الاصطناعى التي يمكنها توسيع نطاق الطاقة بكفاءة. سبق أن عقدت ARM شراكة مع NVIDIA لتقديم الذكاء الاصطناعى الموفرة للطاقة في Nvidia Blackwell Grace Architecture.
في معرض الإلكترونيات الاستهلاكية في يناير ، كشفت NVIDIA عن GRAPS GRACE Blackwell Superchip القائم على الذراع ، والتي زعمت أنها توفر petaflop من أداء الحوسبة من الذكاء الاصطناعى للنماذج الأولية ، وصقلها ، وتشغيل نماذج AI الكبيرة. تستخدم الرقاقة معالج ARM مع مسرع Blackwell من NVIDIA لتحسين أداء أعباء عمل الذكاء الاصطناعي.
تقدم صناعة أشباه الموصلات نظامًا على أجهزة رقاقة (SOC) ، حيث يتم دمج العديد من اللبنات الأساسية للكمبيوتر في شريحة واحدة. غريس بلاكويل هو مثال على SOC. بالنظر إلى عمل Meta الذي تقوم به Meta لتطوير رقاقة MTIA الخاصة بها ، قد تستكشف الشركة كيف يمكن أن تعمل مع ARM لدمج تقنيتها الخاصة مع وحدة المعالجة المركزية ARM على جهاز واحد.
على الرغم من أن SOC أكثر تعقيدًا من منظور تصنيع الرقائق ، إلا أن اقتصادات الحجم عند زيادة الإنتاج ، وحقيقة أن الجهاز يمكنه دمج العديد من المكونات الخارجية في حزمة واحدة ، مما يجعله أكثر فعالية من حيث التكلفة.
ترتبط تصريحات LI حول استبدال خوادم GPU وهدف MTIA بتقليل التكلفة الإجمالية للملكية لـ META للنيابة عن الصفقة المبلغ عنها مع ARM ، والتي من المحتمل أن تمكنها من زيادة تكلفة الذكاء الاصطناعي بفعالية وتقلل من اعتمادها على تسريع AI القائم على GPU.
تعزيز أوراق اعتماد AI
وجدت Arm ، وهي شركة SoftBank ، مؤخرًا نفسها في قلب مشروع Stargate لإدارة ترامب ، وهي مبادرة مدعومة من بنك SoftBank لنشر قدرات الذكاء الاصطناعي السيادي في الولايات المتحدة.
خلال دعوة الأرباح للحصول على أحدث نتائج ربع سنوية لـ ARM ، وصف الرئيس التنفيذي Rene Haas Stargate بأنه “مشروع بنية تحتية مهم للغاية” ، مضيفًا: “نحن متحمسون للغاية لأن نكون وحدة المعالجة المركزية المفضلة لمثل هذا المنصة إلى جانب وحدة المعالجة المركزية Blackwell with [ARM-based] جمال. للمضي قدمًا ، ستكون هناك إمكانات هائلة لابتكار التكنولوجيا حول هذا المجال. “
تحدث هاس أيضًا عن تعاون Cristal Intelligence مع Openai ، والذي قال إنه يمكّن وكلاء الذكاء الاصطناعى من التحرك عبر كل عقدة من النظام البيئي للأجهزة. وأضاف: “إذا كنت تفكر في أصغر الأجهزة ، مثل سماعات الأذن ، وصولاً إلى مركز البيانات ، فهذا يتعلق حقًا بالوكلاء على نحو متزايد الواجهة و/أو سائق كل ما يدفع الذكاء الاصطناعي داخل الجهاز”.