أخبار التقنية

كيف تصنع Google شرائح سحابية مخصصة لتشغيل الذكاء الاصطناعي من Apple وGemini


داخل مختبر مترامي الأطراف في جوجل في المقر الرئيسي لشركة جوجل في ماونتن فيو، كاليفورنيا، تنتشر مئات من رفوف الخوادم عبر العديد من الممرات، حيث تؤدي مهام أقل انتشارًا بكثير من تشغيل محرك البحث المهيمن في العالم أو تنفيذ أحمال العمل لملايين عملاء Google Cloud.

وبدلاً من ذلك، يقومون بإجراء الاختبارات على شرائح جوجل الدقيقة، والتي تسمى وحدات معالجة Tensor، أو TPUs.

تم تدريب وحدات معالجة الرسومات الخاصة بشركة Google في الأصل على أحمال العمل الداخلية، متاح لعملاء السحابة منذ عام 2018. في يوليو، تفاحة كشف ذلك يستخدم TPUs لتدريب نماذج الذكاء الاصطناعي التي تدعم ذكاء Apple. تعتمد Google أيضًا على وحدات TPU لتدريب وتشغيل روبوت الدردشة Gemini الخاص بها.

“يعتقد العالم أن جميع الذكاء الاصطناعي ونماذج اللغة الكبيرة يتم تدريبها على نفيديا“وبالطبع، تمتلك إنفيديا حصة الأسد من حجم التدريب. لكن جوجل سلكت طريقها الخاص هنا”، هذا ما قاله دانييل نيومان، الرئيس التنفيذي لمجموعة Futurum. لقد كان نيومان يغطي شرائح السحابة المخصصة من جوجل منذ إطلاقها في عام 2015.

كانت جوجل أول مزود خدمات سحابية يصنع شرائح الذكاء الاصطناعي المخصصة. وبعد ثلاث سنوات، أمازون أعلنت خدمات الويب عن أول شريحة ذكاء اصطناعي سحابيةالاستدلال. مايكروسوفتالأول شريحة الذكاء الاصطناعي المخصصةلم يتم الإعلان عن مايا حتى نهاية عام 2023.

لكن كونك الأول في رقائق الذكاء الاصطناعي لم يترجم إلى احتلال المركز الأول في السوق بشكل عام سباق الفئران الذكاء الاصطناعي التوليدي. جوجل واجهت انتقادات ل إطلاق منتجات فاشلة، وصدرت Gemini بعد أكثر من عام من إصدار OpenAI تشات جي بي تي.

ومع ذلك، اكتسبت خدمة Google Cloud زخمًا جزئيًا بفضل عروض الذكاء الاصطناعي. الشركة الأم لـ Google تم الإبلاغ عن الأبجدية ارتفعت إيرادات الحوسبة السحابية بنسبة 29% في الربع الأخير، متجاوزة 10 مليارات دولار في الإيرادات الفصلية لأول مرة.

وقال نيومان: “لقد أعاد عصر الذكاء الاصطناعي السحابي ترتيب الطريقة التي تُرى بها الشركات بالكامل، وقد يكون هذا التمايز السيليكوني، أو TPU نفسه، أحد أكبر الأسباب التي جعلت جوجل تنتقل من السحابة الثالثة إلى أن تُرى على قدم المساواة حقًا، وفي بعض العيون، ربما حتى قبل السحابتين الأخريين في براعتها في الذكاء الاصطناعي”.

“تجربة فكرية بسيطة ولكنها قوية”

في يوليو/تموز، حصلت قناة سي إن بي سي على أول جولة مصورة في مختبر الرقائق التابع لشركة جوجل، وجلست مع رئيس قسم الرقائق السحابية المخصصة، أمين فاهدات. كان فاهدات يعمل بالفعل في جوجل عندما فكرت الشركة لأول مرة في فكرة تصنيع الرقائق في عام 2014.

أمين فاهدات، نائب الرئيس للتعلم الآلي والأنظمة والذكاء الاصطناعي السحابي في جوجل، يحمل إصدار TPU الرابع في مقر جوجل في ماونتن فيو، كاليفورنيا، في 23 يوليو 2024.

مارك جانلي

“لقد بدأ الأمر كله بتجربة فكرية بسيطة ولكنها قوية”، كما يقول فاهدات. “لقد طرح عدد من القادة في الشركة السؤال التالي: ماذا سيحدث إذا أراد مستخدمو Google التفاعل مع Google عبر الصوت لمدة 30 ثانية فقط في اليوم؟ وما مقدار قوة الحوسبة التي نحتاجها لدعم مستخدمينا؟”

قررت المجموعة أن جوجل ستحتاج إلى مضاعفة عدد أجهزة الكمبيوتر في مراكز البيانات الخاصة بهالذلك بحثوا عن حل أفضل.

“لقد أدركنا أنه بإمكاننا بناء أجهزة مخصصة، وليس أجهزة للأغراض العامة، بل أجهزة مخصصة – وحدات معالجة Tensor في هذه الحالة – لدعم ذلك بكفاءة أكبر بكثير. في الواقع، كانت الكفاءة أعلى بمقدار 100 مرة مما كانت لتكون عليه بخلاف ذلك”، كما قال فاهدات.

لا تزال مراكز بيانات جوجل تعتمد على وحدات المعالجة المركزية للأغراض العامة، أو وحدات المعالجة المركزية، ووحدات معالجة الرسومات من إنفيديا، أو وحدات معالجة الرسومات. وحدات معالجة الرسومات من جوجل هي نوع مختلف من الرقائق تسمى الدوائر المتكاملة الخاصة بالتطبيقات، أو ASIC، والتي يتم بناؤها خصيصًا لأغراض محددة. تركز الدوائر المتكاملة الخاصة بالتطبيقات على الذكاء الاصطناعي. تصنع جوجل دائرة متكاملة خاصة بالتطبيقات أخرى تركز على الفيديو تسمى وحدة ترميز الفيديو.

كما تقوم جوجل أيضًا بتصنيع شرائح مخصصة لأجهزتها، على غرار استراتيجية السيليكون المخصص لشركة Apple. يعمل Tensor G4 على تشغيل Google هاتف Pixel 9 الجديد المزود بالذكاء الاصطناعيوتعمل شريحة A1 الجديدة على تشغيل Pixel Buds Pro 2.

ومع ذلك، فإن TPU هو ما يميز Google. فقد كان الأول من نوعه عندما تم إطلاقه في عام 2015. ولا تزال وحدات TPU من Google تهيمن على مسرعات الذكاء الاصطناعي السحابية المخصصة، بنسبة 58% من حصة السوق. وفقًا لمجموعة Futurum.

وقد صاغت جوجل هذا المصطلح استنادًا إلى المصطلح الجبري “tensor”، في إشارة إلى عمليات ضرب المصفوفة واسعة النطاق التي تحدث بسرعة لتطبيقات الذكاء الاصطناعي المتقدمة.

مع إصدار TPU الثاني في عام 2018، وسعت Google التركيز من الاستدلال إلى التدريب و جعلها متاحة لعملاء السحابة لتشغيل أحمال العمل، إلى جانب الرقائق الرائدة في السوق مثل وحدات معالجة الرسومات من Nvidia.

قالت ستايسي راسجون، المحللة البارزة التي تغطي أشباه الموصلات في شركة بيرنشتاين للأبحاث: “إذا كنت تستخدم وحدات معالجة الرسوميات، فهي أكثر قابلية للبرمجة وأكثر مرونة. ولكن المعروض منها محدود”.

أدى طفرة الذكاء الاصطناعي إلى ارتفاع أسهم شركة إنفيديا إلى عنان السماء، مما دفع شركة صناعة الرقائق إلى قيمة سوقية تبلغ 3 تريليون دولار في يونيو، متجاوزة بذلك ألفابت، ومتنافسة مع أبل ومايكروسوفت على المركز الأول. الشركة العامة الأكثر قيمة في العالم.

وقال نيومان: “بصراحة، فإن مسرعات الذكاء الاصطناعي المتخصصة هذه ليست مرنة أو قوية مثل منصة إنفيديا، وهذا هو ما ينتظره السوق أيضًا: هل يمكن لأي شخص اللعب في هذا المجال؟”

الآن بعد أن عرفنا تستخدم Apple وحدات TPU من Google لتدريب نماذج الذكاء الاصطناعي، سيأتي الاختبار الحقيقي مع طرح ميزات الذكاء الاصطناعي الكاملة على أجهزة iPhone وMac. العام القادم.

برودكوم وTSMC

إن تطوير بدائل لمحركات الذكاء الاصطناعي من شركة Nvidia ليس بالأمر الهين. ومن المقرر أن يتم إطلاق الجيل السادس من TPU من شركة Google، والذي يُسمى Trillium، في وقت لاحق من هذا العام.

عرضت شركة جوجل على قناة CNBC الإصدار السادس من TPU الخاص بها، Trillium، في ماونتن فيو، كاليفورنيا، في 23 يوليو 2024. ومن المقرر إطلاق Trillium في وقت لاحق من عام 2024.

مارك جانلي

“إنها مكلفة. وتحتاج إلى قدر كبير من الحجم”، كما قال راسجون. “ولذلك فهي ليست شيئًا يستطيع الجميع القيام به. ولكن هؤلاء المتخصصون في مجال الحوسبة الضخمة، لديهم الحجم والأموال والموارد اللازمة للسير في هذا المسار”.

إن العملية معقدة ومكلفة للغاية لدرجة أن حتى الشركات المصنعة للأجهزة الضخمة لا تستطيع القيام بها بمفردها. ومنذ أول وحدة معالجة مركزية، دخلت Google في شراكة مع برودكوم، مطور شرائح يساعد أيضًا ميتا تصميم رقائق الذكاء الاصطناعي الخاصة بها. برودكوم وتقول إنها أنفقت أكثر من 3 مليارات دولار ولجعل هذه الشراكات تحدث.

“شرائح الذكاء الاصطناعي معقدة للغاية. يوجد بها الكثير من الأشياء. لذا فإن جوجل تقدم الحوسبة”، كما قال راسجون. “تتولى شركة Broadcom جميع الأشياء الطرفية. كما أنها تقوم بالإدخال والإخراج والمعالجة. سيرديس“إنهم يقومون بجمع كل القطع المختلفة التي تدور حول هذا الكمبيوتر. كما يقومون أيضًا بالتغليف.”

ثم يتم إرسال التصميم النهائي للتصنيع في مصنع تصنيع أو فاب – في المقام الأول تلك المملوكة لأكبر شركة لصناعة الرقائق في العالم، شركة تصنيع أشباه الموصلات في تايوان، التي تصنع 92% من أشباه الموصلات الأكثر تقدمًا في العالم.

وعندما سُئل عما إذا كانت جوجل لديها أي ضمانات في حال حدوث الأسوأ في المجال الجيوسياسي بين الصين وتايوان، قال فاهدات: “من المؤكد أنه شيء نستعد له ونفكر فيه أيضًا، لكننا نأمل ألا يكون هذا شيئًا يتعين علينا فعله”.

إن الحماية من هذه المخاطر هي السبب الرئيسي وراء قيام البيت الأبيض بتوزيع 52 مليار دولار من تمويل قانون CHIPS للشركات التي تبني مصانع في الولايات المتحدة – مع أكبر أجزاء ذاهب الى إنتل, شركة تايوان لصناعة الرقائق، و سامسونج حتى الآن.

المعالجات والطاقة

أظهرت شركة جوجل لشبكة CNBC وحدة المعالجة المركزية الجديدة Axion،

مارك جانلي

“الآن أصبحنا قادرين على إدخال القطعة الأخيرة من اللغز، وهي وحدة المعالجة المركزية”، كما قال فاهدات. “وبالتالي، فإن العديد من خدماتنا الداخلية، سواء كانت استعلام كبيرسواء كان ذلك مفتاح البراغيويتم تشغيل إعلانات YouTube والمزيد على Axion.”

لقد تأخرت شركة جوجل في دخول مجال وحدات المعالجة المركزية، كما أطلقت شركة أمازون الجرافيتون المعالج في عام 2018. علي بابا أطلقت شريحة الخادم الخاصة بها في عام 2021أعلنت شركة مايكروسوفت عن وحدة المعالجة المركزية الخاصة بها في نوفمبر.

وعندما سُئل عن سبب عدم قيام جوجل بتصنيع وحدة المعالجة المركزية في وقت سابق، قال فاهدات: “لقد ركزنا على المكان الذي يمكننا فيه تقديم أكبر قيمة لعملائنا، وهناك بدأنا بوحدة المعالجة المركزية، ووحدات ترميز الفيديو، وشبكاتنا. لقد اعتقدنا حقًا أن الوقت قد حان”.

كل هذه المعالجات من شركات غير مصنعة للرقائق، بما في ذلك شركة Google، أصبحت ممكنة بفضل ذراع هندسة الشريحة – بديل أكثر قابلية للتخصيص وكفاءة في استخدام الطاقة ويكتسب زخمًا على طراز x86 التقليدي من إنتل و أيه إم دي. تعتبر كفاءة الطاقة أمرًا بالغ الأهمية لأنه بحلول عام 2027، من المتوقع أن تستهلك خوادم الذكاء الاصطناعي ما يصل إلى 1000 ميجاوات. بقدر ما تستطيع الدولة الحصول على الطاقة كل عام مثل الأرجنتين. أحدث مشروع بيئي من Google تقرير أظهرت الانبعاثات ارتفعت بنسبة 50% تقريبًا من عام 2019 إلى عام 2023 ويرجع ذلك جزئيًا إلى نمو مراكز البيانات لتشغيل الذكاء الاصطناعي.

وقال فاهدات: “لولا كفاءة هذه الرقائق، لكانت الأرقام قد انتهت إلى مكان مختلف تمامًا. ونحن نواصل التزامنا بدفع هذه الأرقام فعليًا من حيث انبعاثات الكربون من بنيتنا التحتية، على مدار الساعة طوال أيام الأسبوع، ودفعها نحو الصفر”.

يتطلب تبريد الخوادم التي تدرب وتشغل الذكاء الاصطناعي كمية هائلة من المياه. ولهذا السبب بدأت شركة Google في استخدام الجيل الثالث من TPU في التبريد المباشر على الشريحة، والذي يستخدم كمية أقل بكثير من المياه. وهذا هو السبب أيضًا شركة Nvidia تقوم بتبريد أحدث معالجاتها Blackwell وحدات معالجة الرسوميات.

ورغم التحديات، بدءاً من الجغرافيا السياسية وصولاً إلى الطاقة والمياه، فإن جوجل ملتزمة بأدوات الذكاء الاصطناعي التوليدية الخاصة بها وصنع رقائقها الخاصة.

وقال فاهدات “لم أشاهد شيئا كهذا من قبل ولا توجد أي علامة على تباطؤه حتى الآن. وسوف تلعب الأجهزة دورا مهما حقا في هذا المجال”.



Source link

زر الذهاب إلى الأعلى