تهيمن شركة Nvidia على سوق شرائح الذكاء الاصطناعي، ولكن هناك منافسة متزايدة
جنسن هوانغ، المؤسس المشارك والرئيس التنفيذي لشركة Nvidia Corp، خلال مؤتمر Nvidia GPU Technology (GTC) في سان خوسيه، كاليفورنيا، الولايات المتحدة، يوم الثلاثاء، 19 مارس 2024.
ديفيد بول موريس | بلومبرج | صور جيتي
نفيديا أدى ارتفاع بنسبة 27٪ في شهر مايو إلى دفع قيمتها السوقية إلى 2.7 تريليون دولار، خلفها فقط مايكروسوفت و تفاحة من بين الشركات العامة الأكثر قيمة في العالم. صانع الرقائق ذكرت تضاعفت مبيعاتها ثلاث مرات على أساس سنوي للربع الثالث على التوالي بسبب الطلب المتزايد على معالجات الذكاء الاصطناعي.
تقدر شركة Mizuho Securities أن شركة Nvidia تسيطر على ما يتراوح بين 70% إلى 95% من سوق شرائح الذكاء الاصطناعي المستخدمة للتدريب ونشر النماذج مثل OpenAI’s GPT. ما يؤكد قوة تسعير Nvidia هو هامش إجمالي قدره 78٪، وهو رقم مرتفع بشكل مذهل بالنسبة لشركة أجهزة يتعين عليها تصنيع وشحن المنتجات المادية.
صانعي الرقائق المتنافسين شركة انتل و الأجهزة الدقيقة المتقدمة سجلت هوامش إجمالية في الربع الأخير بلغت 41٪ و 47٪ على التوالي.
تم وصف موقع Nvidia في سوق شرائح الذكاء الاصطناعي بأنه خندق من قبل بعض الخبراء. أدت وحدات معالجة الرسومات الرائدة بتقنية الذكاء الاصطناعي (GPUs)، مثل H100، إلى جانب برنامج CUDA الخاص بالشركة، إلى بداية قوية في المنافسة بحيث يبدو التحول إلى بديل أمرًا لا يمكن تصوره تقريبًا.
ومع ذلك، الرئيس التنفيذي لشركة نفيديا جنسن هوانغ، الذي صافي القيمة تضخمت ثروته من 3 مليارات دولار إلى حوالي 90 مليار دولار في السنوات الخمس الماضية، وقال إنه “قلق وقلق” بشأن فقدان شركته البالغة من العمر 31 عامًا تفوقها. واعترف في مؤتمر عقد أواخر العام الماضي بأن هناك العديد من المنافسين الأقوياء في صعود.
“لا أعتقد أن الناس يحاولون إخراجي من العمل،” هوانغ قال في نوفمبر. “ربما أعلم أنهم يحاولون ذلك، لذا فالأمر مختلف.”
وقد التزمت نفيديا بالإفراج عنهم بنية شرائح الذكاء الاصطناعي الجديدة كل عام، بدلاً من كل عامين كما كان الحال تاريخياً، وللإخماد برامج جديدة وهذا يمكن أن يرسخ رقائقها بشكل أعمق في برامج الذكاء الاصطناعي.
لكن وحدة معالجة الرسومات الخاصة بشركة Nvidia ليست وحدها القادرة على تشغيل العمليات الحسابية المعقدة التي تدعم الذكاء الاصطناعي التوليدي. إذا كانت الرقائق الأقل قوة قادرة على القيام بنفس العمل، فقد يكون هوانج مصابًا بجنون العظمة بشكل مبرر.
إن الانتقال من تدريب نماذج الذكاء الاصطناعي إلى ما يسمى بالاستدلال – أو نشر النماذج – يمكن أن يمنح الشركات أيضًا فرصة لاستبدال وحدات معالجة الرسومات الخاصة بشركة Nvidia، خاصة إذا كانت أقل تكلفة للشراء والتشغيل. تبلغ تكلفة شريحة Nvidia الرئيسية تقريبًا 30.000 دولار أو أكثر، مما يمنح العملاء الكثير من الحوافز للبحث عن بدائل.
قال سيد شيث، المؤسس المشارك لشركة D-Matrix المنافسة الطموحة: “ترغب شركة Nvidia في الحصول على 100% منها، لكن العملاء لا يحبون أن تمتلك Nvidia 100% منها”. “إنها مجرد فرصة كبيرة للغاية. وسيكون من غير الصحي للغاية أن تأخذ أي شركة واحدة كل هذه الفرص.”
تأسست D-Matrix في عام 2019، وتخطط لإصدار بطاقة أشباه الموصلات للخوادم في وقت لاحق من هذا العام والتي تهدف إلى تقليل التكلفة وزمن الوصول لتشغيل نماذج الذكاء الاصطناعي. الشركة نشأ 110 مليون دولار في سبتمبر.
بالإضافة إلى D-Matrix، تتنافس الشركات التي تتراوح بين الشركات متعددة الجنسيات والشركات الناشئة من أجل الحصول على شريحة من سوق شرائح الذكاء الاصطناعي التي يمكن أن تصل مبيعاتها السنوية إلى 400 مليار دولار في السنوات الخمس المقبلة، وفقًا لمحللي السوق وشركة AMD. وحققت إنفيديا إيرادات بلغت حوالي 80 مليار دولار على مدى الأرباع الأربعة الماضية، ويقدر بنك أوف أمريكا أن الشركة باعت 34.5 مليار دولار من رقائق الذكاء الاصطناعي العام الماضي.
تراهن العديد من الشركات التي تتعامل مع وحدات معالجة الرسوميات من Nvidia على أن بنية مختلفة أو مقايضات معينة يمكن أن تنتج شريحة أفضل لمهام معينة. يقوم صانعو الأجهزة أيضًا بتطوير التكنولوجيا التي يمكن أن تؤدي في نهاية المطاف إلى القيام بالكثير من عمليات الحوسبة للذكاء الاصطناعي التي تجري حاليًا في مجموعات كبيرة تعتمد على وحدة معالجة الرسومات في السحابة.
“لا يمكن لأحد أن ينكر أن Nvidia اليوم هي الأجهزة التي تريد تدريبها وتشغيل نماذج الذكاء الاصطناعي،” فرناندو فيدال، المؤسس المشارك لشركة 3Fourteen Research، قال لشبكة سي إن بي سي. “ولكن كان هناك تقدم تدريجي في تحقيق تكافؤ الفرص، بدءًا من المتوسعين الذين يعملون على رقائقهم الخاصة، وحتى الشركات الناشئة الصغيرة، التي تصمم السيليكون الخاص بها.”
تريد الرئيس التنفيذي لشركة AMD، ليزا سو، أن يعتقد المستثمرون أن هناك مجالًا كبيرًا للعديد من الشركات الناجحة في هذا المجال.
وقالت سو للصحفيين في ديسمبر/كانون الأول، عندما أطلقت شركتها أحدث شرائح الذكاء الاصطناعي الخاصة بها: “المفتاح هو أن هناك الكثير من الخيارات هناك”. “أعتقد أننا سنرى وضعا لا يوجد فيه حل واحد فقط، بل ستكون هناك حلول متعددة.”
صانعي الرقائق الكبار الآخرين
تعرض ليزا سو شريحة AMD Instinct MI300 أثناء إلقاء خطاب رئيسي في معرض CES 2023 في لاس فيجاس، نيفادا، في 4 يناير 2023.
ديفيد بيكر | صور جيتي
تقوم AMD بتصنيع وحدات معالجة الرسومات للألعاب، ومثل Nvidia، تقوم بتكييفها مع الذكاء الاصطناعي داخل مراكز البيانات. شريحتها الرئيسية هي Instinct MI300X. لقد اشترت Microsoft بالفعل معالجات AMD، وتوفر الوصول إليها من خلال سحابة Azure الخاصة بها.
عند الإطلاق، سلط سو الضوء على تفوق الشريحة في الاستدلال، بدلاً من التنافس مع Nvidia في التدريب. في الأسبوع الماضي، قالت مايكروسوفت إنها تستخدم وحدات معالجة الرسوميات AMD Instinct لخدمة نماذج Copilot الخاصة بها. واعتبر محللو مورجان ستانلي هذه الأخبار بمثابة إشارة إلى أن مبيعات شرائح الذكاء الاصطناعي من AMD قد تتجاوز 4 مليارات دولار هذا العام، وهو الهدف العام للشركة.
وتحاول شركة Intel، التي تفوقت عليها Nvidia العام الماضي من حيث الإيرادات، أيضًا ترسيخ وجودها في مجال الذكاء الاصطناعي. أعلنت الشركة مؤخرًا عن الإصدار الثالث من مسرع الذكاء الاصطناعي الخاص بها، Gaudi 3. وهذه المرة قارنته Intel مباشرة بالمنافسة، ووصفته بأنه بديل أكثر فعالية من حيث التكلفة وأفضل من Nvidia H100 من حيث تشغيل الاستدلال، بينما أسرع في نماذج التدريب. .
وقدر محللو بنك أوف أمريكا مؤخرًا أن إنتل ستمتلك أقل من 1% من سوق شرائح الذكاء الاصطناعي هذا العام. وتقول إنتل إن لديها طلبًا متراكمًا بقيمة 2 مليار دولار للرقاقة.
قد يكون العائق الرئيسي أمام التبني على نطاق أوسع هو البرمجيات. تشارك كل من AMD وIntel في مجموعة صناعية كبيرة تسمى مؤسسة UXL، الذي يتضمن جوجل، والتي تعمل على إنشاء بدائل مجانية لـ CUDA من Nvidia للتحكم في الأجهزة لتطبيقات الذكاء الاصطناعي.
أهم عملاء نفيديا
أحد التحديات المحتملة التي تواجه Nvidia هو أنها تنافس بعضًا من أكبر عملائها. مقدمو الخدمات السحابية بما في ذلك Google وMicrosoft و أمازون كلها معالجات بناء للاستخدام الداخلي. شركات التكنولوجيا الكبرى الثلاثة، بالإضافة إلى وحي، تشكل أكثر من 40% من إيرادات Nvidia.
قدمت أمازون شرائحها الخاصة الموجهة نحو الذكاء الاصطناعي في عام 2018، تحت اسم العلامة التجارية Inferentia. Inferentia موجود الآن في نسخته الثانية. في عام 2021، أطلقت Amazon Web Services لأول مرة برنامج Tranium الذي يستهدف التدريب. لا يمكن للعملاء شراء الرقائق ولكن يمكنهم استئجار الأنظمة من خلال AWS، التي تقوم بتسويق الرقائق على أنها أكثر فعالية من حيث التكلفة من نفيديا.
ربما تكون Google هي المزود السحابي الأكثر التزامًا بالسيليكون الخاص بها. كانت الشركة تستخدم ما تسميه وحدات معالجة الموتر (TPUs) منذ عام 2015 لتدريب ونشر نماذج الذكاء الاصطناعي. وفي شهر مايو، أعلنت جوجل عن الإصدار السادس من شريحتها Trillium، والتي قالت الشركة إنها استخدمت لتطوير نماذجها، بما في ذلك Gemini وImagen.
تستخدم Google أيضًا شرائح Nvidia وتقدمها عبر السحابة الخاصة بها.
مايكروسوفت ليست بعيدة عن هذا الحد. الشركة قال العام الماضي أنها كانت تقوم ببناء مسرع ومعالج الذكاء الاصطناعي الخاص بها، والذي يسمى Maia وCobalt.
ميتا ليست شركة سحابية، ولكن الشركة تحتاج إلى كميات هائلة من الطاقة الحاسوبية لتشغيل برامجها وموقعها الإلكتروني ولعرض الإعلانات. وبينما تشتري الشركة الأم لفيسبوك معالجات Nvidia بمليارات الدولارات، فقد قالت في أبريل/نيسان إن بعض رقائقها المحلية موجودة بالفعل في مراكز البيانات وتتيح “كفاءة أكبر” مقارنة بوحدات معالجة الرسوميات.
قدر محللو بنك جيه بي مورجان في مايو أن قيمة سوق بناء الرقائق المخصصة لمقدمي الخدمات السحابية الكبيرة قد تصل قيمتها إلى 30 مليار دولار، مع نمو محتمل بنسبة 20٪ سنويًا.
الشركات الناشئة
تعد شريحة WSE-3 من شركة Cerebras أحد الأمثلة على السيليكون الجديد من الشركات الناشئة المصممة لتشغيل وتدريب الذكاء الاصطناعي.
أنظمة سيريبراس
ويرى أصحاب رؤوس الأموال المغامرة فرصًا متاحة للشركات الناشئة للقفز إلى اللعبة. لقد استثمروا 6 مليارات دولار في شركات أشباه الموصلات العاملة بالذكاء الاصطناعي في عام 2023، بزيادة طفيفة عن 5.7 مليار دولار في العام السابق، وفقًا لبيانات من PitchBook.
إنها منطقة صعبة بالنسبة للشركات الناشئة حيث أن تصميم أشباه الموصلات وتطويرها وتصنيعها باهظ الثمن. ولكن هناك فرص للتمايز.
بالنسبة لشركة Cerebras Systems، وهي شركة تصنيع شرائح الذكاء الاصطناعي في وادي السيليكون، ينصب التركيز على العمليات الأساسية والاختناقات في الذكاء الاصطناعي، مقابل طبيعة الأغراض العامة لوحدة معالجة الرسومات. تأسست الشركة في عام 2015 وبلغت قيمتها 4 مليارات دولار خلال آخر حملة لجمع التبرعات، وفقًا لبلومبرج.
قال الرئيس التنفيذي أندرو فيلدمان إن شريحة Cerebras، WSE-2، تضع إمكانات وحدة معالجة الرسومات بالإضافة إلى المعالجة المركزية والذاكرة الإضافية في جهاز واحد، وهو أفضل لتدريب النماذج الكبيرة.
وقال فيلدمان: “نحن نستخدم شريحة عملاقة، وهم يستخدمون الكثير من الرقائق الصغيرة”. “إنهم يواجهون تحديات تتعلق بنقل البيانات، أما نحن فلا.”
وقال فيلدمان إن شركته، التي تضم مايو كلينيك، جلاكسو سميث كلاين، والجيش الأمريكي كعملاء، يفوزون بأعمال تجارية لأنظمة الحوسبة الفائقة الخاصة بهم حتى أنهم يتنافسون مع Nvidia.
وقال فيلدمان: “هناك منافسة كبيرة وأعتقد أن هذا أمر صحي للنظام البيئي”.
وقال شيث من شركة D-Matrix إن شركته تخطط لإصدار بطاقة تحتوي على شريحة صغيرة خاصة بها في وقت لاحق من هذا العام والتي ستسمح بمزيد من العمليات الحسابية في الذاكرة، بدلاً من شريحة مثل وحدة معالجة الرسومات. يمكن إدخال منتج D-Matrix في خادم الذكاء الاصطناعي جنبًا إلى جنب مع وحدات معالجة الرسوميات الموجودة، ولكنه يستلزم عمل شرائح Nvidia، ويساعد على خفض تكلفة الذكاء الاصطناعي التوليدي.
وقال شيث إن العملاء “متقبلون للغاية ومتحمسون للغاية لتمكين حل جديد من الوصول إلى السوق”.
أبل وكوالكوم
يتم عرض أجهزة سلسلة Apple iPhone 15 للبيع في متجر The Grove Apple للبيع بالتجزئة في يوم الإصدار في لوس أنجلوس، كاليفورنيا، في 22 سبتمبر 2023.
باتريك تي فالون | أ ف ب | صور جيتي
قد يكون أكبر تهديد لأعمال مركز بيانات Nvidia هو التغيير في مكان حدوث المعالجة.
يراهن المطورون بشكل متزايد على أن عمل الذكاء الاصطناعي سينتقل من مزارع الخوادم إلى أجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر الشخصية والهواتف التي نمتلكها.
تتطلب النماذج الكبيرة مثل تلك التي طورتها شركة OpenAI مجموعات ضخمة من وحدات معالجة الرسومات القوية للاستدلال عليها، لكن شركات مثل أبل ومايكروسوفت تعمل على تطوير “نماذج صغيرة” تتطلب طاقة وبيانات أقل ويمكن تشغيلها على جهاز يعمل بالبطارية. قد لا يتمتعون بمهارة الإصدار الأحدث من ChatGPT، ولكن هناك تطبيقات أخرى يقومون بها، مثل تلخيص النص أو البحث المرئي.
تعمل شركتا Apple وQualcomm على تحديث شرائحهما لتشغيل الذكاء الاصطناعي بشكل أكثر كفاءة، وإضافة أقسام متخصصة لنماذج الذكاء الاصطناعي تسمى المعالجات العصبية، والتي يمكن أن تتمتع بمزايا الخصوصية والسرعة.
أعلنت شركة Qualcomm مؤخرًا عن شريحة كمبيوتر تسمح لأجهزة الكمبيوتر المحمولة بتشغيل خدمات Microsoft AI على الجهاز. واستثمرت الشركة أيضًا في عدد من شركات تصنيع الرقائق التي تصنع معالجات منخفضة الطاقة لتشغيل خوارزميات الذكاء الاصطناعي خارج الهاتف الذكي أو الكمبيوتر المحمول.
تقوم شركة Apple بتسويق أحدث أجهزة الكمبيوتر المحمولة والأجهزة اللوحية الخاصة بها على أنها مُحسّنة للذكاء الاصطناعي بسبب المحرك العصبي الموجود في رقائقها. في مؤتمر المطورين القادم لشركة أبل تخطط لعرض عدد كبير من ميزات الذكاء الاصطناعي الجديدة، من المحتمل أن يعمل على السيليكون الذي يعمل على تشغيل iPhone الخاص بالشركة.