استراتيجية رقاقة AWS المخصصة تقطع هيمنة AI في NVIDIA


أمازون تم تعيين خدمات الويب للإعلان عن تحديث لشريحة Graviton4 التي تتضمن 600 جيجابت في الثانية من نطاق النطاق الترددي للشبكة ، ما تسميه الشركة أعلى عرض في السحابة العامة.
شبّت عليّي ، وهو مهندس متميز في AWS ، السرعة بجهاز يقرأ 100 Music Cds في الثانية.
Graviton4 ، وحدة المعالجة المركزية ، أو وحدة المعالجة المركزية ، هي واحدة من العديد من منتجات الرقائق التي تأتي من مختبرات أنابورنا من أمازون في أوستن ، تكساس. الشريحة هي فوز لاستراتيجية الشركة المخصصة ووضعها ضد لاعبي أشباه الموصلات التقليديين مثل إنتل و AMD.
لكن المعركة الحقيقية مع نفيديا في الذكاء الاصطناعي مساحة البنية التحتية.
في مؤتمر AWS RE: Invent 2024 في ديسمبر الماضي ، أعلنت الشركة عن Project Rainier – AI Supercant الإنسان. وضعت AWS 8 مليارات دولار في دعم الإنسان.
قال مدير AWS كبير في هندسة العملاء والمشاريع ، جادي هوت ، إن أمازون تتطلع إلى تقليل تكاليف تدريب الذكاء الاصطناعى وتوفير بديل لوحدات معالجة الرسومات باهظة الثمن في NVIDIA ، أو وحدات معالجة الرسومات.
وفقًا لـ AWS ، يتم تشغيل نموذج كلود أوبوس 4 منظمة العفو الدولية على GPUs على GPUs ، وفقًا لـ AWS ، ويتم تشغيل Project Rainier من قبل أكثر من نصف مليون من الرقائق – وهو أمر كان من شأنه أن يذهب تقليديًا إلى Nvidia.
قال Hutt إنه على الرغم من أن Blackwell من Nvidia هي رقاقة ذات أداء أعلى من Trarium2 ، فإن رقاقة AWS تقدم أداءً أفضل في التكلفة.
وقال: “يخرج Trarium3 هذا العام ، ويضاعف أداء Tradium2 ، وسيوفر الطاقة بنسبة 50 ٪ إضافية”.
إن الطلب على هذه الرقائق يفوق العرض بالفعل ، وفقًا لرامي سينو ، مدير الهندسة في AWS ‘Annapurna Labs.
وقال “العرض لدينا كبير جدًا ، لكن كل خدمة نقوم ببنائها لديها عميل مرتبط بها”.
من خلال ترقية Graviton4 في الأفق وشرائح Project Rainier ، تُظهر Amazon طموحها الأوسع للتحكم في مكدس البنية التحتية لمنظمة العفو الدولية بأكملها ، من الشبكات إلى التدريب إلى الاستدلال.
وبما أن المزيد من نماذج الذكاء الاصطناعي الرئيسية مثل Claude 4 تثبت أنها يمكن أن تتدرب بنجاح على الأجهزة غير Nvidia ، فإن السؤال ليس ما إذا كان يمكن لـ AWS التنافس مع عملاق الرقائق-إنه مقدار حصة السوق التي يمكن أن تتخذها.
سيتم توفير جدول الإصدار لتحديث Graviton4 بحلول نهاية يونيو ، وفقًا لمتحدث باسم AWS.




