اختراق الاختناقات من الذكاء الاصطناعي

نظرًا لأن كبير موظفي المعلومات يتنافسون على تبني ونشر الذكاء الاصطناعي ، فإنهم يواجهون في النهاية حقيقة غير مريحة: بنيتهم التحتية لتكنولوجيا المعلومات ليست جاهزة للمنظمة العفوية. من واسع الانتشار نقص وحدة معالجة الرسومات والشبكات المعرضة للتقدم بسرعة متطلبات الطاقة المتساقطة، واجهوا الاختناقات التي تقوض الأداء وتعزيز التكاليف.
يقول سيد ناج ، نائب رئيس الأبحاث في Gartner: “يمكن أن يقلل إطار منظمة العفو الدولية غير الفعال إلى حد كبير من قيمة الذكاء الاصطناعي”. يضيف Teresa Tung ، قابلية البيانات العالمية الرصاص في Accenture: “ندرة وحدات معالجة الرسومات الراقية هي مشكلة ، ولكن هناك عوامل أخرى-بما في ذلك القوة والتبريد ، و تصميم مركز البيانات وسعةها – هذا التأثير النتائج. ”
الوجبات الجاهزة؟ تتطلب أعباء العمل التي تتطلبها منظمة العفو الدولية المكثفة والموارد قادة تكنولوجيا المعلومات لإعادة التفكير في كيفية تصميم الشبكات وتخصيص الموارد وإدارة استهلاك الطاقة. أولئك الذين يتجاهلون هذه التحديات يخاطرون بالتخلي عن سباق التسلح الذكاء – وقوضون أداء الأعمال.
نقاط الانهيار
المشكلة الأكثر وضوحًا والمبلغ عنها على نطاق واسع هي ندرة وحدات معالجة الرسومات المتطورة المطلوبة لاستنتاج نماذج الذكاء الاصطناعي وتشغيلها. على سبيل المثال ، وحدات معالجة الرسومات Nvidia Blackwell المرغوبة للغاية ، المعروفة رسميًا باسم GB200 NVL-72، كان يكاد يكون من المستحيل العثور عليه لعدة أشهر، كشركات كبرى مثل Amazon و Google و Meta و Microsoft جرفتها. ومع ذلك ، حتى إذا تمكنت شركة ما من الحصول على هذه الوحدات ، يمكن أن تكون تكلفة الخادم المكوّن بالكامل تكلف حوالي 3 ملايين دولار. نسخة أقل تكلفة ، خادم NVL36 ، يعمل حوالي 1.8 مليون دولار.
في حين أن هذا يمكن أن يؤثر على المؤسسة مباشرة ، فإن نقص وحدات معالجة الرسومات يؤثر أيضًا على مقدمي الخدمات السحابية الرئيسية مثل AWS و Google و Microsoft. إنهم على نحو متزايد الموارد والقدرة على نحو متزايد ، كما يقول ناغ. بالنسبة للشركات ، تداعيات واضحة. “عدم وجود بنية تحتية كافية للأجهزة المطلوبة لبناء نماذج الذكاء الاصطناعي ، يمكن أن يصبح تدريب النموذج بطيئًا وغير ممكن. كما يمكن أن يؤدي إلى اختناقات البيانات التي تقوض الأداء “.
نقص GPU هو مجرد قطعة من اللغز العام ، ولكن. بينما تتطلع المؤسسات إلى توصيل أدوات الذكاء الاصطناعى لأغراض متخصصة مثل رؤية الكمبيوتر أو الروبوتات أو الدردشة ، فإنها تكتشف أن هناك حاجة للبنية التحتية السريعة والفعالة المحسنة لمنظمة العفو الدولية.
يمكن أن يثبت زمن انتقال الشبكة تحديًا خاصًا. حتى التأخيرات الصغيرة في معالجة استفسارات الذكاء الاصطناعي يمكن أن ترتفع مبادرة. مجموعات GPU تتطلب ربطات عالية السرعة للتواصل بأقصى سرعة. تستمر العديد من الشبكات في الاعتماد على النحاس القديم ، الذي يبطئ بشكل كبير نقل البيانات ، وفقًا لتيري ثورن ، نائب رئيس العمليات التجارية لـ Ayar Labs ، وهو بائع متخصص في البنية التحتية المحسنة.
لا تزال هناك مشكلة محتملة أخرى هي مساحة مركز البيانات واستهلاك الطاقة. ترسم أعباء عمل AI-وخاصة تلك التي تعمل على مجموعات GPU عالية الكثافة-كميات هائلة من الطاقة. كمقاييس للنشر ، قد تتدافع مديري مديري المعلومات لإضافة الخوادم والأجهزة والتقنيات المتقدمة مثل التبريد السائل. يقول NAG إن الأجهزة غير الفعالة والبنية التحتية للشبكة ونماذج الذكاء الاصطناعي تؤدي إلى تفاقم المشكلة.
مما يجعل الطين سوءًا ، فإن ترقية الطاقة والبنية التحتية للتبريد معقدة وتستغرق وقتًا طويلاً. يشير NAG إلى أن هذه الترقيات قد تتطلب سنة أو أكثر لإكمالها ، وبالتالي إنشاء اختناقات إضافية قصيرة الأجل.
تحجيم ذكي
يعد تحسين الذكاء الاصطناعي معقدًا بطبيعته لأن التكنولوجيا تؤثر على المجالات المتنوعة مثل إدارة البيانات والموارد الحسابية وواجهات المستخدم. وبالتالي ، يجب أن تقرر CIOS كيفية التعامل مع مختلف مشاريع الذكاء الاصطناعي بناءً على حالة الاستخدام ونموذج الذكاء الاصطناعي والمتطلبات التنظيمية. ويشمل ذلك موازنة مجموعات GPU المحلية مع مزيج مختلف من الرقائق وخدمات الذكاء الاصطناعى السحابية.
يجب أن تنظر المنظمات كيفو متى و أين يقول تونج إن الخدمات السحابية ومقدمو الذكاء الاصطناعى المتخصصون منطقيون. إذا كان بناء مجموعة GPU داخليًا إما غير مرغوب فيه أو بعيد المنال ، فمن الأهمية بمكان العثور على مزود خدمة مناسب. وتقول: “عليك أن تفهم علاقات البائع مع مزودي GPU ، وما هي أنواع الرقائق البديلة التي يقدمونها ، وما الذي تمكنك من الوصول إليه بالضبط”.
في بعض الحالات ، قد تقدم AWS أو Google أو Microsoft حلاً من خلال منتجات وخدمات محددة. ومع ذلك ، توجد أيضًا مجموعة من شركات خدمات المتخصصين والمتخصصين ، وبعض الشركات الاستشارية – لهجة و ديلويت هل اثنان منهم – لديهم شراكات مباشرة مع Nvidia وبائعي GPU الآخرين. يقول تونج: “في بعض الحالات ، يمكنك الحصول على بيانات تتدفق عبر هذه النماذج والأطر المخصصة. يمكنك أن تميل إلى هذه العلاقات للحصول على وحدات معالجة الرسومات التي تحتاجها. ”
بالنسبة لأولئك الذين يقومون بتشغيل مجموعات GPU ، فإن زيادة أداء الشبكة أمر بالغ الأهمية. مع مقياس أعباء العمل ، تكافح الأنظمة مع قيود نقل البيانات. واحدة من نقاط الاختناق الحرجة هي النحاس. Ayar Labs ، على سبيل المثال ، تحل محل هذه التوصيلات مع ربطات بصرية عالية السرعة التي تقلل من الكمون واستهلاك الطاقة وتوليد الحرارة. والنتيجة هي أفضل استخدام GPU ولكن أيضًا معالجة النماذج الأكثر كفاءة ، خاصة بالنسبة للعمليات النامية على نطاق واسع.
في الواقع ، Ayar Labs المطالبات زمن انتقال أقل 10x وما يصل إلى 10x عرض النطاق الترددي على الترابط التقليدي. هناك أيضًا انخفاض في السلطة من 4x إلى 8x. لم تعد رقائق “في انتظار البيانات بدلاً من الحوسبة” ، وهي شوكة. يمكن أن تصبح المشكلة شديدة بشكل خاص حيث تتبنى المنظمات نماذج لغة كبيرة معقدة. ويضيف قائلاً: “زيادة حجم استخدام الأنابيب يعزز ويقلل من Capex”.
لا يزال هناك قطعة أخرى من اللغز هي كفاءة النموذج وعمليات التقطير. من خلال تكييف نموذج على وجه التحديد لجهاز كمبيوتر محمول أو هاتف ذكي ، على سبيل المثال ، غالبًا ما يكون من الممكن استخدام مجموعات مختلفة من وحدات معالجة الرسومات وحامل وحدات المعالجة المركزية. يقول تونج إن النتيجة يمكن أن تكون نموذجًا يعمل بشكل أسرع وأفضل وأرخص.
تلعب السلطة
من الضروري أيضًا معالجة متطلبات طاقة الذكاء الاصطناعي. يمكن أن تساعد استراتيجية الطاقة الشاملة في تجنب اختناقات الأداء على المدى القصير وكذلك نقاط الاختيار طويلة الأجل. يقول ناغ: “سيكون استهلاك الطاقة مشكلة ، إذا لم تكن مشكلة بالفعل بالنسبة للعديد من الشركات”. بدون إمدادات كافية ، يمكن أن تصبح الطاقة عائقًا أمام النجاح. كما يمكن أن تقوض الاستدامة وزيادة اتهامات خضرة. يقترح أن CIOS تنظر إلى الذكاء الاصطناعي بطريقة واسعة وشاملة ، بما في ذلك تحديد طرق لتقليل الاعتماد على وحدات معالجة الرسومات.
يمكن أن يؤدي وضع سياسات واضحة وإطار حوكمة حول استخدام الذكاء الاصطناعي إلى تقليل مخاطر إساءة استخدام مستخدمي الأعمال غير الفنيين أو إنشاء اختناقات عن غير قصد. تكون المخاطر أكبر عندما يلجأ هؤلاء المستخدمون إلى فرطات مثل AWS و Google و Microsoft. “بدون بعض التوجيهات والاتجاه ، يمكن أن يكون مثل المشي في متجر للحلوى وعدم معرفة ما يجب اختياره” ، يشير ناغ.
في النهاية ، يجب على إطار عمل المؤسسة AI سد كل من الإستراتيجية والبنية التحتية لتكنولوجيا المعلومات. ويوضح تونج أن الهدف هو “ضمان التحكم في شركتك في مصيرها في عالم يحركه الذكاء الاصطناعي.”