الأمن السيبراني

وحدات معالجة الرسومات تجبر مديري تكنولوجيا المعلومات على إعادة التفكير في مركز البيانات


لا يغير الذكاء الاصطناعي التوليدي الطريقة التي تمارس بها المؤسسات أعمالها فحسب، بل يغير الطريقة التي تستهلك بها موارد الحوسبة. تتطلب نماذج اللغات الكبيرة (LLMs) – بالإضافة إلى أدوات الذكاء الاصطناعي الأخرى مثل التوائم الرقمية والواقع الممتد والميتافيرس – أعدادًا هائلة من وحدات المعالجة الرسومية (GPUs) لتدريب مجموعات البيانات أو التعامل مع المهام الرسومية المكثفة.

ومع ذلك، هناك مشكلة. إن وحدات معالجة الرسومات غالية الثمن، وهي غير متوفرة، وتستهلك كميات هائلة من الطاقة. ونتيجة لذلك، يواجه مدراء تكنولوجيا المعلومات وغيرهم من قادة الأعمال وتكنولوجيا المعلومات بشكل متزايد مقترحات حول كيفية ومكان استخدامها. يقول آلان بريستلي، نائب الرئيس والمحلل لدى شركة Gartner: “من المهم جدًا فهم المهمة المطلوبة وتحقيق التوازن بين الحاجة إلى طاقة المعالجة والتكاليف.

وكل ذلك يؤدي مباشرة إلى مركز البيانات. تقول تيريزا تونغ، كبيرة خبراء التكنولوجيا في شركة Cloud First في شركة Accenture، إنه مع انتشار الذكاء الاصطناعي، يجب على المؤسسات التكيف. لا يكفي أن نفهم أين تحقق وحدات معالجة الرسومات مكاسب استراتيجية، يجب على مديري تقنية المعلومات اتخاذ قرارات حاسمة حول متى يتم استخدام وحدات معالجة الرسومات أو وحدات المعالجة المركزية وما إذا كان يجب التعامل معها تمرين, الاستدلالوالمهام الأخرى في مكان العمل أو في السحابة.

الأداء الأقصى

على الرغم من كل الضجيج الأخير حول GenAI، فقد كانت وحدات معالجة الرسومات تتدفق إلى مراكز البيانات لأكثر من عقد من الزمن. تلعب معالجات الرسومات دورًا رئيسيًا في البحث العلمي والتعلم العميق والتعلم الآلي والعديد من المهام الأخرى، بما في ذلك الرؤية الآلية والروبوتات والأتمتة. يقول بريستلي: “لقد أصبحت أداة قيمة للتعامل مع عمليات المحاكاة المعقدة وتحديات البيانات الضخمة”.

متعلق ب:ما هو التبريد السائل وكيف يمكن أن يساعد مراكز البيانات؟

لكن الأمور تغيرت بطريقة دراماتيكية في نوفمبر 2022. بعد ذلك الإصدار العام من ChatGPT – والظهور اللاحق لأطر عمل GenAI مثل Microsoft Copilot وGoogle Gemini – بدأت المؤسسات بنشاط في استكشاف طرق تفعيل ماجستير إدارة الأعمال. وسرعان ما أصبح من الواضح أن تخصيص الذكاء الاصطناعي أمر بالغ الأهمية لتحقيق مهام محددة، بما في ذلك روبوتات الدردشة، وإنشاء المحتوى، وتكرار التصميم، وأبحاث السوق، والأمن السيبراني، واكتشاف الاحتيال، والنماذج الأولية للمنتج، ومختلف حالات الاستخدام الأخرى.

اليوم، الطلب على وحدات معالجة الرسومات في مراكز البيانات يتزايد بشكل كبير. أ 2024 يذاكر وجدت دراسة أجرتها شركة الاستثمار العقاري JLL أنه بحلول عام 2027، سيصل متوسط ​​كثافة الرفوف في مراكز البيانات إلى 50 كيلووات لكل رف، وهو ما يتجاوز المتوسط ​​الحالي البالغ 36 كيلووات. وأشار التقرير إلى أن “التقدم الهائل للذكاء الاصطناعي والتعلم الآلي يغذي موجة من التحولات التحويلية في تصميم مراكز البيانات واختيار المواقع واستراتيجيات الاستثمار”.

وفي الوقت نفسه، أصبحت وحدات معالجة الرسومات (GPU) باهظة الثمن بشكل متزايد. على سبيل المثال، نفيديا جي فورس آر تي إكس 4090، وهو نموذج من أفضل الطرازات تم نشره على نطاق واسع والذي تم تقديمه في عام 2022، ويبدأ بسعر حوالي 1600 دولار لكل وحدة. لا تزال وحدات معالجة الرسومات الأقل تكلفة مع ذاكرة فيديو أقل تكلف مئات الدولارات. لكن الاستثمار الأولي في الأجهزة ليس سوى مجرد نقطة بداية. عادةً ما تستهلك وحدات معالجة الرسوميات طاقة مضاعفة أو ثلاثة أضعاف ما تستهلكه وحدات المعالجة المركزية (CPU)، بينما تتطلب تبريدًا قويًا وكابلات أكثر تفصيلاً.

متعلق ب:هل مستقبل مراكز البيانات تحت البحر؟

الخط السفلي؟ تنفد المساحة والطاقة في العديد من مراكز البيانات لتشغيل وحدات معالجة الرسومات. وبالتالي، يجب على مديري تكنولوجيا المعلومات اتخاذ بعض القرارات الصعبة حول كيفية التعامل مع الذكاء الاصطناعي – ومتى تقدم وحدات معالجة الرسومات مزايا واضحة. بالنسبة لبعض المهام المتوازية بشكل كبير مثل أعباء عمل تدريب الذكاء الاصطناعي، يمكن لوحدات معالجة الرسوميات في الواقع تقليل التكلفة الإجمالية للملكية عن طريق إجراء العمليات الحسابية بشكل أسرع بكثير. ومع ذلك، بالنسبة لأحمال العمل الأخرى، مثل استدلال الذكاء الاصطناعي، توفر وحدات المعالجة المركزية عادةً أداءً كافيًا مع خفض تكاليف التشغيل لكل واط.

يقول تونغ إن نقطة البداية هي تحديد حالة الاستخدام المحددة ومستوى الأداء والدقة المطلوبين. عند هذه النقطة، من الممكن دمج عوامل مثل التكاليف ومخرجات الكربون وتحديد الأجهزة التي سيتم استخدامها وما إذا كان يجب أن تتم المعالجة في السحابة أو في مكان العمل. يتطلب تدريب النموذج الأساسي وحدات معالجة الرسومات، لكن الاستدلال قصة مختلفة. وفي بعض الحالات، “يمكنك حتى إجراء الاستدلال على جهاز كمبيوتر محمول أو جهاز محمول”، كما تقول.

متعلق ب:تقنيات تبريد مراكز البيانات تستهدف الاستدامة

مسرحيات القوة

يقول تونغ إن المقارنة المعيارية أمر بالغ الأهمية لبناء بنية تحتية محسنة لتكنولوجيا المعلومات تعتمد على الذكاء الاصطناعي. فهو يوفر نظرة ثاقبة جنبًا إلى جنب حول كيفية تعامل وحدات معالجة الرسومات ووحدات المعالجة المركزية مع مهام محددة. من خلال مقارنة المقاييس الخاصة بأداء النموذج وبنيته، يستطيع مدير تقنية المعلومات تحديد أفضل معالج – أو مزيج من الأجهزة – لمهمة محددة. من الممكن أيضًا تحديد الترقيات الأساسية وعرض بيانات التكلفة والأداء وبصمة الكربون في سياق أساليب مختلفة.

على سبيل المثال، تحتفظ جامعة ستانفورد ب معيار هيلم الذي يقارن النماذج الأساسية، بما في ذلك النماذج المُدارة ونماذج مصدر القلم، بمقاييس مثل الدقة والأداء. يساعد هذا المعيار الشركات على تحديد فوائد الحفاظ على نموذجها المخصص والمقايضات المتعلقة بحجم النموذج. يعد هذا أمرًا بالغ الأهمية لأن فهم حجم النموذج يساعد في تحديد عدد وحدات معالجة الرسومات اللازمة للتدريب، وما إذا كانت وحدات معالجة الرسومات مطلوبة للاستدلال.

يمكن للأدوات الأخرى، مثل Geekbench وNovabench وBasemark GPU، أن تساعد المؤسسات أيضًا في التعمق في أداء GPU وتكاليفه.

وفي الوقت نفسه، قامت شركة Accenture بتطوير أداة خاصة تسمى لوحة التبديل. مسلحًا بمعلومات حول المفاضلات بين أداء النموذج والتكلفة والاستدامة، يستطيع مدير تكنولوجيا المعلومات اتخاذ قرارات مستنيرة بشأن موارد الحوسبة. يتضمن ذلك النموذج الذي سيتم استخدامه وما إذا كان من الأفضل استضافته محليًا أم في السحابة.

في بعض الحالات، “قد يكون من المنطقي استخدام مثيلات GPU المخصصة في مكان العمل عندما تكون أعباء العمل الأساسية والمتطلبات بمرور الوقت مفهومة جيدًا، أو لأسباب مثل السيادة أو خطورة البيانات”، كما يشير تونغ. ومع ذلك، فهي تقول إن السحابة هي الخيار الواضح لمعظم أعباء العمل. فهو يوفر بنية أكثر ديناميكية ومرونة وقابلة للتطوير. إنها أيضًا الطريقة الأسرع والأسهل للوصول إلى وحدات معالجة الرسومات النادرة.

يتطور مركز البيانات

يقدم الآن جميع موفري الخدمات السحابية الرئيسيين، بما في ذلك Microsoft Azure وGoogle Cloud Platform (GCP) وAmazon Web Services (AWS)، أجهزة افتراضية مزودة بوحدات معالجة رسومات متصلة مسبقًا أو خيار استئجار خوادم تدعم وحدة معالجة الرسومات. ونتيجة لذلك، ليست هناك حاجة للاستثمار في الأجهزة المادية. هذه الغيوم أيضًا لا تتجاهل سهولة الإدارة. أنها توفر أدوات عبور GPU التي تدير عوامل الأداء مباشرة على أجهزة GPU.

يتيح ذلك لمديري تكنولوجيا المعلومات توفير البيئات المعقدة وإدارتها، بما في ذلك المواقف المختلطة التي تتضمن كلاً من وحدات معالجة الرسومات ووحدات المعالجة المركزية. ويتضمن أدوات لتوسيع نطاق الموارد واستخدامها، وتكوين ذاكرة وحدة معالجة الرسومات، وإنشاء أنواع المثيلات لمهام محددة مثل التعلم الآلي أو تحرير الفيديو. بالإضافة إلى ذلك، تطبيقات الطرف الثالث مثل سكاي بايلوت السماح للمستخدمين بإدارة وتوسيع نطاق نماذج اللغات الكبيرة التي تعمل على وحدات معالجة الرسومات في السحابة.

مع فهم واضح للعوامل الحاسمة – بما في ذلك حجم واتساع مجموعة بيانات التدريب؛ ومن سيستخدمه؟ الحجم المتوقع للاستعلامات أو الزيارات على النظام؛ وكيفية تكديس وحدات معالجة الرسومات ووحدات المعالجة المركزية – من الممكن اتخاذ قرارات مستنيرة. على سبيل المثال، “في بعض الحالات، قد تكون هناك حاجة إلى أنواع مختلفة من وحدات معالجة الرسومات للاستدلال على النظام وتشغيله، أو قد تكون وحدة المعالجة المركزية المزودة بمسرعات مجهزة بشكل أفضل للتعامل مع النماذج الأصغر حجمًا”، كما يشير بريستلي.

من الممكن أيضًا عرض وحدات معالجة الرسومات ووحدات المعالجة المركزية من خلال عدسة الاستدامة ومقايضات أداء الكربون. يقول تونغ: “سنشهد طلبًا متزايدًا على الذكاء الاصطناعي والحاجة إلى وحدات معالجة الرسومات في المؤسسة. ولكن من المحتمل أيضًا أن نشهد مزيجًا أكبر من وحدات معالجة الرسومات ووحدات المعالجة المركزية لأن العديد من المهام تظل أكثر كفاءة من حيث التكلفة والكربون على وحدات المعالجة المركزية.





Source link

زر الذهاب إلى الأعلى