يخطط مقدمو الخدمات السحابية الفائقين لإنفاق دولار واحد على الأجهزة المحسنة للذكاء الاصطناعي (AI) بحلول عام 2028 ، وفقًا لباحث السوق Dell’oro.
وفي الوقت نفسه ، تنفق المؤسسات بشكل كبير على الذكاء الاصطناعي ، مع خطط لمشاريع الذكاء الاصطناعى التي تغذي إنفاق سجلات على أجهزة مركز البيانات في عام 2024. في آسيا ، وجدت IDC أن أفضل 100 شركة في المنطقة تخطط لإنفاق 50 ٪ من ميزانية تكنولوجيا المعلومات على الذكاء الاصطناعي.
على الرغم من كل ذلك ، فهي ليست مجرد حالة من رمي الأموال في الذكاء الاصطناعي.
هذه هي التدريب ، عندما يتم إنشاء الاعتراف من مجموعة بيانات نموذجية ، بدرجات متفاوتة من الإشراف على الإنسان ؛ والاستدلال ، حيث يتم وضع النموذج المدرب للعمل على مجموعات بيانات العالم الحقيقي.
ومع ذلك ، تبدأ مكونات مشروع AI الناجح قبل التدريب.
هنا ، نتحدث عن جمع البيانات وإعدادها ، ومع مجموعات البيانات التي يمكن أن تختلف بشكل كبير في الطبيعة. يمكن أن تشمل النسخ الاحتياطية والبيانات غير المهيكلة والبيانات المنظمة والبيانات برعاية مستودع البيانات. قد يتم الاحتفاظ بالبيانات لفترات طويلة وإعدادها لتدريب الذكاء الاصطناعى في عملية طويلة ومعتبر ، أو قد تكون مطلوبة بسرعة لتلبية الاحتياجات التي لم تكن متوقعة.
بمعنى آخر ، يمكن لبيانات الذكاء الاصطناعي أن تأخذ أشكالًا متعددة وتنتج متطلبات غير متوقعة من حيث الوصول.
بمعنى آخر ، الذكاء الاصطناعي جائع للغاية من حيث الموارد.
تعتبر تعويض وحدات معالجة الرسومات (GPUs) معروفة ، لكنها تستحق التخلص منها. لذلك ، على سبيل المثال ، عندما تدربت Meta نموذج LLAMA 3.1 لغة كبيرة (LLM) ، تم الإبلاغ عن استغرق الأمر حوالي 40 مليون ساعة GPU على 16000 وحدة معالجة الرسومات. سنعود إلى ما يعنيه ذلك للتخزين أدناه.
جزء كبير من هذا هو أن الذكاء الاصطناعى يستخدم بيانات ناقلات. ببساطة ، عند تدريب نموذج ، يتم ترجمة سمات مجموعة البيانات التي يتم تدريبها بيانات ناقلات – أبعاد عالية –.
هذا يعني أن البيانات – على سبيل المثال ، يتم تحويل الخصائص العديدة لمجموعة بيانات الصور – إلى مجموعة مرتبة من نقاط البيانات على محاور متعددة بحيث يمكن مقارنتها ، وقربها من بعضها البعض ، وتشابهها أو تحديدها بطريقة أخرى.
والنتيجة هي أن قواعد بيانات المتجهات غالباً ما ترى نموًا كبيرًا في حجم مجموعة البيانات مقارنة ببيانات المصدر ، مع ما يصل إلى 10 مرات ممكنة. أن كل شيء يجب تخزينه في مكان ما.
بعد ذلك ، هناك تحقق متكرر للسماح بالشفاء من الإخفاقات ، وأن تكون قادرًا على التراجع إلى الإصدارات السابقة من النموذج ، يجب أن تحتاج النتائج إلى ضبط ، وأن تكون قادرًا على إظهار الشفافية في التدريب لأغراض الامتثال. يمكن أن يختلف حجم نقطة التفتيش وفقًا لحجم النموذج وعدد نقاط التفتيش المطلوبة ، ولكن من المحتمل أن يضيف حجم بيانات كبير إلى متطلبات سعة التخزين.
ثم هناك جيل معزز للاسترجاع (خرقة)، الذي يعزز النموذج بالبيانات الداخلية من المؤسسة ، وذات صلة بالتخصص الرأسي أو الأكاديمي في الصناعة ، على سبيل المثال. هنا مرة أخرى ، تعتمد بيانات RAG على متجه مجموعة البيانات للسماح بدمجها في البنية الكلية.
لزيادة فرص نجاح الذكاء الاصطناعي إلى الحد الأقصى ، تحتاج المؤسسات إلى التأكد من أن لديها القدرة على تخزين البيانات اللازمة لتدريب الذكاء الاصطناعى والمخرجات التي تنتج عنها ، ولكن يتم تحسين هذا التخزين حتى يمكن الحفاظ على الطاقة لمعالجة البيانات بدلاً من الاحتفاظ بها في صفائف التخزين
كل هذا يأتي قبل استخدام نماذج الذكاء الاصطناعي في الإنتاج.
يأتي بعد ذلك الاستدلال ، وهو نهاية إنتاج الذكاء الاصطناعي عندما يستخدم النموذج البيانات التي لم يرها من قبل استخلاص الاستنتاجات أو تقديم رؤى.
الاستدلال أقل جاذبية للموارد ، خاصة في المعالجة ، ولكن لا يزال يجب تخزين النتائج.
وفي الوقت نفسه ، في حين يجب الاحتفاظ بالبيانات للتدريب والاستدلال ، يتعين علينا أيضًا النظر في ملف تعريف استخدام الطاقة لحالات استخدام الذكاء الاصطناعي.
وهذا الملف الشخصي مهم. تشير بعض المصادر إلى أن معالجة الذكاء الاصطناعى تستغرق شمالًا من طاقة أكثر من 30 مرة لتشغيلها أكثر من البرامج التقليدية الموجهة للمهمة ، وأن متطلبات الطاقة في مرحلة البيانات يتم تعيينها على أكثر من ضعف بحلول عام 2030.
على مستوى الرف ، تشير التقارير إلى أن استخدام كلود كيلووات (KW) قد قفز من شخصيات فردية أو مراهقين إلى 100 كيلو وات. هذه قفزة هائلة ، وهي تعود إلى الطبيعة المتعطشة لقياس وحدات معالجة الرسومات أثناء التدريب.
المعنى الضمني هنا هو أن كل واط المخصص للتخزين يقلل من عدد وحدات معالجة الرسومات التي يمكن تشغيلها في مجموعة AI.
ما نوع التخزين الذي تتطلبه الذكاء الاصطناعي؟
تتمثل مهمة تخزين البيانات في الذكاء الاصطناعي في الحفاظ على إمدادات البيانات إلى وحدات معالجة الرسومات لضمان استخدامها على النحو الأمثل. يجب أن يكون للتخزين أيضًا القدرة على الاحتفاظ بأحجام كبيرة من البيانات التي يمكن الوصول إليها بسرعة. يعد الوصول السريع مطلبًا لإطعام وحدات معالجة الرسومات ، ولكن أيضًا لضمان أن تتمكن المنظمة من استجواب مجموعات بيانات جديدة بسرعة.
هذا على الأرجح يعني تخزين الفلاش للوصول السريع والكمون المنخفض. من الواضح أن السعة ستختلف وفقًا لمجموعة عبء العمل ، لكن المئات من terabytes ، حتى Petabytes ، ممكنة.
كثافة عالية فلاش خلية رباعية المستوى (QLC) برز كمنافس قوي للتخزين للأغراض العامة ، بما في ذلك ، في بعض الحالات ، لمجموعات البيانات التي يمكن اعتبارها “ثانوية” ، مثل بيانات النسخ الاحتياطي. استخدام QLC يعني أن العملاء يمكنهم تخزين البيانات على تخزين الفلاش بتكلفة أقل. ليس أقل من منخفض مثل قرص الغزل ، ولكن بعد ذلك يأتي QLC مع القدرة على الوصول إلى البيانات بسرعة أكبر بكثير لأعباء عمل الذكاء الاصطناعي.
في بعض الحالات ، يقدم موردو التخزين حزم البنية التحتية لمنظمة العفو الدولية معتمدة للعمل مع حساب NVIDIA ، وتأتي مع التخزين الأمثل لأعباء عمل الذكاء الاصطناعى وكذلك خطوط أنابيب الخرقة التي تستخدم الخدمات الصغيرة nvidia.
غالبًا ما تستخدم السحابة في أعباء عمل الذكاء الاصطناعي ، لذلك يجب أيضًا تقييم تكامل مورد التخزين مع التخزين السحابي. يجلب الاحتفاظ بالبيانات في السحابة أيضًا عنصرًا من قابلية النقل ، مع إمكانية نقل البيانات إلى موقع المعالجة.
غالبًا ما تبدأ مشاريع الذكاء الاصطناعي في السحابة بسبب القدرة على الاستفادة من موارد المعالجة عند الصنبور. في وقت لاحق ، قد يحتاج المشروع في الموقع انفجر إلى السحابة، لذا ابحث عن مقدمي الخدمات الذين يمكنهم تقديم اتصالات سلسة وتجانس البيئة بين مركز البيانات وتخزين السحابة.
يحتاج نجاح منظمة العفو الدولية إلى البنية التحتية الصحيحة
يمكننا أن نستنتج أن النجاح في الذكاء الاصطناعي على مستوى المؤسسة يستغرق أكثر من مجرد امتلاك المهارات المناسبة وموارد البيانات.
الذكاء الاصطناعي جائع للغاية في تخزين البيانات واستخدام الطاقة. لذلك ، لزيادة فرص النجاح إلى الحد الأقصى ، تحتاج المؤسسات إلى التأكد من أن لديها القدرة على تخزين البيانات اللازمة لتدريب الذكاء الاصطناعى والمخرجات التي تنتج عنها ، ولكن يتم تحسين هذا التخزين حتى يمكن الحفاظ على الطاقة لمعالجة البيانات بدلاً من الاحتفاظ بها في صفائف التخزين.
كما رأينا ، غالبًا ما يكون تخزين الفلاش-و flash QLC على وجه الخصوص-يوفر الوصول السريع والكثافة وكفاءة الطاقة اللازمة لتوفير أفضل فرص النجاح.