Pure CEO: يحتاج الذكاء الاصطناعي إلى سرعة الكتابة والتخزين
التقينا مع تشارلي جيانكارلو، الرئيس التنفيذي لشركة Pure Storage، في حدث Accelerate الذي أقامته الشركة في لاس فيغاس هذا الأسبوع. وقدم لنا وجهة نظره حول السبب سرعة الكتابة للتخزين هو المفتاح ل نقاط التفتيش في أعباء عمل الذكاء الاصطناعي (AI).، لماذا تهدف Pure إلى إتاحة بيانات الشركة، بسرعة، وفي المكان الذي تؤدي فيه أعمالها اليومية، كيف توقعاته بزوال محرك الأقراص الثابتة (HDD) يسير على الطريق الصحيح، ولماذا لا يستطيع المنافسون نسخ وحدات الفلاش عالية السعة من Pure.
كيف يغير الذكاء الاصطناعي تخزين البيانات؟
ما يحظى بأكبر قدر من الاهتمام في الصحافة هو وحدة معالجة الرسومات الكبيرة [graphics processing unit] سحابة واسعة النطاق بيئات من نوع الذكاء الاصطناعي، لأنها صفقات كبيرة ومن المثير أن نسمع عن عشرات الآلاف من وحدات معالجة الرسومات.
بالنسبة للتخزين، يعد هذا أمرًا مثيرًا للاهتمام ولكنه يمثل إحدى الفرص الأصغر. الفرصة التالية المثيرة للاهتمام هي سوق استدلال الذكاء الاصطناعي. يتعلق الأمر بأخذ الشركات هذه النماذج المختلفة، LLMs [large language models] وما إلى ذلك وهلم جرا، وتطبيقها على بيئتهم وبياناتهم الخاصة – مثل شركات الأدوية التي تستخدم طي البروتين أو تحليل الأدوية، وشركات التداول عالية السرعة لتحليل الأسهم، والبنوك الكبرى لعمليات الاحتيال، وشركات الاتصالات لعمليات الشبكة – وقد عملنا على بناء الحلول الرأسية المتكاملة ذات الصلة لتلك الأنواع من البيئات.
وهذا يعني تجميعها مع البرامج، وإعداد البيانات وتنظيمها، وقواعد البيانات المتجهة، وما إلى ذلك، حتى يتمكن علماء البيانات لديهم من البدء والتشغيل بسرعة.
وأيضًا، هناك ما نفعله مع Fusion. تقليديًا، ما كان يفعله العميل هو معالجة البيانات وتنظيمها ونسخها من البيئات ذات الصلة إلى مستودع البيانات أو بحيرة البيانات ووضعها في Hadoop أو ما شابه لإجراء التحليل. نعتقد أن هذا سخيف. لماذا لا يمكن الوصول إلى البيانات على المصفوفات التي تؤدي عليها مهمتها الأساسية فقط من خلال الحصول على أداء كافٍ هناك وربط البيانات بالشبكة؟
كيف يساعد Pure Storage في التعامل مع أعباء عمل الذكاء الاصطناعي؟
يمكنك الآن الوصول إلى مجالات الأداء للبيئات الكبيرة حقًا. على سبيل المثال، تمتلك Meta 24000 وحدة معالجة رسوميات. عميل آخر لديه 10000 وحدة معالجة رسوميات. ومن ثم تحتاج إلى توفير جيجابايت أو مئات الجيجابايت في الثانية من الإنتاجية، ومنتج FlashBlade الخاص بنا قادر على القيام بذلك.
تشارلي جيانكارلو، التخزين النقي
الشيء الذي لم يتم الحديث عنه كثيرًا – المقياس الرئيسي – هو الكتابة، بسبب نقاط التفتيش. يمكن أن تعمل نماذج LLM الكبيرة لأيام وأسابيع، وإذا حدث خطأ ما، فلن ترغب في العودة إلى البداية. لذلك يأخذون جميع البيانات الموجودة في النموذج ويكتبونها في الذاكرة غير المتطايرة.
تبلغ مساحة الكتابة مئات الجيجابايت ويتوقف النموذج عند هذه النقطة – كلما توقفت لفترة أطول، كلما لم تتقدم للأمام.
لذا فإن سرعة الكتابة مهمة للغاية. لا يقتصر الأمر على أننا نمتلك أفضل سرعات الكتابة وأكثرها اتساقًا فحسب، بل إننا لا نستخدم نماذج التخزين المؤقت، كما أننا جيدون للغاية في سرعات الكتابة. ولهذا السبب اختارتنا شركة Meta لمجموعتها البحثية الفائقة.
في حدث العام الماضي، تنبأت بزوال محرك الأقراص الثابتة ذو الأقراص الدوارة. كيف هو التقدم في ذلك؟
أستطيع أن أقول لك بعض الأشياء.
تستمر مجموعة E من صفيفات التخزين عالية الكثافة التي يتم تسعيرها ووضعها في مقابل بيئات تخزين محركات الأقراص الثابتة في النمو بسرعة كبيرة.
لقد قلت علنًا إنني أعتقد أننا سنحصل على أول تصميم لنا في وحدة Hyperscaler هذا العام، وذلك على وجه التحديد لاستبدال وحدة التخزين القياسية الخاصة بهم وفي بيئة تخزين كبيرة جدًا.
بدأت المحادثة حول استبدال وحدات التخزين المعتمدة على الأقراص، والتي توجد بها طبقات متعددة، ولكنهم الآن يتحدثون عن جميع وحدات التخزين الخاصة بهم عبر الإنترنت.
وإذا كنا نتحدث عن العديد من المتسابقين الفائقين، كما هو الحال في أي موقف يوجد فيه حصان رئيسي، فأنا واثق بشكل معقول من أننا سنوقع هذا الحصان الرئيسي هذا العام. قد تتخيل أنه إذا لم نكن عند نقطة سعر يمكن أن تحل محل القرص، فمن غير المرجح أن يقوم المقياس الفائق بذلك.
ليس لدي أي قلق بشأن توقعاتي السابقة.
هل تستطيع سلسلة التوريد التعامل مع مثل هذا التحول إلى الوميض؟
سؤال جيد – وهو سؤال يطرحه المقياس الفائق. إذا قالوا جميعًا: “نريد أن نفعل هذا العام المقبل”، فلن تتمكن سلسلة التوريد من التعامل مع الأمر. ولكن هناك منحدر لكل شيء. هناك منحدر إلى المقياس الفائق الأول، وهناك منحدر إلى الثاني والثالث.
أعتقد أن قدرة سلسلة التوريد على تلبية الطلب على الفور وزيادة مدته، على سبيل المثال، لمدة خمس سنوات موجودة.
الجانب الضعيف للغاية في سوق محركات الأقراص الثابتة هو المقياس الفائق – 60% من مبيعاتها تذهب إلى المقياس الفائق. إذا بدأ في التبديل، فإنه يبدأ بالفعل في نقل الحجم خارج السوق.
ما الذي يمنع الموردين الآخرين من صنع وحدات فلاش عالية السعة؟ هواوي، على سبيل المثال، تخطط لـ 128 تيرابايت [terabyte] محرك أقراص فلاش للعام المقبل؟
لا يوجد ما يمنع أي شخص من نسخ سوق دبي المالي الخاص بنا [DirectFlash Module]. يمكنك إلقاء نظرة عليه وشراء نفس الرقائق وبنائه. انها ليست SSD [solid-state drive]. إنه فلاش على بطاقة تحتوي على شيء للتحدث مع المزيد من الحافلات، وهو جهاز تحكم صغير.
ما ليس من السهل إنشاؤه هو البرنامج الذي يقوم بتشغيل DFMs لأن SSD شيء مختلف تمامًا – فهو عبارة عن وحدة فلاش تحتوي على أجهزة وبرامج لجعلها تبدو وكأنها قرص ثابت.
تشارلي جيانكارلو، التخزين النقي
عد 15 عامًا إلى الوراء وقال الأشخاص الذين يصنعون الفلاش، هذا شيء رائع ونود رؤيته في أجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر المكتبية والخوادم. ولكن كان هناك العديد من أنظمة التشغيل المختلفة، ويعمل الفلاش بشكل مختلف تمامًا عن القرص الدوار. كان عليهم إقناع جميع الموردين بتغيير أنظمة التشغيل الخاصة بهم. لذلك قرروا جعل الفلاش يبدو وكأنه قرص صلب واخترعوا SSD.
لذا فإن SSD لديه أجهزة وبرامج لجعل الفلاش، وهو شبه موصل، يبدو وكأنه قرص صلب ميكانيكي. ومن خلال القيام بذلك، فإنه لا يوفر نفس مستوى الأداء أو الكفاءة الذي يوفره الفلاش الخام.
لذلك عليك إنشاء محركات أقراص SSD حتى تتمكن من الكتابة على الفور، واستعادة الخلايا وجعلها متاحة بسهولة، والحماية من انقطاع التيار الكهربائي، والقيام بكل هذه الأشياء على الوحدة نفسها. لذلك فهو يحتوي على الكثير من DRAM [dynamic random access memory]، معالج دقيق للقيام بكل عمليات التحويل إلى ما يتوقعه القرص الصلب.
الخلطة السرية موجودة في برنامجنا الذي يعمل على وحدات التحكم لدينا، أو في أي مكان يتصل بسوق دبي المالي.
يمكنك التفكير في الأمر على أنه الكثير من الترجمة الإضافية التي ليست ضرورية. تستهلك هذه الترجمة طاقة وأجهزة باهظة الثمن وتحد من الأداء.