تقنية

توفر شركة الذكاء الاصطناعي مليون دولار في التحول إلى التخزين المشترك لـ Pure FlashBlade


وفرت شركة Crater الاستشارية للذكاء الاصطناعي ومقرها تورونتو حوالي 1.5 مليون دولار كندي (885000 جنيه إسترليني) من وقت البحث بعد أن استبدلت وحدات التخزين المتصلة المباشرة التي يصعب تكوينها بسعة مشتركة في مجموعة FlashBlade من التخزين النقي.

وقد أدت هذه الخطوة إلى إلغاء حاجة الباحثين إلى قضاء بعض الوقت تقريبًا تكوين البنية التحتية للتخزين للذكاء الاصطناعي التدريب يعمل على مشاريع العملاء.

توفر كريتر إثباتًا للمفهوم وأعمالًا بحثية في الذكاء الاصطناعي لعملائها. ويركز هذا على مرحلة التدريب على الذكاء الاصطناعي، وعند الانتهاء منها يتم تسليم المشاريع إلى العميل.

وتشمل التجارب التي أجرتها للعملاء تطوير الذكاء الاصطناعي من أجل: اكتشاف العيوب في عمليات التصنيع؛ تحليل بيانات هيئة الأوراق المالية والبورصة في ثلاثة أيام بدلاً من 10؛ حساب طرق التسليم لآلاف الشاحنات في وقت أقل بمقدار الثلثين؛ واكتشاف الحالات الشاذة في الفواتير بدقة تصل إلى 93% لشركات الاتصالات والمرافق.

“يمكن للعملاء القيام بمعالجة AI/ML قال إيدو: “لكنهم غير قادرين على إجراء أبحاث داخل الشركة لتطوير شيء غير متوفر على الرفوف”. “يأتينا العملاء لتطوير نماذج جديدة بناءً على أحدث ما يخرج من الأوساط الأكاديمية.”

في السابق، كان Crater يعمل في السحابة أو على أقراص فلاش متصلة وموجهة داخليًا في الخوادم.

وقال إيدو إن تشغيل الذكاء الاصطناعي في السحابة أثبت أنه مكلف بالنسبة للشركة. وقال: “إن مشاريعنا غالبًا ما تكون عبارة عن مجموعات بيانات يبلغ حجمها عدة تيرابايت، ولم يكن التدريب في السحابة هو الشيء الأكثر عملية”. “تتنوع مجموعات البيانات لأن لدينا مشاريع متعددة يتم تشغيلها للعملاء في وقت واحد، وهو ما قد يعني العديد من أنواع الملفات وأحجامها، مما أدى إلى فرض قيود على كيفية تفاعلنا مع الخدمات المقدمة من موفر السحابة.”

داخليًا، ظهرت الحدود عند محاولة تغذية نماذج متعددة بالتوازي مع وسائط تخزين غير متجانسة مقسمة عبر خوادم متعددة.

قال إيدو: “من الممكن أن يكون هناك 12 مشروعًا في وقت واحد، وكان باحثونا بحاجة إلى تهيئة مساحة التخزين لهم”. “يمكن أن تتراوح أنواع البيانات من الصور الكبيرة جدًا إلى قواعد البيانات، وكلها مختلفة جدًا الإدخال/الإخراج [input/output] التوقيعات.

“نظرًا لأن كل خادم كان لديه مساحة تخزين خاصة به، فقد كان هناك الكثير من البيانات التي يتم خلطها إلى المكان الصحيح، ولكننا لا نزال في كثير من الأحيان لا يمكن تشبع وحدات معالجة الرسومات [graphics processing units]،” هو قال. “لم نرغب في التعامل مع كل ذلك. لقد استغرق باحثونا ثلاثة أو أربعة أيام لتهيئة التخزين لكل تجربة.

لذلك تحولت Crater إلى Pure Storage FlashBlade، الذي يستهدف البيانات غير المنظمة في أحمال عمل تخزين الملفات والكتل ويأتي مع محركات أقراص فلاش TLC أو QLC (سعة أعلى).

يشغل Crater حوالي 127 تيرابايت من سعة FlashBlade التي توفر سعة تخزين عبر Ethernet لمجموعات خوادم AI المستندة إلى Linux والتي تقوم بتشغيل “عدة عشرات” من وحدات معالجة الرسومات Nvidia. يتم توزيع أعباء عمل الذكاء الاصطناعي عبر الحاويات، والتي يتم تزويدها بسهولة بسعة تخزين.

ومن بين الفوائد الرئيسية أن الباحثين الآن لا يضطرون إلى قضاء بعض الوقت في إعداد مساحة التخزين لكل عملية تدريب على الذكاء الاصطناعي. قال إيدو: “لقد استغرق الباحثون حوالي 10% من الوقت الذي يقضونه في كل مشروع للعمل على المهام المتعلقة بالبنية التحتية”. “لقد تم القضاء على هذا عمليا الآن. نحن لا نفكر مرتين بشأن موقع البيانات.”

وقال إن ذلك يعني أن الوقت اللازم لتدريب العارضات انخفض بنسبة تتراوح بين 25% و40%. وقال إيدو: “هذا يعني أن الفريق لن يجلس لمدة أسبوعين أو ثلاثة أسابيع في الانتظار”. “اضرب ذلك عبر 12 تجربة وأربعة إلى ستة باحثين، وسيكون هذا تأثيرًا مضاعفًا كبيرًا جدًا. نحن نوفر ما يقرب من 1.5 مليون دولار كندي دون الاضطرار إلى قضاء الوقت في إنشاء البنية التحتية.



Source link

زر الذهاب إلى الأعلى