يهدف Vast Data Platform إلى التخزين في كل مكان لأحمال عمل AI/ML
بيانات واسعة تهدف إلى التوسع مع إطلاق منصة Vast Data التي ستوفر للعملاء تخزين يركز على الذكاء الاصطناعي/التعلم الآلي البنية التحتية التي تهدف إلى استبدال قاعدة البيانات الموجودة، وظائف بحيرة البيانات ومستودع البيانات.
ومن حيث الحجم والنتائج، فهو يهدف إلى “التعلم العالمي” و”التنفيذ المستمر” من أنظمة الذكاء الاصطناعي التي سيدعمها.
تتزاوج منصة البيانات الضخمة مع فلاش QLCأنظمة فرعية للتخزين المؤقت السريع مع إمكانات تشبه قاعدة البيانات على مستوى الإدخال/الإخراج للتخزين الأصلي (I/O)، بالإضافة إلى وظائف حساب الذكاء الاصطناعي التي تركز على التعلم المستمر والقدرة على ربط العديد من المثيلات بشبكة عالمية. إنه يتألف:
مخزن بيانات واسع: نطاق نظام التخزين الفرعي للشركة، والذي تم شحنه منذ عدة سنوات. تم تصميم هذا باستخدام فلاش QLC عالي الكثافة والذي يعمل في حاويات ذات سعة PB، مع ذاكرة من فئة التخزين (SCM) فيما يطلق عليه “تشكيل الكتابة”. هنا، يقوم SCM بالقراءة والكتابة على وحدات التخزين الكبيرة في خطوط سعة 1 جيجابايت لضمان عمر افتراضي مدته 10 سنوات لمحركات الأقراص QLC الخاصة به.
قاعدة بيانات واسعة: يؤدي ذلك إلى جلب الوظائف المشابهة لقاعدة البيانات إلى أساسيات كيفية تخزين البيانات في Vast. كما وصفها قائد المبيعات والتسويق الفني جيف دينورث، تضيف “قاعدة بيانات الجيل التالي” هذه طريقة وصول جدولية، مع بيانات وصفية تصف كيفية تنظيم كتل البيانات الموجودة على وسائط التخزين في ملفات وكائنات وجداول. وفقًا لشركة Vast، يتيح ذلك استيعابًا سريعًا للبيانات بالإضافة إلى كميات كبيرة من طلبات الاستعلام.
محرك البيانات الضخم: طبقة مبنية على أساس لغة Python، والتي توفر معالجة الذكاء الاصطناعي فوق وظائف التخزين. هنا، يقوم المحرك بتخزين ومعالجة الوظائف والمشغلات التي يمكنها، على سبيل المثال، توفير القدرة على إعادة كتابة الاستعلامات بناءً على نتائج معالجة الذكاء الاصطناعي الحالية. وفي هذا الصدد، تريد شركة Vast توفير منصة يمكنها توفير تعلم الذكاء الاصطناعي الذي يعمل على أساس ما تعلمته بالفعل.
مساحة بيانات واسعة: الشبكة الجغرافية الواسعة التي تجمع مثيلات Data Platform الخاصة بالعميل معًا في مساحة اسم واحدة عبر السحابة المحلية وجميع السحابات العامة الثلاث الكبرى (AWS وAzure وGCP). تتمثل الفكرة في إنشاء شبكة من الموارد الحسابية (وحدات المعالجة المركزية، ووحدات معالجة الرسومات، ووحدات DPU) التي يمكنها نقل البيانات لحسابها أو حسابها وفقًا لخطورة أي منهما.
مبادرة فاست هي مبادرة جريئة. في تقديم تخزين فلاش قائم على QLC يستهدف البيانات الثانوية، فهي ليست وحدها، مع أمثالها التخزين النقي و نت اب أيضا في السوق. إن إضافة طبقة من الوظائف والخدمات التي تركز على الذكاء الاصطناعي في الأعلى تمثل دفعة لشركة Vast للحصول على ميزة مميزة.
وقال دينورث: “ما نهدف إليه هو دمج إمكانات قاعدة البيانات وبحيرات البيانات والمستودعات والتخزين في نظام واحد”. وأضاف، “تضيف قاعدة بيانات Vast بنية بيانات جدولية وواجهة SQL إلى ما يشتريه العملاء بالفعل”، فيما يتعلق بالوظائف الموجودة في منتجات Vast منذ أوائل عام 2023 ولكن لم يتم بثها للعامة إلا الآن.
تتوقع شركة Vast أن يتم الاحتفاظ بالبيانات المنظمة المستمدة من التحليل المعتمد على الذكاء الاصطناعي للبيانات غير المنظمة والوصول إليها عبر هذا التنسيق الجدولي. كما أنها تأمل في استبدال خطوط أنابيب الذكاء الاصطناعي المعقدة المصنوعة من منتجات متعددة بمكدس واحد.
قال دينورث: “يتم الآن الدمج، ويمكنك رؤية Snowflake وDatabricks وما إلى ذلك”. “نحن نبني التكامل في طبقة التخزين. لقد رصدنا فجوة في السوق. هناك انقسام بين المكان الذي بدأت فيه هذه الشركات والتعلم العميق اليوم، وليس لديهم القدرة على التعامل مع البيانات غير المنظمة.
“نحن لا نحاول أن نكون OpenAI الجديد. نريد أن نكون بمثابة الغراء بين الأجهزة وطبقة التطبيق.
ومن بين عناصر المنتج المعلن عنها، لا يتوفر الآن سوى محرك البيانات، ومن المقرر إصداره في عام 2024. وقال: “لم نقم بفرز نموذج الأعمال بالكامل بعد”.