QiStor تطلق برنامج تخزين القيمة الرئيسية لتسريع الأجهزة
موجود تخزين فلاش يستهلك الكثير من الطاقة ويهدر أداء مركز البيانات لأن طريقة تخصيص البيانات الخاصة به متجذرة في الماضي البعيد لمحركات الأقراص الصلبة الدوارة والنمط الثابت للكتل. والحل هو كتابة البيانات بتنسيق القيمة الرئيسية وقطع الوسيط الذي يحدد عنوان الكتلة.
هذه هي وجهة نظر شركة QiStor الناشئة في وادي السيليكون، والتي تخطط لدخول السوق ببرنامج تخزين على شريحة مخصصة تعمل على تسريع عمليات القراءة والكتابة بتنسيق القيمة الرئيسية.
المفتاح والقيمة هي طريقة شائعة لكتابة البيانات. في المفتاح والقيمة، يكون المفتاح هو اسم المتغير والقيمة هي – كما يوحي الاسم – قيمته. يمكن أن تكون المفاتيح والقيم بأي طول ضمن حدود معينة. يمكن أن تكون أنواع بيانات مختلفة، مثل الأرقام أو الأحرف أو حتى الصور أو الكائنات الأخرى. يمكن أيضًا أن تكون متداخلة، لذلك قد يكون للمفتاح قيمة هي مفتاح آخر، مع قيم ذات صلة.
القيمة الرئيسية منتشرة على نطاق واسع كتنسيق بيانات، حيث يتم العثور عليها في جيسون تنسيق، في مخزن البيانات etcd في Kubernetes، كنوع بيانات في لغات البرمجة Javascript وPython، من بين أمور أخرى، وهو أساس قواعد بيانات NoSQL.
ما يعالجه QiStor هو اتجاه ناشئ حيث يتم كتابة البيانات المخزنة وقراءتها مباشرة بتنسيق القيمة الرئيسية.
إن أحد الأسباب الرئيسية وراء ذلك هو أن الطريقة الحالية التي تتواصل بها أنظمة الملفات وقواعد البيانات مع أجهزة التخزين غالباً ما تكون غير فعّالة. ففي الأنظمة الحالية، يتم تخصيص البيانات عادةً إلى كتل بحجم 512 كيلوبايت على الوسائط. ويتعين على أنظمة الملفات أن تترجم بين تلك الطبقة المادية والبيانات كما يراها المستخدم والتطبيق. وهذا يؤدي إلى زيادة تكلفة المعالجة.
بالإضافة إلى ذلك، مع التخزين الفلاشي، من الطبيعي أن يتم مسح البيانات أثناء كتابتها وتحسينها ونقلها وما إلى ذلك على الوسائط، وإعدادها لإعادة الاستخدام. وهذا أيضًا – على سبيل المثال، جمع القمامة – يؤدي إلى عدم الكفاءة حيث يتم مسح البيانات وإعادة كتابتها.
قال آندي توملين، الرئيس التنفيذي لشركة QiStor: “إن ما لدينا بالفعل يعمل، ولكن مع الكثير من عدم الكفاءة، وهذا يعادل إهدارًا في السعة والأداء والطاقة. ما هو الحل الأمثل؟ يجب أن يتم تخصيص وتتبع المساحة في مكان واحد، على أدنى مستوى، وعلى أفضل الأجهزة أداءً.
“لذا، نعتقد أن الحل هو المفتاح والقيمة. فهو يوفر تجريدًا يمثل مرجعًا محددًا من قبل المستخدم. وليس الجهاز هو الذي يحدده. هناك طرق أخرى، لكن المفتاح والقيمة هو أبسط تجريد للمعلومات التي نريد تخزينها. في معظم قواعد البيانات، تكون الطبقة السفلية هي المفتاح والقيمة.”
وتحرص شركة QiStor على تسليط الضوء على القضية المتنامية المتمثلة في تشغيل مراكز البيانات والتي تفاقمت بسبب الزيادة في استخدام الذكاء الاصطناعي.
تتضمن هذه الخلفية أن مراكز البيانات تستخدم ما بين 1% و2% من الكهرباء العالمية، وأن تخزين البيانات يستهلك ما بين 20% و25% من تلك الكهرباء. وفي الوقت نفسه، وفقا للمنتدى الاقتصادي العالميتتضاعف قوة الحوسبة اللازمة لدعم نمو الذكاء الاصطناعي كل 100 يوم تقريبًا.
وبالتركيز على هذا الأمر، قال توملين إن الطلب الرئيسي من المرجح بشكل متزايد أن يكون على أجهزة مركز البيانات لتخفيف عبء المعالجة عن وحدة المعالجة المركزية. ويمثل استخدام وحدات معالجة الرسوميات لتسريع الأجهزة نموذجًا لهذا، ولكن هناك أيضًا وحدات معالجة البيانات وتسريع الشبكة وما إلى ذلك قيد الاستخدام.
العامل الثاني هو استخدام قواعد بيانات المتجهات للذكاء الاصطناعي، والتي قال توملين إن مخازن البيانات ذات القيمة الرئيسية هي الأساس الرئيسي لها.
تزعم شركة QiStor أنها حققت تسارعًا يتراوح بين 10x و100x بفضل وسائل مثل تحسين عمليات القراءة والكتابة، وتقليل أو إزالة جمع القمامة. لكن شركة QiStor لا تزال على بعد عام واحد من القدرة على تقديم منتج، كما يقول توملين، مضيفًا: “لقد قمنا ببناء الكثير من التكنولوجيا الأساسية، والآن سنقوم ببناء محرك التخزين”.
وتخطط الشركة لتطوير برمجياتها وتقديمها عبر شرائح تسريع FPGA، إما عبر خدمات سحابية تابعة لجهات خارجية أو يمكن للعملاء تخصيصها في البنية التحتية الخاصة بهم.
وقال توملين: “سيكون الأمر يتعلق بالعملاء الذين يشترون، على سبيل المثال، خدمة قاعدة بيانات سحابية مع تسريع الأجهزة ذات القيمة الرئيسية، أو سيشترون مجموعة خاصة بهم ويوفرون تسريعًا للقيمة الرئيسية”.
ما سيقدمه QiStor يختلف عن محركات الأقراص المحمولة ذات القيمة الرئيسية بدلاً من عنونة الكتلة، كما هو الحال في معيار NVMe KV.
وفي حديثه عن حالات الاستخدام المحتملة للعملاء، قال توملين: “من المثير للاهتمام بالنسبة للعملاء الذين لديهم مجموعات بيانات كبيرة، لذا ليس تلك التي تناسب الذاكرة. نحن نتحدث عن 1 بيتابايت أو أكثر، ولكن ليس أقل من 100 تيرابايت على الأقل. وفيما يتعلق بأحمال العمل، فإننا نتحدث عن تطبيقات الويب والتحليلات والذكاء الاصطناعي وأي شيء يتطلب الأداء وكميات كبيرة من التخزين”.
وأضاف توملين: “إذا كان العميل مهتمًا بعدد الخوادم التي يعمل عليها نظام القيمة الرئيسية، فربما نكون مثيرين للاهتمام. يدير بعض العملاء عشرات أو آلاف الخوادم التي تعمل بنظام القيمة الرئيسية… أقسام كاملة مخصصة لذلك. يبلغ حجم سوق قواعد البيانات 100 مليار دولار، وجزء كبير منها في نظام القيمة الرئيسية.