تدريبات CTO النقية لأسفل على القيمة الرئيسية ، لا DFMS على FA // ST ، والكائن السريع

في هذا البودكاست ، المسجل في الأسبوع الماضي نقي // تسريع 2025 حدث ، نتحدث إلى كبير مسؤولي التكنولوجيا في Pure Storage (CTO) ، Rob Lee ، للحصول على تمرين على استخدام متاجر القيمة الرئيسية في نقاء الشركة تخزين فلاش نظام التشغيل ، لماذا لا تستخدم وحدات DirectFlash التي تم تجويفها في أعلن حديثا فلاشاراي // شارعوما الذي يجعل تخزين الكائن السريع بسرعة كبيرة.
هل يمكن أن تشرح كيف يتم استخدام متجر القيمة الرئيسية في منتجات تخزين Pure؟
سبب استخدامنا قيمة المفتاح المتجر ، وسأدخل في المزايا ، هو الكثير من الأسباب التي تفيد بأنك عندما تقوم بتنظيم كميات كبيرة من المعلومات ، فإنك تستخدم قاعدة بيانات علائقية.
تقوم بتنظيم معلوماتك بطريقة منظمة للغاية في الجداول. يمكنك بناء فهارس. يمكنك البحث عن الأشياء بكفاءة كبيرة. أنت تميل إلى القيام بذلك بدلاً من مجرد تخزين أكوام وأكوام من البيانات غير منظمة وجعل من الصعب للغاية البحث.
الآن ، نشأة الاستخدام متاجر القيمة الرئيسية في منتجاتنا وبرمجياتنا تعود إلى اليوم الأول من الشركة.
أحد الأشياء التي قمنا بها بشكل مختلف تمامًا عن أي شخص آخر في السوق هو صممها وإعادة التفكير في برنامج التخزين ، بما في ذلك أنظمة الملفات وكيف نخطط كتل منطقية للمواقع المادية. نحن نعيد التفكير في كيفية بناءها لكيفية عمل Flash على المستوى الأصلي. واحدة من الاعتبارات الرئيسية مع Flash ، على عكس الأقراص الصلبة المغناطيسية ، لا تكتب المحتويات في مكانها.
لتغيير المحتويات ، يجب عليك كتابة نسخة جديدة وعليك أن تجمع الشيء القديم. وعندما تفعل ذلك ، فأنت تريد تجنب إعادة كتابة نفس قطعة الفلاش مرارًا وتكرارًا لحرق الوسائط.
حسنًا ، اتضح أنه من خلال تنظيم البيانات الوصفية الخاصة بنا-وهو أمر فعال أن رسم الخرائط ، إذا أردت ، من أسماء الملفات ، نظام الملفات إلى الموقع الفعلي ، في متجر قيمة رئيسي ، من مجتمع الأبحاث ، هناك الكثير من التقنيات الرائعة لتقليل هذا التضخيم في الكتابة-عدد المرات التي يتعين علينا فيها إعادة كتابة هيكل البيانات الوصفية هذه مع مرور الوقت.
لذلك كان هذا هو المفتاح-لا يقصد التورية-البصيرة التي تدفعنا إلى تنظيم بيانات التعريف الخاصة بنا في متاجر القيمة الرئيسية.
القطعة الثانية رغم ذلك-ومرة أخرى ، فإن الاقتراض من عالم قاعدة البيانات ولماذا ترى الكثير من متاجر القيمة الرئيسية المستخدمة على نطاق السحابة-هي أنها تجعل من السهل حقًا تقسيم وتوزيع وخلق التزامن والتوازي.
وهكذا عندما تنظر إلى FlashBlade ولماذا يكون FlashBlade جيدًا بشكل فريد في أداء البيانات الوصفية – لقد تحدثت قليلاً عن هذا على المسرح [at Pure//Accelerate 2025] مع Flashblade EXA-لأننا نخزن كل ما البيانات الوصفية في متجر قيمة رئيسي يسمح لنا بخطية للغاية وبشكل كبير للغاية ، وتوسيع نطاق الأداء بطريقة لا يمكنك القيام بها ببساطة مع هياكل البيانات الأخرى.
لرسم مقارنة بسيطة للغاية ، تاريخيا ، نظمت معظم أنظمة التخزين بياناتها في بنية تشبه الأشجار. حسنًا ، إذا كنت تفكر في كيفية البحث عن شيء ما في شجرة ، فستبدأ من الأعلى ، وتذهب إلى اليسار ، وتذهب إلى اليمين ، وتذهب إلى اليسار ، وعليك أن تتبعه خطوة بخطوة.
[It’s] من الصعب جدا التوازي ذلك ، أليس كذلك؟ من خلال متجر القيمة الرئيسية ، يمكنك الاستفادة من الوسائط ، والفلاش ، والوصول الموازي ، يمكنك الاستفادة من تقنيتنا الموزعة ، ويمكنك البحث عن الأشياء بسرعة عالية للغاية ، مع تزامن كبير للغاية.
هل يتم تشغيل متجر القيمة الرئيسية فقط على مستوى البيانات الوصفية ، وهل نظام الملفات سليم في مكان آخر ، بالتوازي مع ذلك؟
ما هو لطيف حقًا في كيفية قيامنا ببناء برنامجنا هو استخدام نهج واحد لإدارة بيانات تعريف نظام الملفات ، وبيانات تعريف المستخدم ، وكذلك البيانات الوصفية الأكثر فعالية لدينا ، إذا صح التعبير. كل التعيينات بين … كما تعلمون ، نقوم بتقليل البيانات ، أليس كذلك؟ حسنًا ، عندما تقوم بتخفيض البيانات وتجد إلغاء بيانات إلغاء ، يجب عليك الاحتفاظ برسم خرائط يقول ، “أوه ، ليس لدي هذه الكتلة المخزنة جسديًا هنا ، هناك نسخة منفصلة هناك.”
حسنًا ، هذا رسم خرائط ؛ وضعنا ذلك في متجر القيمة الرئيسية. لذلك ، من خلال استخدام نفس النهج لإدارة جميع بيانات التعريف الخاصة بنا ، حسنًا ، إنه أقل برامج للكتابة ، B ، يمكننا أن نجعل ذلك حقًا قويًا وحقوقًا ، ولكن بعد ذلك C ، جميع أجزاء نظامنا ، سواء كان نظام الملفات ، أو ما إذا كان إدارة الوسائط الفعلية لدينا ، وحصل على فوائد الخصائص التي ناقشتها للتو.
تقدم Pure صفقة كبيرة حول استخدام وحدات DirectFlash الخاصة بها (DFMs) والقدرة التي يمكنهم تحقيقها ، ومع ذلك لا يستخدمها FlashArray // ST المعلن عنها حديثًا. ماذا تستخدم ولماذا؟
إنه سؤال رائع ، وننظر ، سأبدأ بالفلسفة التي لدينا وراء أجهزتنا. أعتقد أن ستيف جوبز قال ، إذا كنت ترغب في بناء برامج جيدة حقًا ، فسوف تقوم ببناء أجهزة لدعم ذلك ، وهذا نوع من فلسفتنا حقًا. إذا نظرت إلى DirectFlash ، ما الذي يجعل DFMS يعمل هو البرنامج الذي يمكّنهم.
نحاول وضع القليل جدًا في أجهزة DFM. إنه لتمكين البرنامج.
الآن ، السبب في أننا لا نستخدم DFMS في Fast اليوم أو مسار بيانات FlashBlade EXA ، مع أي تصميم ، يمكنك تصميم مجموعة من مساحة التصميم والأداء والكفاءة والتكلفة ، وما إلى ذلك ، و DFMs لدينا مصممة إلى حد كبير لمجموعة واسعة جدًا من احتياجات المؤسسة من حيث الكفاءة ، والقدرة ، وما إلى ذلك.
مع Fast و Flashblade EXA ، نحن نهدف إلى الطرف المتطرف الفائق ، المتطرف ، ونحن ببساطة لم نصمم محركات الأقراص الخاصة بنا من أجل هذا المستوى الأعلى من الأداء المتطرف. هناك نظام بيئي أوسع من بائعي الأجهزة الذين لديهم المزيد من المنتجات المتخصصة لتلك الأجزاء من مساحة التصميم ، وهكذا من المنطقي الاستفادة من سوق المكونات هذا ، سنقوم بذلك.
ما الذي لا يوجد لديك على وجه التحديد في الأجهزة التي تستخدمها هناك؟
حسنًا ، مرة أخرى ، لا يوجد مكون محدد ستشير إليه. إنها كيف قمت بتحسين تصميم DFM وكيفية استخدامها ، مقابل التداول من الكمون ، والطاقة ، والمساحة ، والمساحة ، وما إلى ذلك ، ولم نقم بتحسينها من أجل زمنات الكمون المجهرية لأنها ، مرة أخرى ، ليست فقط هذا الجزء من مساحة التصميم.
آخر من الأشياء التي يشير إليها المديرين التنفيذيون الخالصون هي القدرة على توفير تخزين كائن عالي الأداء للغاية. لم أسمع أبدًا تفسيرًا لماذا هذا ممكن. هل هي مجرد حالة من الموارد الخفية في ذلك ، أم أن هناك شيء آخر هناك؟
بالتأكيد ، ونحن في الواقع ضربها في الجزء الأول من البودكاست. الكثير منها يتعلق بكيفية تنظيم البيانات الوصفية لدينا في متجر القيمة الرئيسية ، وهذا يدفع الكثير من الأداء بالنسبة لنا.
إذا كنا نسير هذا إلى الوراء وننظرنا في الأساليب القديمة لتخزين الكائنات ، فقد نشأ تخزين الكائنات في المؤسسة في عصر رخيصة وعميقة. حاول الأشخاص تنفيذ بروتوكولات الكائن عادةً فوق نظام الملفات ، أعلى جهاز كتلة أساسي.
لديك طبقات وطبقات وطبقات من عدم الكفاءة. لذلك ، رقم واحد هو أننا ننفذ موضوعيًا. لا توجد طبقات وطبقات من عدم الكفاءة في امتصاص الأداء. ثم الرقم الثاني هو ، إذا نظرت إلى الأداء في قطعتين ، واحد هو البيانات الوصفية ، والعمل الإداري ، ثم قطعة البيانات. بمعنى ، أريد أن أنظر إلى شيء ما ، لدي اسم ، يجب أن أعرف مكانه ، وبمجرد معرفة مكان وجوده ، يكون لديّ البيانات من تحميل البيانات ونقلها فعليًا.
اتضح مع أعباء عمل الكائن الحديثة ، والقطعة الإدارية ، والبيانات الوصفية ، ينتهي بها الأمر إلى أن تكون جزءًا كبيرًا جدًا من متطلبات الأداء الإجمالية. ومرة أخرى ، هذا هو المكان الذي يتيح لنا فيه مقاربتنا الأصلية ، ولا يضعه فوق نظام الملفات ، وتوزيع قيمة مفاتيح متوازي للغاية ، وتوزيعه بشكل كبير ، على هذا الأداء. ثم بالتأكيد لدينا مسار بيانات سريع حقًا. هذا منذ اليوم الأول.


