أخبار التقنية

شرح تقنية التخزين: تخزين الملفات والكتل والكائنات


يعد الملف والكتلة والكائن أمرًا أساسيًا لكيفية وصول المستخدمين والتطبيقات وتعديلها مخزن البيانات. كان هذا هو الحال منذ عقود، وقد شهد الانتقال إلى السحابة بقاء الأمر كذلك، ولكن مع إجراء تعديلات على حالة الاستخدام وقيود الأداء والتكلفة للتخزين السحابي.

في هذه المقالة، سنلقي نظرة على أساسيات نظام الملفات والملفات والحظر و تخزين الكائنوكيفية انتقال الملفات والكتل والكائنات إلى الحياة في السحابة، والتوفر الناشئ لأنظمة الملفات العالمية. نحن أيضًا نتعمق في كيفية تنفيذ قفل الملفات والكائنات، والاختلافات بين نظام ملفات الشبكة (NFS)، وكتلة رسائل الخادم (SMB)، ونظام ملفات الإنترنت المشترك (CIFS) في تخزين الملفات.

يعد نظام الملفات أحد أساسيات الحوسبة التي تسمح بتنظيم البيانات – عادةً في أدلة هرمية – واسترجاعها. وهو نظام منطقي لمساعدة نظام التشغيل (نظام التشغيل) والمستخدم يفرقون وينظمون المعلومات ويشكلون أيضًا جزءًا من المعالجة الفعلية للبيانات الموجودة على وسائط التخزين.

تحدد أنظمة الملفات اصطلاحات تسمية الملفات، مثل طول اسم الملف، والأحرف التي يجب استخدامها، وحساسية حالة الأحرف، وامتداد نوع الملف، وما إلى ذلك. ويحتفظ نظام الملفات أيضًا بالبيانات التعريفية حول الملفات، مثل حجم الملف، أو تاريخ الإنشاء أو الموقع في الدليل.

تنظم معظم أنظمة الملفات الملفات في تسلسل هرمي، مع وصف موقع الملف بواسطة مسار داخل بنية الدليل. يتم تنظيم الدلائل في بنية شجرة هرمية مقلوبة.

يمكن تنسيق الوسائط المادية للعمل مع أنظمة ملفات مختلفة أقسام. أو يمكن إنشاء أقسام للمساعدة في عزل الملفات ذات الأنواع المختلفة عن بعضها البعض لأسباب تتعلق بالأداء أو الأمان، مثل ملفات نظام التشغيل وملفات المستخدم وملفات النظام. يتم تقسيم الأقسام إلى كتل مخصصة، على سبيل المثال، لمحتوى الملف والبيانات الوصفية وبيانات النظام.

يتم أيضًا التحكم في وصول المستخدمين والتطبيقات بواسطة نظام الملفات. يمكن أن يكون هذا هو من لديه حق الوصول إلى الملفات والأدلة بالإضافة إلى التحكم في الوصول بحيث لا يمكن أن تحدث عمليات الكتابة المتزامنة مما قد يؤدي إلى تلف أو مشكلات منطقية. يمكن أيضًا تشفير الملفات ضد الوصول الخارجي.

نظام إدارة قواعد البيانات

نظام إدارة قواعد البيانات (DBMS) يشبه إلى حد ما نظام الملفات. ولكن، في حين يوفر نظام الملفات التفاعل مع الملف بأكمله و يخزن الملفات على أنها غير منظمة العناصر المنفصلة، ​​يسمح نظام إدارة قواعد البيانات (DBMS) للمستخدمين بالتفاعل وتغيير العناصر في قاعدة البيانات في وقت واحد تقريبًا. يدير نظام إدارة قواعد البيانات (DBMS) قاعدة البيانات باعتبارها مستودعًا متسقًا ومفردًا يتم التحكم فيه بدرجة عالية من البيانات مع ضوابط أمان وضوابط وصول قوية.

يوفر تخزين الوصول إلى الملفات والحظر طريقتين للتفاعل مع نظام الملفات.

ما هو تخزين الملفات؟

تخزين الملفات، أو تخزين الوصول إلى الملفات، هو مخزن يتم فيه الوصول إلى الملفات بأكملها عبر نظام الملفات، عادةً عبر التخزين المتصل بالشبكة (NAS). تأتي هذه المنتجات مع نظام الملفات الخاص بها، والذي يتم من خلاله تقديم التخزين للتطبيقات والمستخدمين بتنسيق حرف محرك الأقراص.

وهذا يتناقض مع تخزين الكتل، كما سنرى أدناه، وهو تمييز أساسي في البنية التحتية للتخزين.

أنظمة الملفات لها فوائد عديدة. من بينها أن معظم تطبيقات المؤسسات مكتوبة للتفاعل مع البيانات عبر نظام الملفات، على الرغم من أن ذلك يتآكل بسبب تخزين الكائنات (انظر أدناه).

يصل تخزين الملفات إلى الملفات بأكملها، لذا فهو غير منظم ومناسب لتخزين الملفات العامة، بالإضافة إلى أعباء العمل المتخصصة التي تتطلب الوصول إلى الملفات، كما هو الحال في الوسائط والترفيه. في شكل NAS واسع النطاق، فهو الدعامة الأساسية للمستودعات واسعة النطاق للتحليلات وأحمال عمل الحوسبة عالية الأداء (HPC).

ما هو تخزين الكتلة؟

في تخزين الكتل، لا تقوم أجهزة شبكة منطقة التخزين (SAN) بمعالجة الملفات بأكملها (على الرغم من أنها تستطيع ذلك). وبدلاً من ذلك، يوفر تخزين الكتل وصولاً للتطبيق إلى الكتل التي تتكون منها الملفات – ولا سيما قواعد البيانات -.

يناسب هذا أعباء العمل حيث يعمل العديد من المستخدمين على نفس الملف في وقت واحد وربما من نفس التطبيق – البريد الإلكتروني وتطبيقات المؤسسات مثل تخطيط موارد المشاريع (ERP)، على سبيل المثال – ولكن مع القفل على مستوى الملف الفرعي.

لذلك، في حالة تخزين الكتل، يوجد نظام الملفات الذي تتحدث من خلاله التطبيقات في مكان أعلى في المكدس، على الخوادم المضيفة.

يتمتع تخزين الكتل بميزة كبيرة تتمثل في الأداء العالي، وعدم الاضطرار إلى التعامل مع البيانات الوصفية ومعلومات نظام الملفات.

ما هو تخزين الكائنات؟

تخزين الكائنات هو الطفل الجديد في الكتلة، نسبيًا.

على عكس تخزين الملفات والكتل، فهو يفتقر إلى نظام الملفات ويعتمد على بنية “مسطحة” مع إمكانية الوصول إلى الكائنات عبر معرفاتها الفريدة. وبهذه الطريقة، فهو يشبه نظام اسم النطاق (DNS) المستخدم للوصول إلى محتوى الويب.

لذلك، تخزين الكائنات ليس هرميًا، ويفتقر إلى بنية نظام الدليل. يمكن أن يكون ذلك ميزة عندما تنمو مجموعات البيانات بشكل كبير جدًا. قد تصبح بعض أنظمة NAS غير عملية عندما تصل إلى مليارات الملفات.

يوفر تخزين الكائنات أيضًا مجموعة أكثر ثراءً من البيانات الوصفية من أنظمة الملفات التقليدية، مما يجعلها مناسبة تمامًا لتخزين البيانات للتحليلات والذكاء الاصطناعي (AI).

يصل تخزين الكائنات إلى البيانات بطريقة تشبه الوصول إلى الملفات، ولكنها تفتقر إلى نفس النوع من قفل الملفات. في كثير من الأحيان، على سبيل المثال، يمكن لأكثر من مستخدم الوصول إلى كائن في نفس الوقت (فكر في محرر مستندات Google). لذلك، يوصف تخزين الكائنات بأنه “متسق في نهاية المطاف”.

لم تتم كتابة معظم التطبيقات القديمة لتخزين الكائنات، ولكنها طريقة الوصول إلى التخزين المفضلة لعصر السحابة. ويرجع ذلك إلى حد كبير إلى حقيقة أن تخزين الكائنات السحابية يشتمل على الجزء الأكبر من السعة التي يقدمها موفرو الخدمات السحابية فائقة الحجم.

ما هو تخزين الملفات والكتل والكائنات في السحابة؟

السحابة هي الموطن الطبيعي لتخزين الكائنات، وهنا ظهرت الآن المعايير الفعلية مثل S3. تخزين الكائنات هو التخزين المجمع لعصر السحابة، ويوفر وصولاً سهلاً إلى البيانات التي يمكن أن تكون موجودة بسعادة ومتسقة في النهاية.

كما يقدم مقدمو الخدمات السحابية الثلاثة الكبار – Amazon Web Services (AWS) وMicrosoft Azure وGoogle Cloud Platform – خدمات تخزين الملفات والكتل الخاصة بهم، بالإضافة إلى الخدمات المقدمة من موردي التخزين الخارجيين.

تتضمن خيارات التخزين السحابي الثلاثة الكبرى تخزين الكائنات مثل S3 من AWS وAzure Blob وGoogle Cloud Storage.

يتضمن تخزين الملفات من وحدات التخزين الفائقة ما يلي: نظام الملفات المرن (EFS) من أمازون، وهو نظام ملفات قائم على NFS يعمل على التخزين السحابي والمحلي؛ ملفات Azure، التي تستخدم الشركات الصغيرة والمتوسطة (SMB) وتسمح بتثبيت مشاركة الملفات المتزامنة في السحابة أو داخل المؤسسة؛ وGoogle Cloud Filestore، الذي يوفر NAS لمحركات Google Compute Engine وKubernetes مع مساحة تخزين متوفرة على المستويين القياسي والمتميز.

يأتي تخزين الكتل من الشركات الثلاثة الكبرى في متجر Amazon Elastic Block Store، الذي يعمل مع Amazon Elastic Compute Cloud؛ Azure Disk، الذي يوفر الأقراص المُدارة لأجهزة Azure الافتراضية؛ ووحدة تخزين Google Persistent Disk، والتي تصل سعتها إلى 64 تيرابايت، وتوفر الأقراص الثابتة القياسية ومحركات أقراص SSD المستمرة ومحرك أقراص SSD المحلي.

توفر جميع أجهزة Hyperscalers الثلاثة أيضًا تخزين ملفات عالي الأداء استنادًا إلى تخزين NetApp. يتوفر Pure Storage Cloud Block Store على AWS.

ما هي أنظمة الملفات العالمية؟

يقدم عدد من الموردين ما يسمى بأنظمة الملفات العالمية التي تجمع بين نظام الملفات الموزع عبر السحابة العامة وأجهزة الشبكة المحلية، مع جميع البيانات في مساحة اسم واحدة. يشمل الموفرون Ctera وNasuni وPanzura وHammerspace وPeer Software.

توفر CTERA مجموعة من Edge، وملف التخزين المؤقت، وCTERA Drive، وهو وكيل لأجهزة نقطة النهاية، وVDI لمساحات العمل الافتراضية.

توفر Hammerspace للعملاء عرضًا واحدًا لبياناتهم التعريفية عبر Hyperscale NAS الذي تقول إنه يسمح بتخزين البيانات والوصول إليها بكفاءة.

تقدم Nasuni نظامها الأساسي لبيانات الملفات، المبني على نظام الملفات UniFS الخاص بها، مع مثيلات Edge المحلية للوصول إلى التخزين المؤقت المحلي، بالإضافة إلى وحدات تحكم الإدارة والتنسيق، وNasuni IQ لتحليل الأداء، وواجهات برمجة التطبيقات (APIs).

تضع Panzura نفسها كلاعب لإدارة البيانات ومنصة واحدة للبيانات غير المنظمة. نظام الملفات العالمي الخاص بها هو CloudFS، الذي يقوم بإنشاء مجموعة بيانات واحدة محسنة.

يوفر Peer خدمة ملفات عالمية مع دعم مختلط ومتعدد السحابة، ودعم لمواقع الحافة ومراكز البيانات. PeerGFS هو برنامج فقط، مع مزامنة نشطة، ومساحة اسم عالمية تستخدم Microsoft DFSN وتكامل تخزين الكائنات.

ما الفرق بين قفل الملف وقفل الكائن؟

الوظيفة الأساسية لأنظمة الملفات هي آليات القفل الخاصة بها. تعمل هذه على التأكد من أن المستخدمين والتطبيقات المختلفة التي تعمل على نفس الملف في وقت واحد لا يمكنها التسبب في تعارضات تؤدي إلى عدم الدقة وعدم الاتساق في البيانات.

القفل قوي ومتطور في أنظمة الملفات. ومع ذلك، لا يتم إنشاء تخزين الكائنات حول نظام الملفات، لذلك فهو يفتقر إلى نفس النوع من الأساليب التي تتيح القفل.

يتم تخزين الملفات (NAS) والكتلة (SAN) على نظام الملفات. يصل تخزين NAS إلى الملفات مباشرة، بينما يصل تخزين الكتل إلى الكتل الموجودة في نظام الملفات لتحديث أجزاء من قاعدة البيانات، على سبيل المثال، والتي تشتمل في حد ذاتها على “ملف”.

يمكن لأنظمة Windows تعيين قفل الملفات بواسطة التطبيق والمستخدم للملفات بأكملها لتقييد الوصول أو المشاركة أو القراءة أو الكتابة أو الحذف أو تأمين نطاق البايت لمناطق الملفات.

تختلف أنظمة الملفات المشابهة ليونكس، بما في ذلك Linux، بين التوزيعات، ولكن يمكنك تعديل الملفات المفتوحة في Linux، على سبيل المثال. تتعلق الاختلافات بكيفية تسجيل أنظمة Windows والأنظمة المشابهة لنظام Unix لمعلومات الملف، ولكن يمكنها جميعها تقييد الوصول إلى الملفات وتغييراتها.

وفي الوقت نفسه، يفتقر تخزين الكائنات إلى القفل المدمج. لا يعني ذلك أنه غير موجود في تخزين الكائنات، ولكنه غير مدمج في تخزين الكائنات بنفس الطريقة كما هو الحال مع أنظمة الملفات. يمكن لعدة مستخدمين العمل على نفس الكائن في وقت واحد، مع تسوية التغييرات على أساس “متسق في النهاية”.

يتم تنفيذ بعض أشكال القفل في تخزين الكائنات والسحابة. تتضمن هذه العناصر بوابات بروتوكول الوصول إلى الملفات الموجودة أمام مخازن الكائنات.

يوفر موفرو السحابة مثل AWS قفل الكائنات من خلال أوضاع الامتثال والحوكمة التي توفر مستويات مختلفة من الوصول. يمكن ضبط فترات الاحتفاظ التي تحافظ على الأقفال في مكانها حتى التاريخ المحدد. يحتوي Microsoft Azure أيضًا على قفل لكائنات Blob الخاصة به، مع القدرة على جعلها غير قابلة للتغيير وفرض الاحتفاظ القانوني بها.

حقق قفل الكائنات بعض الأهمية كوسيلة لعزل البيانات ضد هجمات برامج الفدية.

غالبًا ما تستخدم قواعد بيانات NoSQL تخزين الكائنات ويمكنها أخذ بيانات شبه وغير منظمة وتنفيذ آليات القفل الخاصة بها. على سبيل المثال، يسمح MongoDB بقفل الطلبات التي يتم وضعها في قائمة الانتظار، في حين أن CouchDB لديه شكل من أشكال الاتساق النهائي.

ما الفرق بين NFS وSMB وCIFS؟

NFS وSMB وCIFS كلها بروتوكولات لتخزين الملفات تتيح الوصول إلى الملفات الموجودة على الخوادم وخوادم التخزين (مثل تخزين NAS) كما لو كانت ملفات محلية.

وهي تختلف عن نظام الملفات، كونها بروتوكولات تعمل في طبقة التطبيق لتسهيل الاتصال بين التطبيقات والتخزين، عبر نظام الملفات. وهي عبارة عن بروتوكولات طبقة التطبيقات، بنفس ترتيب HTTP وFTP وPOP وSMTP، على سبيل المثال.

يتم استخدام NFS وSMB وCIFS مع تخزين الوصول إلى ملفات NAS، وليس تخزين الوصول إلى كتلة SAN.

يُستخدم NFS في الغالب مع أنظمة التشغيل Linux وUnix، وقد تم تطويره في الأصل بواسطة Sun Microsystems في عام 1984. ووصل إلى الإصدار 4.2، مع وظيفة الوصول المتوازي إلى الملفات (pNFS، المستخدمة في NAS واسعة النطاق)، في عام 2016.

على الرغم من أنه تم تطويره بواسطة أحد موردي Unix وغالبًا ما يستخدم لنظامي Unix وLinux، إلا أنه يمكن استخدامه أيضًا في بيئات Windows.

يتم استخدام SMB بشكل أساسي في بيئات Windows، وهو الأساس لـ Microsoft نظام الملفات الموزعة. قامت شركة IBM بتطوير SMB لأول مرة في عام 1983 لتوفير وصول مشترك للشبكة إلى الملفات والطابعات. التقطته Microsoft لاحقًا وأدمجته في Windows NT 3.1. وقد احتفظت به في أنظمة التشغيل الخاصة بها منذ ذلك الحين.

CIFS هو تطبيق للشركات الصغيرة والمتوسطة، تم تقديمه لأول مرة في عام 1996. ويتم استخدامه في الغالب مع نت بيوسوسائل النقل المعتمدة على LAN وركزت على ملفات LAN الصغيرة والطباعة والوصول إلى التطبيقات للتخزين. إنها أقل قابلية للتوسع من NFS، وتعتبر ثرثرة وعربات التي تجرها الدواب وأقل أمانًا من الشركات الصغيرة والمتوسطة.



Source link

زر الذهاب إلى الأعلى