تقدم Arcitecta خدمة تخزين الملفات والكائنات بمعدلات نقل ضخمة
65 تيرابايت في الساعة، من أي مكان على وجه الأرض إلى أي مكان آخر، مهما كانت جودة الاتصال بينهما. هذه هي سرعة النقل التي حققها حل التخزين المشترك من Arcitecta، والذي يعمل عبر الإنترنت سحابة التخزين والمواقع في الموقع.
يحب هامرسبيس، ناسوني، بانزورا وكتيرا، يتيح حل Mediaflux من Arcitecta مشاركة الملفات عبر مواقع متعددة على المستوى الدولي، مما يسمح للقوى العاملة برؤية الملفات الموجودة على وحدة التخزين المتصلة بالشبكة المحلية (NAS) والسحابة العامة التي أنشأها الزملاء في أماكن أخرى.
وقال جراهام بيسلي، مدير العمليات في Arcitecta، لموقع Computer Weekly الفرنسي الشقيق: “على عكس الشركات الأخرى، نحن لسنا شركة تخزين”. LeMagIT خلال الآونة الأخيرة جولة صحفية لتكنولوجيا المعلومات حدث.
“خبرتنا في قواعد البيانات. نحن نبيع نظام قاعدة البيانات الخاص بنا للمؤسسات التي لديها مصفوفات من NetApp أو IBM Spectrum Scale أو Dell Isilon أو غيرها للسماح لهم بإدارة المستندات في تنسيق الملف أو الكائن عبر مواقعهم. وأضاف: “نحن نجعل البيانات متاحة في أي مكان، كلما كانت هناك حاجة إليها، عبر وحدة Livewire على Mediaflux”.
وقال جيسون لوهري، الرئيس التنفيذي ومؤسس شركة Arcitecta: “لقد قيل في كثير من الأحيان أن سرعات النقل التي نحصل عليها مستحيلة من الناحية النظرية”. “سرنا هو أن الأمر لا يتعلق بالسرعة فقط. نحن نحل مشكلة الاتصال. والقيام بذلك هو مسألة إدارة البيانات. يجب عليك نقل البيانات الصحيحة في الوقت المناسب.
حل السرعة: قاعدة بيانات XODB
قال لوهري: “نحن نعمل مع الملايين من تنسيقات الملفات”. “يسمح لنا ذلك بفهرسة تريليونات من أجزاء البيانات قاعدة البيانات الوصفية لدينا. يمثل الحفظ الواحد في قاعدة البيانات الخاصة بنا حوالي 1 كيلو بايت لكل ملف مفهرس. ومن هناك، تتم مزامنة ذلك عبر جميع مواقع المؤسسة ويمكن العثور على أي ملف من أي مكان آخر.
جراهام بيسلي، أرسيتكتا
وأضاف: “عندما يكون لديك ملف واحد أو 10 أو 100 مليون ملف مشترك بين الفروع في شركة متعددة الجنسيات، يمكن لمحرك البحث الخاص بنا العثور عليه وعرضه لك في بضع عشرات من المللي ثانية، الأمر الذي قد يستغرق ساعات في منتج منافس”.
وفقًا للوهري، تكمن عبقرية المنتج في الطريقة التي يتم بها تجزئة الملفات. يتم نقل أجزاء الملف من مكان إلى آخر عبر قنوات متوازية وليس بالضرورة بترتيب زمني أو بشكل استباقي.
قال لوهري: “الهدف هو نقل الحد الأدنى من البيانات في اللحظة التي يريد فيها المستخدم فتح المستند”. “منذ أن يتم استيعاب ملف في المصفوفة، فإننا نرجع إليه وننسخ كتله إلى المواقع التي تشير بياناتنا إلى أنه سيتم استخدامه فيها.
قال لوهري: “إذا قمت بتحديث ملف بحجم 70 تيرابايت، فلن نحتاج إلى إعادة فحص جميع البيانات الوصفية”. “يقوم نظامنا بتحديثه من الإصدار السابق للملف في غمضة عين.”
تحرص شركة Lohrey على تسليط الضوء على الوظائف الموجودة في قاعدة بياناتها والتي تدير الإحداثيات الزمنية والمكانية لكل وثيقة. تُعرف باسم XODB، وهي عبارة عن قاعدة بيانات كائنات XML ثنائية مضمنة في Mediaflux والتي تدير المتجهات بين الملفات للسماح لها بفهم ما قد يلزم نسخه إلى مواقع أخرى بناءً على النشاط السابق.
قال لوهري: “إذا كان هذا النظام يعمل بكفاءة، فذلك لأننا لم نكتب قاعدة البيانات الخاصة به فحسب، بل قمنا أيضًا بإعادة كتابة بروتوكولات المشاركة NFS وSMB وS3 الخاصة بنا من الصفر حتى يتمكنوا من توضيح المعلومات المتاحة في XODB بشكل أفضل”. “يجلب ذلك بعض المزايا، بما في ذلك القدرة على إدارة التسلسلات الهرمية الافتراضية التي تتوافق مع البحث.”
في الإصدار الأخير، يأخذ Livewire في الاعتبار النطاق الترددي المتوفر على روابط الشبكة للضغط بسرعة عبر طرق مختلفة قبل النقل إلى موقع آخر. تم أيضًا تحسين الطريقة التي يعيد بها إرسال الحزم المفقودة أثناء اتصال TCP/IP.
واجهة تقوم بتطويرها بنفسك
لا يتم تسليم Mediaflux مع وحدة تحكم للبحث عن الملفات. وبدلاً من ذلك، توفر Arcitecta مجموعة أدوات لتطوير واجهة تتكيف بشكل أفضل مع العميل.
قال بيسلي: “إن القدرة على استغلال بياناتك غالبًا ما تكون مرتبطة بتصورها واستخدامها”. “ليس من الممكن إنشاء واجهة عامة تعرف كيفية إدارة جميع أنواع البيانات. ولذلك قمنا بتطوير إطار عمل يتيح للمستخدمين تجميع أفضل واجهة تلبي احتياجاتهم بسرعة كبيرة. إذا أمكن، يمكننا كتابة تلك الواجهة إذا أراد العميل ذلك. ومؤخرًا، قمنا بتطوير واجهة لمتحف في أربعة أيام فقط.
إلى جانب عمليات البحث عن الملفات، تسمح واجهة الإدارة بتحديد القواعد المتعلقة بوضع البيانات. يتم تعيين هذه القواعد يدويًا لمساعدة Mediaflux على توقع وضع الملفات لإعطاء الانطباع بأنها قد تم نقلها بسرعة من الجانب الآخر من العالم عندما يحاول المستخدم الوصول إليها.
في خريطة الطريق الخاصة بـ Mediaflux، تسلط Arcitecta الضوء على زيادة كثافة البيانات الوصفية والقدرة على استيعاب المحتوى الذكاء الاصطناعي التوليدي (GenAI) استخدام القدرة على توليد الاسترجاع المعزز (RAG).. يتطلب الأخير أن تكون البيانات في تنسيق متجه، وهو ما يناسب XODB لأنه يحتوي بالفعل على هذه البنية.