ركوب موجة قاعدة البيانات السحابية
يبدو أن اعتماد قواعد البيانات السحابية – تلك التي يتم تقديمها عبر نموذج استهلاك السحابة – يتزايد.
يشار إليه باسم قاعدة بيانات كخدمة وفقًا لتقرير Gartner (منصة قاعدة البيانات كخدمة)، تهيمن شركات تقديم الخدمات السحابية العامة على سوق قواعد البيانات السحابية. وتعد Amazon Web Services (AWS) وMicrosoft وGoogle وOracle وAlibaba من بين الشركات الرائدة التي حددتها شركة التحليل في تقريرها. المربع السحري لأنظمة إدارة قواعد البيانات السحابية, نُشرت في ديسمبر 2023. وبشكل عام، تقدم هذه الشركات المزودة مجموعة من إمكانيات إدارة البيانات. ومن بين الشركات الرائدة الأخرى التي حددتها شركة جارتنر شركة MongoDB، المتخصصة في تكنولوجيا قواعد البيانات غير العلائقية، وSnowflake وDatabricks، التي تركز على مستودعات البيانات وبحيرات البيانات.
وفقًا لتقرير Gartner الصادر في أغسطس 2023 تحليل التوقعات: أنظمة إدارة قواعد البيانات، على مستوى العالم, السوق ل أنظمة إدارة قواعد البيانات (DBMS) ومن المتوقع أن ينمو سوق برمجيات البنية التحتية بمعدل نمو سنوي مركب يبلغ 16.8% حتى عام 2027 ليصل إلى 203.6 مليار دولار، وهو ما يمثل 27% من إجمالي إنفاق سوق برمجيات البنية التحتية في عام 2027. ويُظهر التوقع أن نسبة الإنفاق على dbPaaS السحابي ستنمو من 55% من إجمالي سوق DBMS في عام 2022 إلى 73.5% بحلول عام 2027.
وفقًا لشركة Gartner، فإن التحول في شراء برامج إدارة قواعد البيانات ــ الانتقال من مجموعات تكنولوجيا المعلومات المركزية القديمة إلى خطوط الأعمال اللامركزية داخل المؤسسة ــ هو المحرك وراء هذه الزيادة في الإنفاق على إدارة قواعد البيانات. تقليديًا، مع خدمات تكنولوجيا المعلومات المركزية، تشترك مناطق مختلفة من الشركة في نظام إدارة قواعد البيانات. وتشير شركة Gartner إلى أنه تم منحها الآن الحرية في اختيار نظام إدارة قواعد البيانات الخاص بها بناءً على معايير وحدتها الخاصة ثم بناء قواعد البيانات الخاصة بها بدلاً من استخدام أنظمة مشتركة.
ومع ذلك، يحذر نائب الرئيس والمحلل الرئيسي في شركة Forrester، نويل يوهانا، من أن بعض قواعد البيانات السحابية مبنية على تكنولوجيا خاصة، مما يجعل من الصعب الانتقال إلى قواعد بيانات أخرى. وهناك أيضًا نقص في الرؤية فيما يتعلق بالتكلفة. ويقول: “بدون المراقبة والإدارة، يمكن أن يؤدي الاستخدام المفرط للبنية الأساسية إلى تكاليف غير متوقعة”. ويوصي يوهانا صناع القرار في مجال تكنولوجيا المعلومات بالتفكير في القدرة على تخصيص قواعد البيانات السحابية مقارنة بقواعد البيانات المحلية، نظرًا لأن بعضها يفرض قيودًا على التخصيص.
النهج الهجين
هناك حالات حيث يبحث صناع القرار في مجال تكنولوجيا المعلومات عن خيارات لحصر منصة قاعدة بيانات السحابة العامة الخاصة بهم في منطقة معينة. ومع ذلك، من الواضح أن هناك حالات استخدام حيث – ربما للامتثال للوائح البيانات والخصوصية الإقليمية – هناك حاجة إلى نشر مخازن البيانات وقواعد البيانات في الموقع.
على سبيل المثال، يقدم موفرو البنية التحتية المتقاربة مثل Nutanix عروض قاعدة البيانات كخدمة للدفع مقابل الاستخدام، والتي تمنح صناع القرار في مجال تكنولوجيا المعلومات أدوات أتمتة لإدارة قواعد البيانات والقدرة على النشر عبر بيئات تكنولوجيا المعلومات الهجينةبما في ذلك السحابات العامة والخاصة.
تتطلب بعض حالات الاستخدام مزيجًا من قواعد البيانات المحلية والسحابية العامة. على سبيل المثال، قامت MongoDB مؤخرًا بإصدار معاينة لخادم Atlas Edge Server، والذي يمنح المطورين القدرة على نشر وتشغيل التطبيقات الموزعة في السحابة وعلى الحافة. يوفر خادم Atlas Edge Server مثيلًا محليًا لـ MongoDB مع خادم مزامنة يعمل على البنية الأساسية المحلية أو البعيدة. وفقًا لـ MongoDB، يقلل هذا بشكل كبير من التعقيد والمخاطر المرتبطة بإدارة التطبيقات في بيئات الحافة.
تكامل البيانات
من بين المصطلحات المستخدمة غالبًا عند النظر إلى بنية بيانات المؤسسة هو خط أنابيب البيانات. تحتاج الفرق المسؤولة عن البيانات إلى توفير طريقة لاستيعاب البيانات من أنظمة تكنولوجيا المعلومات الخاصة بالشركة والتي قد تكون في صوامع، بما في ذلك قواعد البيانات وتطبيقات المؤسسة. غالبًا ما تتضمن عملية استيعاب البيانات هذه موصلات بيانات معقدة وهشة، والتي قد تفشل أحيانًا، مما يؤدي إلى حدوث اضطرابات تشغيلية.
ومن الأمثلة على ما يقدمه موفرو dbPaaS: أداة LakeFlow التي قدمتها Databricks مؤخرًا، والذي يقوم بأتمتة نشر وتشغيل ومراقبة خطوط الأنابيب على نطاق واسع في الإنتاج مع الدعم المدمج للتكامل/التسليم المستمر (CI/CD) وسير العمل المتقدمة التي تدعم التشغيل والتفرع والتنفيذ المشروط.
يدعم جزء اتصال البيانات في LakeFlow، والذي يسمى Connect، MySQL وPostgres وSQL Server وOracle، بالإضافة إلى تطبيقات المؤسسات مثل Salesforce وDynamics وSharePoint وWorkday وNetSuite.
يقدم مكون الاستخراج والترجمة والتحميل (ETL) في أداة LakeFlow من Databricks ما تدعي الشركة أنه وضع في الوقت الفعلي للبث منخفض الكمون دون أي تغييرات في التعليمات البرمجية. يوفر الجزء الأخير من الأداة التنسيق الآلي وصحة البيانات والتسليم. وفقًا لشركة Databricks، فإنه يوفر قدرات تدفق تحكم محسّنة وإمكانية مراقبة كاملة للمساعدة في اكتشاف مشكلات البيانات وتشخيصها والتخفيف منها لزيادة موثوقية خط الأنابيب.
التوافقية
بطبيعتها، يتم نشر dbPaaS على منصة سحابية عامة، مما يعني أن مشتري تكنولوجيا المعلومات يخاطرون بالوقوع في فخ ما يختار مزود السحابة العامة القيام به.
إن إعلان Snowflake الأخير عن جعل كتالوج Polaris الخاص به مفتوح المصدر هو محاولة لتوفير قدر أكبر من قابلية التشغيل البيني للمنصات مع تنسيق جدول Apache Iceberg.
تم تطويره أصلا بواسطة Netflixيُوصف Iceberg بأنه تنسيق جدول للبيانات الجدولية الكبيرة البطيئة الحركة. وهو يوفر بيانات وصفية تصف جداول قاعدة البيانات. ومن بين فوائده أنه يوفر طريقة قياسية للشركات لتشغيل التحليلات عبر بحيرات بيانات متعددة.
عندها مؤتمر المستخدمين السنوي في يونيو 2024، سنوفليك وقالت إنها ستوفر للمؤسسات ومجتمع Iceberg بأكمله مستويات جديدة من الاختيار والمرونة والتحكم في بياناتهم، مع الأمان الكامل للمؤسسات وتوافق Apache Iceberg مع AWS و Confluent و Dremio و Google Cloud و Microsoft Azure و Salesforce وغيرها.
في ذلك الوقت، قال كريستيان كلاينرمان، نائب الرئيس التنفيذي للمنتجات في Snowflake: “تريد المؤسسات تخزينًا مفتوحًا ومحركات استعلام متوافقة دون قيود. والآن، بدعم من قادة الصناعة، نعمل على تبسيط كيفية تمكن أي مؤسسة من الوصول بسهولة إلى بياناتها عبر أنظمة متنوعة مع زيادة المرونة والتحكم”.
يهدف Snowflake إلى تقديم طريقة لمجتمع Apache Iceberg لتسخير بياناتهم من خلال نهج مفتوح ومحايد، والذي يوفر، وفقًا لكلاينرمان، “إمكانية التشغيل المتبادل بين المحركات على تلك البيانات”.
جودة البيانات
إن أحد المجالات الرئيسية التي قد تعيق مشاريع تكنولوجيا المعلومات في المؤسسات هو جودة البيانات. في إحدى المدونات الأخيرة، ستيفن كاتانزانو، محلل أول لمنصات البيانات في Enterprise Strategy Groupوتشير الدراسة إلى بحث أجرته شركة تحليلات يظهر أن 79% من المنظمات تدرك الحاجة إلى استخدام الذكاء الاصطناعي في العمليات المهمة للمهمة من أجل التنافس بشكل أفضل، ولكن 62% من أصحاب المصلحة في خطوط الأعمال يثقون إلى حد ما فقط في بيانات مؤسستهم.
“يقول كاتانزانو: “إن هذا التفاوت بين الحاجة إلى الذكاء الاصطناعي والثقة في البيانات يحتاج إلى أن يتم سده بسرعة. لقد وجدنا أن معظم المؤسسات تركز بشكل كبير على جودة البيانات كجزء من حوكمة البيانات لكسب الثقة وتقديم بيانات جاهزة لاتخاذ القرار للموظفين المخولين باتخاذ القرار”.
تناقش المدونة منتج إدارة الوصول إلى البيانات السحابية (CDAM) من Informatica، والذي يمثل، وفقًا لكاتانزانو، مسارًا نحو مساعدة المؤسسات على تحقيق أهدافها من حيث جودة البيانات والحوكمة. ويكتب: “مع تزايد أهمية البيانات في دفع نتائج الأعمال، أصبح من الضروري أن تمتلك المؤسسات آليات حوكمة قوية”.
عندما تم الإعلان عن CDAM، كتب بريت روسكوي، نائب الرئيس الأول والمدير العام لحوكمة البيانات في Informatica، أن المنتج يوفر حوكمة بيانات مدعومة بالذكاء الاصطناعي، مما يمكن المؤسسات من نشر التحليلات والذكاء الاصطناعي باستخدام ضوابط أمان وخصوصية آلية قائمة على السياسات مدفوعة بذكاء البيانات الوصفية.
إعداد المشهد للذكاء الاصطناعي
بافتراض أن توقعات جارتنر هي مؤشر عادل على الاتجاه الذي يتجه إليه سوق قواعد البيانات، فيبدو أن التحكم المركزي في تكنولوجيا المعلومات لقواعد بيانات الشركات يتم استبداله باختيار كل وحدة أعمال لقاعدة البيانات الأكثر ملاءمة لتلبية متطلباتها المحددة. وحقيقة أن قواعد البيانات السحابية تميل إلى أن تكون أسهل في النشر وتوفر تكلفة إجمالية أقل للملكية تجعلها جذابة لمشتري تكنولوجيا المعلومات.
كما يشير يوهانا من شركة فورستر، فإن هذه الحلول توفر لقادة تكنولوجيا المعلومات أيضًا طريقة لتبسيط عمليات تكنولوجيا المعلومات وطريقة أسرع لنشر تطبيقات قواعد البيانات. ويضيف: “هناك ارتباط كبير “بين اعتماد أنظمة إدارة قواعد البيانات المستندة إلى السحابة ومعدل اعتماد الذكاء الاصطناعي.”