تقنية

قواعد البيانات السحابية: القفز إلى الصورة الأكبر


ستظل الطريقة التي تخزن بها المؤسسات البيانات وتديرها وتحللها تشكل مشكلة صعبة في ظل الهجوم المستمر للبيانات على أنظمة تكنولوجيا المعلومات في الشركات. ويبدو الأمر وكأن فرق تكنولوجيا المعلومات تحاول دائمًا اللحاق بالركب.

وفقًا لشركة فيريتاس، تخزن الشركة المتوسطة حوالي 10 بيتابايت (بيتابايت) من البيانات – أي ما يعادل حوالي 23 مليار ملف – 52% منها بيانات غير مصنفة (أو مظلمة) و33% منها زائدة عن الحاجة أو قديمة أو تافهة. وفي حين يؤثر هذا حتمًا على تكاليف التخزين والأمن السيبراني (وهذه قصة أخرى تمامًا)، فإن تحليل هذه البيانات واستخلاص الرؤى منها ليس بالأمر السهل. فهو يتطلب نهجًا مختلفًا عن كيفية إدارة البيانات التقليدية، حيث تعمل المزيد والمزيد من المؤسسات مع علاقات بيانات معقدة بشكل متزايد.

الذكاء الاصطناعي التوليدي (GenAI) لا شك أن إدارة البيانات أصبحت تشكل اعتبارًا متزايدًا، وخاصة عندما يتعلق الأمر بالتفكير المؤسسي حول إدارة البيانات. ولكنها في الوقت الحالي بمثابة سلاح ذو حدين. فالمزايا ــ الفوائد التي تجذب الانتباه في كثير من الأحيان ــ تؤثر على أعضاء مجلس الإدارة. ووفقًا لـ أبحاث كابجيميني96% من المديرين التنفيذيين يعتبرون GenAI موضوعًا ساخنًا للمناقشة في غرفة الاجتماعات. ولكن عندما يتعلق الأمر بالحقائق العملية، لا يزال هناك بعض عدم اليقين.

وكما يكشف المسح السنوي السابع الذي أجرته شركة Couchbase لقادة تكنولوجيا المعلومات على مستوى العالم، فإن الشركات تعاني من هياكل بيانات تفشل في إدارة متطلبات البيانات. ويزعم البحث أن هذا الصراع يعادل في المتوسط ​​4 ملايين دولار من الإنفاق الضائع. ويلقي حوالي 42% من المشاركين باللوم في ذلك على الاعتماد على التكنولوجيا القديمة التي لا تستطيع تلبية المتطلبات الرقمية، في حين يستشهد 36% بمشاكل في الوصول إلى البيانات المطلوبة أو إدارتها.

ما هو واضح هو أن قواعد البيانات العلائقية لا يمكن للشركات التحرك بسرعة كافية لدعم متطلبات التطبيقات الحديثة التي تعتمد على البيانات بشكل مكثف – وتعاني الشركات نتيجة لذلك.

لقد أدت إدارة مجموعات البيانات المنظمة وغير المنظمة إلى اتباع نهجين مختلفين. على سبيل المثال، قواعد بيانات الرسم البياني – نوع من قاعدة بيانات NoSQL – يُنظر إليها بشكل متزايد على أنها ضرورية لـ مزيج حديث من قواعد البيانات إن المؤسسات بحاجة إلى تلبية احتياجاتها من البيانات. ومن المثير للاهتمام أن نتائج استطلاع Couchbase تظهر أن 31% من المؤسسات لديها هياكل قواعد بيانات موحدة بحيث لا تتمكن التطبيقات من الوصول إلى إصدارات متعددة من البيانات، وأن 25% فقط من المؤسسات لديها قاعدة بيانات عالية الأداء يمكنها إدارة البيانات غير المنظمة بسرعة عالية.

قواعد بيانات NoSQL في العمل

إذن، من يستخدم قواعد بيانات الرسوم البيانية وغيرها من قواعد بيانات NoSQL، ولماذا؟ هل يمكن أن يساعد نهج قواعد البيانات المتعددة، أم أنه يعني فقط المزيد من التعقيد في الإدارة؟ وفقًا لروهان وايتهايد، أخصائي البيانات في معهد التحليلات (IoA)، وهي هيئة مهنية لمحترفي التحليلات وعلوم البيانات، فإن الأسباب الرئيسية لاعتماد قواعد بيانات الرسوم البيانية هي كفاءتها في التعامل مع البيانات المترابطة للغاية وقدرتها على إجراء استعلامات معقدة مع زمن انتقال منخفض.

ويقول: “إنها توفر طريقة طبيعية وبديهية لنمذجة الشبكات في العالم الحقيقي، مما يجعلها مثالية لحالات الاستخدام حيث يكون فهم العلاقات بين نقاط البيانات أمرًا بالغ الأهمية”.

ومن الأمثلة على المستخدمين البارزين شبكات التواصل الاجتماعي، مثل فيسبوك، التي تريد تحليل العلاقات من خلال الرسوم البيانية الاجتماعية. كما يستخدم مزودو الخدمات المالية قواعد البيانات البيانية للكشف عن الاحتيال، ورسم أنماط المعاملات للكشف عن الشذوذ الذي قد يشير إلى أنشطة احتيالية. وتستخدم شركات سلسلة التوريد قواعد البيانات البيانية لتحسين الخدمات اللوجستية من خلال تحليل العلاقات بين الموردين والمنتجات والطرق.

قواعد بيانات NoSQL يتم اعتمادها على نطاق واسع في مختلف الصناعات مثل التجارة الإلكترونية وإنترنت الأشياء [internet of things] “ويقول وايتهايد: “”إن تحليلات الوقت الفعلي”” تستخدمها شركات التجارة الإلكترونية العملاقة مثل أمازون وإيباي، وتستخدم قواعد بيانات موجهة نحو المستندات مثل مونجو دي بي لإدارة كتالوجات المنتجات، وتمكين التحديثات السريعة والمرنة دون الحاجة إلى تأثيرات مخططات معقدة.

ويضيف أن تطبيقات إنترنت الأشياءتستفيد الشركات، مثل تلك الموجودة في المدن الذكية أو الأتمتة الصناعية، من “قابلية التوسع والمرونة لمتاجر القيمة الرئيسية مثل ريديس، والتي يمكنها التعامل مع السرعة العالية للبيانات التي تولدها أجهزة الاستشعار. في التحليلات في الوقت الفعلي، تستخدم الشركات مخازن عائلة الأعمدة مثل كاساندرا “لمعالجة وتحليل كميات كبيرة من البيانات المتدفقة، مما يتيح اتخاذ القرارات السريعة والحصول على رؤى ثاقبة.”

قابلية التوسع والمرونة

في حين أن قواعد بيانات الرسوم البيانية فعالة في التعامل مع البيانات المترابطة، وإجراء استعلامات ذات زمن انتقال منخفض، فإن NoSQL يمكنها التوسع أفقيًا، ومعالجة البيانات غير المنظمة والعمل بشكل جيد في البيئات الموزعة. والمفتاح هنا هو القدرة على إدارة نماذج بيانات مختلفة ودعم أحمال عمل مختلفة.

“اليوم، تستخدم العديد من الفرق الرسوم البيانية لأنها خيار مرن وعالي الأداء للعديد من أنظمة البيانات الحديثة”، كما يقول جيم ويبر، كبير العلماء في Neo4j“تتناسب الرسوم البيانية مع العديد من المجالات لأن البيانات الارتباطية (أي الرسوم البيانية) شائعة في العديد من مجالات الأعمال. أصبحت الرسوم البيانية الآن تقنية عامة الغرض بنفس الطريقة التي تستخدم بها قواعد البيانات العلائقية، ويمكن حل معظم المشكلات بسهولة من خلال الرسوم البيانية.”

على سبيل المثال، يشير إلى أحد كبار عملاء Neo4j المصرفيين الذين يريدون “التعرف على ملف المخاطر الخاص بهم من خلال الاستعلام بشكل انتقالي عن شبكة معقدة من الأصول”. ووفقًا لويبر، فقد بدأت المنظمة المشروع مرارًا وتكرارًا ثم تخلت عنه، بعد أن حاولت تشغيله باستخدام الجداول العلائقية. وفي مثال آخر، يقول ويبر إن هيئة النقل في لندن تستخدم الرسوم البيانية للعمل بشكل أسرع في إصلاح وصيانة شبكات الطرق في لندن، “مما يوفر للمدينة حوالي 600 مليون جنيه إسترليني سنويًا”.

ومن بين عملاء Neo4j الآخرين ExpectAI، وهي شركة استشارية مقرها لندن تستخدم تقنية قواعد البيانات البيانية لإيجاد حلول لتغير المناخ. ووفقًا للرئيس التنفيذي والمؤسس أناند فيرما، فإن تقنية البيانات البيانية مكنت الشركة من “التنقل في نظام بيئي واسع النطاق من البيانات العامة والخاصة، مع توفير إمكانية التتبع والسياق اللازمين للحد من التشاؤم حول التضليل البيئي المتصور”.

ويضيف فيرما أن مرونة قواعد البيانات البيانية منحت الشركة ما تحتاجه لالتقاط العلاقات المعقدة في بياناتها بفعالية. ويقول: “هذا بدوره يوفر المعلومات القوية والرؤى التي يحتاجها عملاؤنا لاتخاذ إجراءات مربحة مع تقليل بصماتهم الكربونية”.

لكن الجزء المتعلق بالذكاء الاصطناعي في اسم الشركة هو الذي يضيف قيمة حقيقية إلى العرض. ويشير فيرما إلى أن الذكاء الاصطناعي يساعد التكنولوجيا في تنظيم البيانات غير المنظمة، وهو ما يتيح بدوره البحث الدلالي والفهرسة المتجهة.

“يساعد هذا المستخدمين على تفسير بياناتهم من خلال معالجة اللغة الطبيعية” [natural language processing] محادثة سؤال وجواب [questions and answers] “ويقول فيرما: “إن هدفنا النهائي من هذه التكنولوجيا هو المساهمة بشكل كبير في خفض انبعاثات الكربون بمقدار 500 ميغا طن في جميع أنحاء العالم بحلول عام 2030”.

إنه هدف جدير بالاهتمام ومثال جيد لكيفية تحويل تكنولوجيا الرسم البياني لعلاقات البيانات وتمكين أفكار الأعمال الجديدة المعقدة من الازدهار. سيزداد استخدام الذكاء الاصطناعي بشكل لا مفر منه مع سعي المؤسسات إلى تقليل الوظائف اليدوية وتقليل أوقات الاستعلام وزيادة الرؤى.

الذكاء الاصطناعي و NoSQL

ويقول وايتهايد من معهد الهندسة الميكانيكية إن قواعد البيانات الرسومية “مناسبة بشكل خاص لتطبيقات الذكاء الاصطناعي التي تتطلب فهم وتحليل العلاقات داخل البيانات”. ويضيف أن التكنولوجيا يمكنها دعم الخوارزميات المتقدمة للتعرف على الأنماط واكتشاف المجتمع والعثور على المسار، وهي أمور بالغة الأهمية لمهام مثل أنظمة التوصية واكتشاف الاحتيال والرسوم البيانية المعرفية.

بالنسبة لكين لابورت، مدير مجموعة هندسة البنية التحتية للبيانات في بلومبرج، فإن الذكاء الاصطناعي كان له بالفعل تأثير كبير التأثير، ولكن مع NoSQLلقد شهدت الشركة اهتمامًا كبيرًا داخليًا بـ “استخدام Apache AGE، امتداد قاعدة بيانات الرسم البياني، جنبًا إلى جنب مع PostgreSQL”.

“لقد تم استخدامه في كل شيء بدءًا من تسلسل البيانات (تتبع البيانات أثناء انتقالها عبر الأنظمة) إلى لوحات معلومات النشر المعقدة. لقد كانت القوة التحليلية لـ Apache AGE جنبًا إلى جنب مع مجموعات البيانات الغنية التي تقدمها Bloomberg قصة نجاح طبيعية بالنسبة لنا.”

ومن ثم، فإن الذكاء الاصطناعي يثبت أهميته البالغة في ظل صراع الشركات مع الحجم المتزايد من المعلومات المنظمة وغير المنظمة اللازمة لاتخاذ قرارات مستنيرة.

ويضيف لابورت: “نظرًا لأننا نشهد زيادة هائلة في المعلومات المالية عبر جميع فئات الأصول، تواصل بلومبرج الاستثمار في عدد من التقنيات المختلفة لضمان قدرتنا على تنفيذ استراتيجيتنا الشاملة للذكاء الاصطناعي. وتشكل قواعد البيانات البيانية والمتجهية أجزاءً رئيسية من هذا الجهد، بالإضافة إلى مكونات البحث المتجهي المدمجة في تقنيات البيانات الأخرى. ويمتد هذا من البحث المتفرق التقليدي إلى عمليات البحث المتجهية الكثيفة (أو الدلالية) التي تعتمد على الذكاء الاصطناعي”.

تعتبر قواعد بيانات NoSQL، بفضل قدرتها على التعامل مع كميات كبيرة من البيانات، جزءًا لا يتجزأ من تطبيقات الذكاء الاصطناعي. فهي تدعم استيعاب البيانات والاستعلام عنها في الوقت الفعلي، وهو أمر ضروري لتطبيقات الذكاء الاصطناعي التي تتطلب معالجة البيانات واتخاذ القرارات على الفور، مثل الصيانة التنبؤية والتحليلات في الوقت الفعلي.

على سبيل المثال، في بلومبرج، تدعم قدرات تحليل البيانات في الوقت الفعلي لقواعد البيانات الرسومية تطبيقات الذكاء الاصطناعي التي تتطلب رؤى فورية، مثل التسعير الديناميكي واكتشاف الشذوذ.

يقول وايتهايد من IoA: “إن نماذج البيانات المرنة لقواعد بيانات NoSQL تسمح بتخزين ومعالجة أنواع البيانات المعقدة والمتنوعة، وهو أمر مفيد لتطبيقات الذكاء الاصطناعي التي تحتاج إلى التعامل مع البيانات غير المنظمة مثل النصوص والصور وبيانات المستشعرات”. على سبيل المثال، يقول: “يسهل نموذج MongoDB الموجه نحو المستندات تخزين واسترجاع البيانات المستندة إلى JSON، والتي تُستخدم عادةً في سير عمل الذكاء الاصطناعي”.

الاتجاه المستقبلي لقاعدة البيانات

ويشير وايتهايد إلى أن مستقبل قواعد البيانات الرسومية “يبدو واعدًا”، مع توقع نمو التبني مع إدراك المزيد من المؤسسات لقيمة تحليل البيانات المترابطة. ويقول: “ستعتمد الصناعات مثل الرعاية الصحية والاتصالات والتمويل بشكل متزايد على قواعد البيانات الرسومية لقدراتها التحليلية”، مضيفًا أن التطورات المستقبلية ستركز على الأرجح على تحسين تحليلات الرسوم البيانية والتكامل الأعمق مع تقنيات الذكاء الاصطناعي.

نتوقع أن نرى مزودي الخدمات السحابية يوسعون عروض قواعد البيانات الخاصة بهم، ويروجون لحلول أكثر قوة وقابلية للتطوير وتكاملاً. يقول وايتهايد إن Graph وقواعد بيانات NoSQL الأخرى “مستعدة لنمو وابتكار كبيرين”.

ولكن هذا ليس هو الحال بالنسبة له وحده. إذ يتفق الجميع على أن القدرات سوف تتوافق مع الرؤية المتنامية للصناعة، مع دمج الذكاء الاصطناعي لتمكين التطبيقات الأكثر ذكاءً واعتمادًا على البيانات.

يقدم لابورت من بلومبرج بعض النصائح: “يحتاج الجميع إلى التجربة. عليك أن تفكر في حالة استخدام. يمكنك الاعتماد على منتجات مثل داتا ستاكس استرادي بي, أوبن أيه آي“وإلخ، لإنشاء حل جاهز للإنتاج في وقت قصير وقياس قيمته على الفور. ثم، إذا كان الاتجاه يبدو جيدًا بما يكفي، فيمكنك استثمار المزيد من الموارد لتحسين حالة الاستخدام.”



Source link

زر الذهاب إلى الأعلى