هل نفقد معركة إدارة البيانات؟

عندما تدعم الشركات مبادرات الرقمنة الرئيسية والاستثمار في التقنيات الجديدة ، فهذا طريقة أخرى للقول بأنها تريد أن تكون مدفوعة بالبيانات في عملياتها المعاملة وفي ذكاء أعمالهم.
ومع ذلك ، بغض النظر عن مدى تلطيخ التكنولوجيا الجديدة ، سيكون الأمر جيدًا فقط مثل البيانات التي تدفعها. هذا هو السبب الرئيسي وراء استمرار إدارة البيانات ، كما حدثت خلال السنوات الخمس الماضية ، في السيطرة على CIOS كشؤوّق أعلى.
هل نربح أو نفقد معركة إدارة البيانات؟
في عام 2023 ، ذكر خبراء الرعاية الصحية أن “ما يصل إلى 95 ٪ من بيانات المستشفيات غير مستخدمة” ، ومن المحتمل أن تكون النسب المئوية العالية من البيانات غير المستخدمة تعاني منها قطاعات الصناعة الأخرى أيضًا.
في عام 2023 أيضًا ، يعتقد 16 ٪ فقط من المنظمات التي شملتها الاستطلاع أن البيانات قد تم دمجها بنجاح في عملياتها التجارية وأن البيانات كانت بفعالية تستخدم لاتخاذ القرارات.
أخيرًا ، هناك أنظمة الذكاء الاصطناعى التي يريدها الجميع – ومع ذلك ، متى سيحصلون عليها إذا كانت البيانات مشكلة؟
“Genai ليس مشكلة علم البيانات الخالصة. إنها مشكلة بيانات على قدم المساواة ، “يكتب تشاد أندرسون ، الرئيس التنفيذي في gable.ai. “البيانات هي وقود للنموذج ، بنفس الطريقة التي يكون بها النظام الغذائي الصحي الوقود للرياضي. إذا دخلت القمامة ، فإن القمامة تخرج “.
معظم مديري المعلومات التي أتحدث معها تأكيد هذا. وبالتالي ، فإنهم غير متأكدين من مدى استعدادهم للثقة في بياناتهم ، وهم يفهمون أن إعداد البيانات والتكامل والإدارة لا تزال تعمل.
صياغة خطة معركة البيانات
بالنسبة لمعظم المنظمات ، تحقق بيانات عالية الجودة ومدمجة بالكامل وجديرة بالثقة هي معركة. لذلك يتطلب خطة المعركة.
تجد غالبية الشركات أن لديهم بالفعل خطط معركة. لسوء الحظ ، تميل هذه الخطط إلى معالجة البيانات فقط على جبهات معينة في ساحة المعركة. إنهم يفتقرون إلى نهج عام للبيانات التي يمكن أن تضع جميع البيانات بنجاح تحت إدارة عالمية عالية الجودة.
هناك معايير نقاء البيانات والحوكمة والأمان التي يتم تحديدها كـ SLAs لبائعي البيانات.
هناك قواعد وعمليات ETL (تحميل التحويل) ETL التي تحددها كلما تم نقل بيانات الشركة من مستودع بيانات إلى آخر ، والتي تضمن تنظيف البيانات أولاً وتنسيقها وتنسيقها لمستودع البيانات المستهدفة قبل دمجها في هذا المستودع.
هناك إجراءات مبرمجة تقوم بتحرير البيانات والتحقق منها طوال اليوم حيث يستخدم العمال التطبيقات وقواعد البيانات.
باختصار ، هناك الكثير يجري بالفعل لضمان أن البيانات ذات جودة عالية ويمكن استخدامها. ومع ذلك ، لا يزال لدى CIOs وموظفو تقنية المعلومات والمستخدمين النهائيين تحفظات على أن البيانات التي يستخدمونها ذات جودة عالية وجديرة بالثقة.
لماذا هذا؟
خطة للهجوم
بيانات متباينة
في عام 2023 ، ثلاث من كل أربع شركات ذكرت أن التعاون الداخلي قد أعاق بسبب صوامع البيانات.
تخلق المجمعات الفردية للبيانات في أقسام المستخدم التناقضات بين البيانات وقرارات العمل. كما أنها تنتج أشكالًا متباينة من البيانات التي لا يمكن دمجها في مستودع بيانات مشترك دون الخضوع لـ ETL.
تُثخن المؤامرة عندما يتم تناول البيانات من مصادر البائع الخارجية التي قد تمثل البيانات في تنسيقات بديلة. يجب أن تكون هذه البيانات أيضًا etl’d.
تعتبر سليمات البيانات التي يمكن أن تساعد الشركات في تحقيق وحدة البيانات. هناك طريقة أخرى تتمثل في أتمتة جميع عمليات تناول البيانات باستخدام ETL بحيث يتم تطبيع البيانات قبل إدخال مستودع البيانات.
عدم التحكم في البيانات
في عام 2024 ، توليد البيانات وصلت إلى 361 مليار رسالة بريد إلكتروني تم إرسالها يوميًا ، و 16 مليون نص يتم إرسالها كل دقيقة ، و 378.77 مليون تيرابايت من البيانات التي تم إنشاؤها يوميًا. تتدفق البيانات إلى مؤسسات بأحجام وسرعات هائلة وليس كلها مفيدة.
هناك شركات تخشى فقدان البيانات لأنها تعتقد أنها قد تكون مفيدة “في يوم ما”. ومع ذلك ، من المهم أيضًا التحكم في تدفق البيانات من خلال تحديد ما تحتاج إلى الاحتفاظ به وما لا تفعله. على سبيل المثال ، في اتصالات الشبكة ، ليس من المفيد الحفاظ على جميع البيانات في الدفق ، بما في ذلك المصافحة وغيرها من الارتعاش الذي يحدث بين الأجهزة. يبدو أن التخلص من بعض البيانات الوصفية من التدفق أمرًا واضحًا ، لكن الكثير من الشركات ليست على استعداد للقيام بذلك.
تنظيم البيانات
ما يقرب من 80 ٪ من البيانات في الشركات غير منظمة الآن ، مما يعني أن هذه البيانات تأتي بدون مفتاح بيانات أو بيانات تعريف ، وما إلى ذلك ، والتي ستكون ضرورية لإدارة أو الوصول إليها بطريقة ذات معنى.
إن الحصول على بيانات غير منظمة تحت السيطرة بحيث يمكن استخدامها من قبل المؤسسة هو تحدي إدارة البيانات رقم واحد بالنسبة لمعظم الشركات ، لأن الأمر يستغرق وقتًا (وقتًا للإنسان ، في معظم الحالات) لتطوير مفاتيح أو علامات للبيانات ، في بعض الحالات تحويل البيانات إلى بيانات منظمة.
دون اتخاذ هذه الخطوة الأولى نحو تنظيم البيانات ، لن تتمكن الشركات من إدارة البيانات التي يجمعونها أو استخدامها.
حماية
متوسط IBM المقدر تكلفة خرق البيانات في عام 2024 كان 4.88 مليون دولار. إذا كانت المنظمات ستتجنب انتهاكات البيانات ، فيجب أن تكون سياسات وممارسات الحوكمة والأمنية محكمة الإغلاق وحديث ، ويجب أن تكون ضمانات الأمن حول البيانات قوية. لا يشمل ذلك حماية مستودعات البيانات الداخلية فحسب ، بل يتضمن أيضًا التأكد من أن البيانات الواردة من أطراف ثالثة إلى أطراف ثالثة ومنتهية ، وتُحمل السحابة بشكل صحيح ، وعندما يتم تشفيرها في العبور. بالإضافة إلى ذلك ، يجب أن تضع الشركات جانباً دولارات لإجراء عمليات التدقيق الإلكترونية والداخلية السنوية (كحد أدنى) ، باستخدام الشركات الخارجية للقيام بذلك.
خاتمة
إدارة البيانات هي قطعة أساسية للرقمنة ، الذكاء الاصطناعي ، الأتمتة ، نشر النظام الجديد والحوسبة الحافة. لا يوجد أي جزء من المؤسسة التي لا تلمسها البيانات.
قد يكون هذا هو السبب في أن مديري المعلومات وقادة تقنية المعلومات يصرخون في إحباطهم عندما يفكرون في كيفية الحصول على أذرعهم حول كل هذه البيانات. ومع ذلك ، في سياق إحباطهم ، حان الوقت أيضًا لتقييم الخطوات التي تم اتخاذها بالفعل لإدارة البيانات بشكل أفضل ، سواء كانت تجعل البيانات غير منظمة قابلة للاستخدام ، وتطبيع البيانات حتى يتمكن من العمل مع أكثر من نظام واحد ، أو حتى وضع صوامع البيانات أو اثنين.
ما يمكن الآن أن يفيد هذه الشركات بشكل كبير هو تزامن خطة إدارة البيانات الكاملة. ستكشف هذه الخطة بلا شك ثقوبًا في خطوط معركة إدارة البيانات التي يجب ملؤها ، ولكنها ستكشف أيضًا عن المناطق التي تم فيها إحراز تقدم حقيقي.