الأمن السيبراني

نصائح لإدارة البيانات غير منظمة


البيانات المنظمة ، مثل الأسماء وأرقام الهواتف ، تتناسب بدقة مع الصفوف والأعمدة. ومع ذلك ، لا تحتوي البيانات غير المهيكلة على مخطط ثابت ، وقد يكون لها تنسيق معقد للغاية مثل ملفات الصوت أو صفحات الويب.

لسوء الحظ ، لا توجد أفضل طريقة واحدة لإدارة البيانات غير المهيكلة بشكل فعال. على الجانب المشرق ، هناك العديد من الأساليب التي يمكن استخدامها لمعالجة هذا التحدي الناجح والمراوغ بنجاح. فيما يلي خمس طرق تم اختبارها لتحقيق إدارة بيانات غير منظمة فعالة من الخبراء الذين شاركوا في المقابلات عبر الإنترنت.

نصيحة 1. استخدم قواعد بيانات المتجهات التي تعمل بالطاقة الذكاء مع جيل من أجل الاسترجاع

يقول أنبانج شو ، مؤسس شركة AI Video Generator Jogg.ai: “إحدى الطرق الأكثر فعالية التي رأيتها هي استخدام قواعد بيانات المتجهات التي تعمل بمواد AI مع الجيل المعزز للاسترجاع”. يقترح XU مهندس برمجيات سابق سابق في Google ، بدلاً من فرض البيانات غير المنظمة على مخططات صلبة ، سيسمح استخدام قواعد بيانات المتجهات للمؤسسات بتخزين البيانات واستردادها بناءً على معنى السياق بدلاً من تطابقات الكلمات الرئيسية الدقيقة. “هذا قوي بشكل خاص للنصوص والصوت والفيديو والصور ، حيث تقصر طرق البحث التقليدية” ، كما يلاحظ.

على سبيل المثال ، يقول شو ، يمكن للمؤسسات التي تستخدم التضمينات التي تعمل منظمة العفو الدولية تنظيم كميات هائلة من البيانات غير المنظمة والاستعلام عنها من خلال المعنى بدلاً من بناء الجملة. “هذا هو ما تُلاحظ تطبيقات الذكاء الاصطناعى مثل البحث الذكي ، ودردشات ، وأنظمة التوصية” ، يوضح. “في jogg.ai ، رأينا بشكل مباشر كيف يجعل الفهرسة والاسترجاع AI-trieval من السهل للغاية تحويل البيانات الخام وغير المنظمة إلى رؤى قابلة للتنفيذ.”

متعلق ب:ما تحتاج مديري المعلومات إلى معرفته حول الجوانب التقنية لتكامل الذكاء الاصطناعي

نصيحة 2. خذ نهج قراءة المخطط

هناك نهج مبتكر آخر لإدارة البيانات غير المهيكلة هو القراءة للمخطط. يقول كمال هاثي ، نائب الرئيس الأول للمدير العام لشركة برامج مراقبة وتحليل البيانات التي تم إنشاؤها المولدة في شركة Splunk ، وهي شركة Cisco: “على عكس قواعد البيانات التقليدية ، التي تحدد المخطط-بنية البيانات-قبل تخزينها ، تتمثل في قراء المخطط إلى هذه العملية حتى تتم قراءة البيانات أو الاستعلام عنها فعليًا”.

يقول هاثي إن هذا النهج فعال بشكل خاص للبيانات غير المنظمة وشبه المنظمة ، حيث لا يتم تعريف المخطط مسبقًا أو جامدة. “تتطلب قواعد البيانات التقليدية مخططًا محددًا مسبقًا ، مما يجعل العمل مع البيانات غير المهيكلة تحديًا وأقل مرونة.”

تتمثل الميزة الرئيسية لقراءة المخطط في أنها تمكن المستخدمين من العمل مع البيانات الأولية دون الحاجة إلى تطبيق عمليات التحويل التقليدية (ETL) ، الحالات ، الحالات. “هذا ، بدوره ، يسمح بالعمل مع التنوع الذي يظهر عادة في البيانات التي تم إنشاؤها بواسطة رشاش ، مثل سجلات القياس عن بُعد في النظام وتطبيق.”

متعلق ب:كسر الخبز: هل تفهم بياناتك؟

نصيحة 3. انظر إلى السحابة

تقترح Cam Ogden ، نائب الرئيس الأول في شركة Data Integrity بالتصنيفات التي تحركها AI ، إدارة البيانات غير المهيكلة من خلال دمجها مع البيانات المنظمة في بيئة سحابية باستخدام وضع علامات البيانات الوصفية والتصنيفات التي تحركها الذكاء الاصطناعي. يقول: “تقليديا ، البيانات المنظمة-مثل قواعد بيانات العملاء أو السجلات المالية-في أنظمة منظمة تنظيماً جيداً مثل قواعد البيانات العلائقية أو مستودعات البيانات”. ومع ذلك ، للاستفادة الكاملة من جميع بياناتها ، تحتاج المؤسسات إلى تحطيم الصوامع التي تفصل بين البيانات المنظمة عن أشكال أخرى من البيانات ، بما في ذلك البيانات غير المهيكلة مثل النص أو الصور أو ملفات السجل. هذا هو المكان الذي تلعب فيه السحابة.

يسمح دمج البيانات المنظمة وغير المنظمة في السحابة بإجراء تحليلات أكثر شمولاً ، مما يمكّن المنظمات من استخراج رؤى أعمق من المعلومات التي تم إنشاؤها سابقًا ، كما يقول أوجدين. يمكن أن تصنف الأدوات التي تعمل بالطاقة الذاتي وإثراء البيانات المنظمة وغير المنظمة ، مما يسهل اكتشاف وتحليل وتحكم في منصة مركزية ، كما يلاحظ. “توفر السحابة قابلية التوسع والمرونة اللازمة للتعامل مع كميات كبيرة من البيانات مع دعم أعباء عمل التحليلات الديناميكية.” بالإضافة إلى ذلك ، توفر المنصات السحابية إمكانيات حوكمة البيانات المتقدمة ، مما يضمن أن تظل كل من البيانات المنظمة وغير المنظمة آمنة ومتوافقة ومتوافقة مع أهداف العمل. “لا يعمل هذا النهج على تحسين إدارة البيانات فحسب ، بل يضع أيضًا المنظمات لاتخاذ قرارات أكثر استنارة وفعالية تعتمد على البيانات في الوقت الفعلي.”

متعلق ب:Cio Joel Klein وتقاطع الطب و IT

نصيحة 4. استخدم التصنيف والفهرسة التي تعمل بمنظمة العفو الدولية

يقول Adhiran Thirmal ، وهو مهندس حلول كبير في شركة Security Compass ، إن أحد أفضل الطرق للحصول على قبضة على البيانات غير المنظمة هي استخدام التصنيف والفهرسة التي تعمل بمنظمة العفو الدولية. “مع التعلم الآلي (ML) ومعالجة اللغة الطبيعية (NLP) ، يمكنك تلقائيًا فرز البيانات وتنظيمها وتنظيمها بناءً على محتواها وسياقها” ، يوضح. “إقران هذا النهج مع نظام تخزين البيانات القابل للتطوير ، مثل بحيرة البيانات أو تخزين الكائن ، يجعل من السهل العثور على المعلومات واستخدامها عندما تحتاجها.”

يقول Thirmal إن الذكاء الاصطناعي يأخذ العمل اليدوي من تنظيم البيانات. يقول: “لا مزيد من إهدار الوقت في البحث في الملفات أو يكافح من أجل الاحتفاظ بالأشياء بالترتيب”. “يمكن أن تبرز الذكاء الاصطناعى المعلومات التي تحتاجها بسرعة ، وتقليل الخطأ البشري وتحسين الكفاءة. كما أنه ممتاز للامتثال ، وضمان البيانات الحساسة – مثل المعلومات الشخصية أو المالية – يتم معالجتها بشكل صحيح وحمايتها.”

نصيحة 5. قم بإنشاء منصة بيانات موحدة ذات سيادة

يقول بنيامين أندرسون ، نائب الرئيس الأول للتكنولوجيا في مزود خدمات قاعدة البيانات ، إن نهجًا مبتكرًا لإدارة البيانات غير المهيكلة يتجاوز أساليب بحيرة البيانات القديمة. يدمج منصة البيانات الموحدة ذات السيادة البيانات غير المهيكلة وشبه منظمة ومنظمة في نظام واحد ، مما يلغي الحاجة إلى حلول منفصلة. ويوضح قائلاً: “يقدم هذا النهج ميزات جودة الخدمة المتاحة سابقًا فقط للبيانات المنظمة”. “من خلال طائرة تحكم مختلطة ، يمكن للمؤسسات إدارة بياناتها مركزيًا عبر بيئات متعددة ، بما في ذلك العديد من المنصات السحابية والبنية التحتية المحلية.”

عندما يتعلق الأمر بإدارة أشكال متنوعة من البيانات ، سواء كانت منظمة أو غير منظمة أو شبه منظمة ، يتطلب النهج التقليدي قواعد بيانات متعددة وحلول التخزين ، مما يضيف التعقيد التشغيلي والتكلفة ومخاطر الامتثال. “إن توحيد البيانات المنظمة وغير المنظمة في منصة بيانات متعددة النماذج واحدة سيساعد في تسريع أعباء العمل المعاملات والتحليلية والمنظمة العفوية.”





Source link

زر الذهاب إلى الأعلى