البودكاست: كيفية ضمان جودة البيانات لمنظمة العفو الدولية

في هذا البودكاست نتحدث مع Cody David ، Solutions Architect مع Syniti ، وهو جزء من Capgemini ، حول أهمية ضمان جودة البيانات لأعباء العمل الذكاء الاصطناعي (AI).
ويقول إن أن تكون قادرًا على الوثوق بمنظمة العفو الدولية أمر أساسي لاستخدامه. وهنا نحتاج إلى التأكد من أن نتائجها موثوقة. سيكون هذا هو الحال فقط إذا تم تدريب الذكاء الاصطناعي على مجموعة بيانات غير مليئة بالتكرارات والبيانات غير المكتملة.
وفي الوقت نفسه ، يدعي منظمة العفو الدولية ، يمكن استخدامها إلى ديفيد المساعدة في جودة البيانات، مثل إيجاد مشكلات في مجموعات البيانات التي يمكن أن تؤدي إلى نتائج خاطئة.
تتمثل الوجبات الجاهزة الكبيرة في أن المؤسسات تحتاج إلى موقف “أول بيانات” حتى تتمكن الذكاء الاصطناعى من القيام بعملها و إنتاج نتائج موثوقة يمكن الوثوق به ، ويحدد الانتصارات السريعة التي يمكن اكتسابها.
أنتوني أدشيد: ما هي التحديات الرئيسية في جودة البيانات في المؤسسة لحالات استخدام الذكاء الاصطناعي؟
كودي ديفيد: أحد أكبر التحديات في جودة البيانات لمنظمة العفو الدولية التي أراها هي الثقة.
كثير من الناس ينظرون إلى نظام الذكاء الاصطناعى كمربع أسود واحد. عندما ينتج عنه رؤية أو إجراء غير صحيح ، يطلقون عليه خطأ منظمة العفو الدولية ويفقدون الثقة. في بعض الأحيان بشكل دائم ، قد يفقدون هذه الثقة.
ومع ذلك ، فإن القضية الحقيقية تكمن غالبًا في جودة البيانات الرديئة. يتضاعف هذا بسبب عدم فهم كيفية عمل حلول الذكاء الاصطناعى حقًا.
النظر في منظمة المبيعات. لديهم CRM ولديه سجلات العملاء مكررة. ويصنف حل الذكاء الاصطناعى عملائك بشكل غير صحيح لأنه لا يدوم جميع المعاملات إلى حساب واحد.
لذلك ، يلوم فريق المبيعات أداة الذكاء الاصطناعى ، ولا يدرك أبدًا أن السبب الجذري هو في الواقع بيانات سيئة أو غير متسقة. هذا مثال على ما نسميه جودة البيانات لـ AI ؛ ضمان أن البيانات دقيقة وجاهزة لتلك العمليات التي تحركها AI.
على الجانب الآخر ، هناك أيضًا منظمة العفو الدولية لجودة البيانات ، حيث يمكن أن يساعد حل الذكاء الاصطناعي في اكتشاف ودمج السجلات المكررة التي قدمناها للتو في هذا المثال. أعتقد أن أحد التحديات الأخرى هو أن جودة البيانات كانت تاريخياً فكرة لاحقة. غالبًا ما تقفز المنظمات إلى الذكاء الاصطناعي دون عقلية البيانات الأولى هذه وقبل التأكد من أن لديها أساس البيانات الصلبة.
لذلك ، لديك هذه الأنظمة القديمة ، هذه أنظمة ERP القديمة مع الآلاف من الجداول وعقود من مشكلات البيانات المركبة.
هذا كل ما يضيف إلى هذا التعقيد. وهذا هو السبب في أنه من الأهمية بمكان معالجة مشكلات جودة البيانات بشكل استباقي بدلاً من محاولة تعديل الحلول بعد فشل مبادرات AI هذه. يجب أن نضع هذه البيانات مقدمًا ومركزًا لمبادرات AI هذه ، ثم نؤسس هذا الحل المستقر الذي يدعم مخرجات الذكاء الاصطناعى الجديرة بالثقة.
ما هي الخطوات الرئيسية التي يمكن أن تتخذها المؤسسة لضمان جودة البيانات لمنظمة العفو الدولية؟
ديفيد: أعتقد أن النهج المنهجي يبدأ دائمًا بحوكمة البيانات.
وهذا هو في الحقيقة سياسات كيفية جمع البيانات وتخزينها وتطهيرها ومشاركتها ومعرفة من هو المالك الحقيقي لعمليات تجارية معينة أو مجموعات بيانات. من الأهمية بمكان معرفة من المسؤول عن تلك المعايير.
أعتقد أن هذا بعد ذلك ، تريد تحديد الأولويات. بدلاً من محاولة إصلاح كل شيء دفعة واحدة ، ركز على تلك المجالات التي تقدم أكبر تأثير تجاري. هذه عبارة رئيسية للغاية: ما هو أكبر تأثير تجاري لما تحاول إصلاحه بقدر جودة البيانات؟ واكتشف تلك التي تغذي حلول الذكاء الاصطناعي.
هذا هو المكان الذي سترى فيه هذه الانتصارات السريعة. الآن ، ستكون هناك مخاوف تتعلق بالميزانية التي تنشأ غالبًا عند البدء في الحديث عن جودة البيانات هذه ، وبرامج حوكمة البيانات. ومن المفارقات أن العمل أكثر تكلفة العمل مع بيانات سيئة على المدى الطويل.
أعتقد أن الحل العملي هو بدء صغير. اختر عملية تجارية حرجة مع تأثيرات مالية قابلة للقياس. استخدم ذلك كطيار لإظهار تلك المدخرات الحقيقية في العائد على الاستثمار.
وبمجرد إظهار أن تحسينات جودة البيانات تؤدي إلى مزايا ملموسة ، مثل تخفيضات التكاليف أو رأس المال العامل الأعلى ، سيكون لديك قضية أقوى مع الإدارة لاستثمار أوسع في حوكمة البيانات. يجب عليك أيضًا تضمين ممارسات جودة البيانات في سير عمل البيانات. على سبيل المثال ، دمج قواعد التحقق من الصحة في إدارة البيانات الخاصة بك بحيث يمكن اكتشاف الأخطاء على الفور ، ومنع تلك البيانات من التأثير على هذه الحلول.
إذا لم تتمكن من وضع عمليات التحقق من صحة مثل إنشاء البيانات الخاصة بك ، فيجب عليك وضع الأنظمة والعمليات في مكانها لالتقاطها فورًا من خلال التقارير الآلية.
أخيرًا ، أود أن أقول دائمًا التركيز على هذا التحسن المستمر. قياس مقاييس جودة البيانات واستخدمها لدفع التحسينات التكرارية عن طريق نسج حوكمة البيانات في مؤسستك ، وإثبات قيمتها من خلال هؤلاء الطيارين المستهدفين ، ثم تقوم بإنشاء هذا الأساس المستدام لمبادرات الذكاء الاصطناعى الجديرة بالثقة.
أخيرًا ، تساءلت عما إذا كان بإمكانك تقديم مثال على فوز واحد أو اثنين من الفوز السريع الذي يمكن أن تحصل عليه المؤسسات من حيث جودة البيانات وتحسين صفات البيانات لمنظمة العفو الدولية؟
ديفيد: هناك بعض الأمثلة المختلفة للمكان الذي نحاول فيه الحصول على انتصارات سريعة لجودة البيانات ، خاصة عند محاولة الحصول على عائد استثمار سريع للغاية وعمليات تجارية عالية التأثير.
إذا أخذت نظام ERP ، فلدينا ما نسميه مواد MRO. تلك هي أجزاء للمعدات في عملية التصنيع. وعندما يكون لديك هذه المواد ، عادةً ما تحتفظ بمخزون أمان أو كمية من تلك العناصر التي تسمح لك بإصلاح تلك الآلات.
إذا سقط مصنع ، فستخسر ملايين الدولارات في اليوم. وإذا كان لديك مواد مكررة ، كمثال ، فأنت تخزن بالفعل أكثر مما تحتاج. وهذا في الواقع هو رأس المال العامل ، إذا كنت ستقوم بتصحيح جودة البيانات هذه ، فأنت تحرر رأس المال العامل هذا.
وبعد ذلك ، بالطبع ، يمكنك استخدام رأس المال العامل هذا لأجزاء أخرى من مبادراتك.
واحد آخر ربما يكون خصومات البائع. إذا كان لديك بائعين مكررون في نظام ، ويحق لهم الحصول على الحسومات بناءً على مبلغ الأموال التي ينفقونها ، فلن يدركوا تلك الحسومات المحددة. يمكن أن يكون هذا مجالًا يمكن أن يكون لديك فيه وفورات في التكاليف أيضًا.