الأمن السيبراني

كيف يؤثر التحيز على النتائج


مع استمرار الذكاء الاصطناعي في التغلغل في المؤسسات، هناك مخاوف بشأن التحيز الخوارزمي، وخاصة فيما يتعلق بالعدالة. ومع ذلك، فإن التحيز الخوارزمي لا يحدث من تلقاء نفسه.

“هناك” [three] “يقول رايد غاني، أستاذ الذكاء الاصطناعي في جامعة هارفارد: “هناك أسئلة يجب على الشركات طرحها عند بناء منتج أو خدمة: ما هي القرارات الأكثر أهمية؟ أين نفضل أن نخطئ؟ مع من نفضل أن نخطئ؟” جامعة كارنيجي ميلون.

لماذا لا نتخلص من كل أشكال التحيز وننتهي من هذه المشكلة؟ أتمنى لكم التوفيق، لأن البشر هم السبب الرئيسي وراء التحيز.

“الخطوة الأولى هي التفكير في التحيز غير المرغوب فيه. والخطوة الثانية هي كيف أقيسه. والخطوة الثالثة هي التدقيق. قبل أن أصلحه، أريد أن أعرف من أين جاء لأنه إذا لم أعرف من أين جاء، فلن أعرف كيفية إصلاحه”، كما يقول غاني. “إنها ليست بيانات، وليست خوارزمية، إنها عملية بشرية تولد البيانات”.

اثنان من أكثر أنواع التحيز شيوعًا في مجال الأعمال هما التحيز في التأكيد والتحيز في الاختيار.

في حالة التحيز التأكيدي، يرغب الشخص في أن تدعم البيانات وجهة نظره أو تؤكدها. ومن الأمثلة على ذلك: رفض الرؤساء التنفيذيين للنتائج التحليلية وإخبار علماء البيانات بما يجب أن تقوله البيانات بدلاً من ذلك أو قيام الآخرين “بتعذيب البيانات” للحصول على النتيجة التي يريدونها.

متعلق ب:دراسة سريعة: أخلاقيات الذكاء الاصطناعي والتحيز

يُطلق على التحيز في الاختيار أحيانًا اسم “الانتقاء”، على الرغم من أن القضية الأوسع نطاقًا هي نقص البيانات، لأن التحيز في الاختيار ليس دائمًا فعلًا واعيًا. على وجه التحديد، قد تكون هناك بيانات مفقودة تؤثر على النتائج.

يقول رايان سلون، كبير علماء البيانات في شركة Textio، وهي شركة تقدم منصة الذكاء الاصطناعي للموارد البشرية، في مقابلة عبر البريد الإلكتروني: “أقضي الكثير من الوقت في التفكير فيما لا يتم قياسه. أعتقد أن تحيز المتغيرات المحذوفة هو المشكلة الدائمة التي يواجهها علماء البيانات”. “غالبًا ما أعمل مع بيانات رصدية، ولكن حتى عندما أجري تجربة عشوائية مناسبة، فإنني أفعل ذلك ضمن سياق البيانات الحالي. يتطلب الأمر دراسة متأنية للميزات المفقودة. أعتقد أن الفخ الشائع هو النظر في جميع البيانات المتاحة، والتحمس، والقفز إلى استكشاف العلاقة بين الميزات، وتعيين التأثيرات للمتغيرات الخطأ”.

ولمعالجة هذه القضية، بدأ بالسؤال: ما هي العلاقات الحقيقية التي يمكن رصدها هنا؟ وأي منها تشكل عوامل إرباك؟ وما هي العلاقات التي قد تكون بالغة الأهمية ولكنها مفقودة؟

“إن هذا النشاط أحب أن أقوم به مع الشركاء وخبراء الموضوع كلما أمكن ذلك. إن عملية رسم مخطط سببي يمكن أن تؤسس بوضوح للمشكلة في أنواع الأسئلة التي يمكن الإجابة عليها”، كما يقول سلون. “يمكن أن يساعد في تحديد الضوابط، والتي قد تتطلب جمع المزيد من البيانات، أو المتغيرات الآلية. إنها خطوة مفيدة حتى عندما لا يكون هدفي هو الاستدلال السببي: إنها تعمل على تحسين نموذجنا للنظام الذي سيتم قياسه”.

متعلق ب:ماذا يستطيع مدير المعلوماتية أن يفعل بشأن تحيز الذكاء الاصطناعي؟

المشكلة في البيانات المفقودة هي أن هناك شيئًا ما يتم تمثيله بشكل مفرط أو غير كافٍ.

ريان سلون.jpg

“بصفتي عالم بيانات، يجب أن أكون دائمًا متشككًا بعض الشيء في البيانات المتاحة. وقد جلب الذكاء الاصطناعي التوليدي هذا الأمر إلى الواجهة بالنسبة لي لأننا الآن نعيد إنتاج الأنماط من بيانات التدريب على نطاق المستهلك، وفي بعض الأحيان تكشف هذه الأنماط عن الأسوأ، سواء كان ذلك في من يتم استبعادهم أو الصور النمطية التي يتم تعزيزها”، كما يقول سلون. “الشيء الرئيسي الذي أحاول التأكيد عليه هو أنه يتعين علينا ارتداء قبعة المتشكك وطرح بعض الأسئلة الحاسمة قبل أن نمضي قدمًا. من أين أتت البيانات؟ إلى أي مدى يتوافق هذا المصدر مع متطلباتي؟ هل تم ضبط النموذج وتصميمه لتقدير النتائج الواقعية، أو توليد نتائج معقولة؟ كيف سأعرف ما إذا كان صحيحًا؟”

جاري روزال، المحلل الرئيسي وعالم البيانات في شركة المراتب ساتفايقول إن هناك ما لا يقل عن عشرة أنواع من التحيز تحدث أثناء عملية جمع البيانات وتحليلها وتوليد الأفكار، مما يؤدي إلى الحصول على معلومات رديئة لاتخاذ القرار وإنتاج نتائج أعمال غير مواتية. وهو يتعامل مع التحيز من منظور شامل، ويستخدم ما يلي كقائمة مراجعة:

متعلق ب:كيف يؤثر تحيز الذكاء الاصطناعي على الرعاية الصحية

صياغة الفرضيات:قد تؤدي الفرضية التي تحتوي على صياغة ضعيفة أو تحيز تأكيدي متعمد، بغض النظر عن البيانات، إلى استنتاج واحد دون وجود وجهة نظر معارضة أو إمكانية وجود نتائج متناقضة.

يقول روزال في مقابلة عبر البريد الإلكتروني: “يتلخص الاختبار في كتابة نفي الفرضية ومعرفة ما إذا كان الشكل المنفي لا يزال مقبولاً كفرضية. على سبيل المثال، الفرضية الأولية ــ سوف تمطر غداً، ونفيها ــ لن تمطر غداً. وإذا بدا كلاهما مقبولاً كفرضيتين، فقد يكونان غير متحيزين”.

اختيار العينة:نظرًا لأنه ليس من الممكن دائمًا جمع البيانات من كل عضو في المجتمع، فمن العملي جمع بيانات العينة فقط من عينة تمثيلية من المجتمع المستهدف.

ويقول روزال: “من الأهمية بمكان أن يتم جمع بيانات العينة من الأعضاء الذين يتم اختيارهم عشوائيًا من السكان”.

معالجة البيانات:يمكن أن يبدأ التحيز عندما يبدأ المحقق في تحليل البيانات أثناء عملية نظافة البيانات. وقد يتم تجاهل بعض نقاط البيانات باعتبارها بيانات “سيئة” بينما قد تكون هذه البيانات غير البديهية في الواقع المصدر الأكثر أهمية للمعلومات.

اختيار المنهجية والتحليلات:تفضل بعض الأساليب الإحصائية نتائج محددة. على سبيل المثال، نماذج الانحدار القياسية هي، من الناحية النظرية (وبعبارات بسيطة)، متوسط.

“[W]في حين أن نماذج الانحدار ستوفر ملخصًا أو تنبؤًا غير متحيز، إلا أنها تفشل في التنبؤ بالأحداث النادرة أو المتطرفة مثل الفشل الكارثي. في حالات الاستخدام هذه، قد يؤدي إدخال التحيز المستنير والمعرفة الضمنية إلى إنتاج معلومات أفضل. في هذه المرحلة، ليس كل التحيز خاطئًا، طالما أنه معروف، ويمكن معرفته، والاعتراف به، “كما يقول روزال.

تحيز النشر:بعد الانتهاء من تحليل البيانات وتفسيرها، حان الوقت لمشاركة نتائج الدراسة. هناك تحيز لتجاهل المعلومات، حتى في الدراسات العلمية، التي لا تدعم الرسالة المقصودة من قبل المؤلفين أو السلطات. وهذا شكل من أشكال التحيز التأكيدي والتحيز الاختياري.

“ببساطة، تؤدي المعلومات الرديئة إلى اتخاذ إجراءات تؤدي إلى نتائج غير مرغوبة”، كما يقول روزال. “إن عمليات التحقق أثناء عملية التحليل من قبل شخص غير مشارك في جمع البيانات وتحليلها [are important.] في شركة Saatva، قمنا بوضع قاعدة في قسم التحليلات: كل محلل لديه مدقق هو شخص مختلف.

يعتبر التمييز أمراً سيئاً، لكنه في بعض الأحيان ضروري

تتطلب العدالة معرفة وإدارة التحيز. على سبيل المثال، يقول بوب روجرز، عالم البيانات الذي تلقى تدريبه في هارفارد والرئيس التنفيذي لشركة تحسين سلسلة التوريد: أوي.ايكان يعمل على تطوير الذكاء الاصطناعي لتشخيص الرعاية الصحية أثناء وجوده في جامعة كاليفورنيا في سان فرانسيسكو (UCSF) والذي حدد الحالات الطارئة في الأشعة السينية للصدر لمرضى وحدة العناية المركزة (ICU). عند اختباره على بيانات من منظمات رعاية صحية أخرى، تسببت الاختلافات في تاريخ رعاية المرضى والطرق التي تم بها التقاط الأشعة السينية في تدهور كبير في أداء الخوارزمية. في النهاية، مع التدريب الإضافي على مجموعة بيانات أكثر تمثيلاً، نتجت خوارزمية موثوقة وعالية الأداء.

يقول روجرز في مقابلة عبر البريد الإلكتروني: “في النهاية، أدى نقص تمثيل بعض حالات المرضى إلى ظهور نقاط عمياء في الذكاء الاصطناعي، والتي كانت لتمنع الأداء الموثوق به وموافقة إدارة الغذاء والدواء على النظام. هذا ينطبق فقط على قطاع الرعاية الصحية. يمكنك بسهولة توسيع السيناريو ليشمل صناعات أخرى. يتم تدريب التحيز بشكل مباشر أو غير مباشر في الذكاء الاصطناعي عندما يكون هناك نقص في التنوع في البيانات”.

وللتقليل من هذا التحيز، من المهم استخدام مجموعات بيانات متنوعة وذات جودة عالية.

“التحدي الأكبر هو أنك لا تعرف دائمًا ما هي تحيزاتك، أو أين تمثل مجموعة معينة بشكل أقل، لذا قم بتقسيم البيانات وتقسيمها بأكبر قدر ممكن من الطرق [possible]”وراقب دلاء الأمثلة الفارغة تقريبًا”، كما يقول روجرز. “هناك أدوات لإخراج مجموعات فرعية مختلفة من البيانات بشكل عشوائي لمعرفة تأثير ذلك على نتائج التدريب والتي يمكن أن تساعد في تحديد نقاط الضعف. أخيرًا، ستحتاج دائمًا إلى الاحتفاظ ببعض البيانات للتحقق النهائي من صحة الخوارزمية. هناك دائمًا إغراء للاحتفاظ بمجموعة صغيرة بحيث يكون لديك الكثير من البيانات للتدريب بها، ولكن يجب مقاومة هذا الإغراء والاحتفاظ بقدر ما تستطيع. هذه المجموعة الأخيرة من البيانات هي رؤيتك بالأشعة السينية للنقاط الضعيفة المحتملة في نموذجك”.

بوب_روجرز_3.jpg

هناك بعض الحالات التي يكون فيها التحيز ضروريًا، مثل تحديد العملاء الذين سيحصلون على قرض عقاري أو بطاقة ائتمان، ولكن يجب على المؤسسات المالية أن تكون على دراية بالتمييز غير القانوني. إن مجرد استبعاد السمات مثل الجنس أو العرق ليس كافيًا لأنه في بعض الأحيان يمكن استنتاج نفس المعلومات من خلال سمات أخرى، مثل الاسم الشخصي.

يقول آدم ليبرمان، كبير مسؤولي الذكاء الاصطناعي في شركة تقديم تكنولوجيا الخدمات المالية: “إذا تم إنتاج البيانات لتطبيقات العملاء الخارجيين، فيجب أخذ قضايا أوسع في الاعتبار، مثل تحيز العينة، والذي قد يفضل خصائص معينة وعملاء أو مستخدمين”. فيناسترا“في حالة خوارزمية اتخاذ القرار بشأن القروض الافتراضية، فإن بيانات التدريب التي تعكس الرجال البيض من الطبقة المتوسطة سوف تخدم بشكل أقل وتميز ضد أولئك الذين لا يندرجون ضمن هذا المقطع العرضي المجتمعي. بالطبع، يجلب هذا المثال أنواعًا أخرى من التحيزات، مثل التحيز الديموغرافي والتحيز الثقافي والتحيز التأكيدي والتحيز الخوارزمي. ويتأثر الأخير بالأمثلة السابقة، لكن النتائج يمكن أن تكون ضارة بشكل خاص في سياق القرارات الآلية، والتي ستؤدي حتماً إلى نتائج غير عادلة”.

وللتقليل من التحيزات المحتملة في البيانات، يوصي بما يلي:

  • ضمان فهم فرق علوم البيانات للمشاكل المحتملة التي قد تسببها النتائج غير العادلة على المستخدمين والمجتمعات التي تخدمها حلولهم،

  • ضمان أن يكون لدى الموظفين وعي جيد باللوائح التي تحمي المستخدمين من التحيز والتمييز، مثل قانون المساواة في المملكة المتحدة واللائحة العامة لحماية البيانات في الاتحاد الأوروبي،

  • إن إنشاء أطر البيانات وأفضل الممارسات، والتي تدعمها الحواجز التقنية والإجرائية، يعد عنصرًا أساسيًا في هذا النشاط،

  • التأكد من أن البيانات عالية الجودة ومتنوعة وتعكس المجتمعات التي سيخدمها الحل.

يقول ليبرمان: “إن أحد الأمور التي تساعد حتمًا في هذا المسعى هو ضمان تمثيل فرق علوم البيانات للمجتمعات التي تبني الحلول لها. إذا تم إنتاج البيانات من خلال خوارزمية، فيجب أن تكون النتائج قابلة للتفسير (بقدر الإمكان) مع تقييم وتبرير منهجيات اختيار البيانات وتجميعها وتنظيفها وتوليد الميزات بدقة. كما أن الاختبار هو مرحلة حاسمة في تحديد جدوى الحلول المدعومة بالذكاء الاصطناعي. إذا أظهرت النتائج تحيزًا، فستكون هناك حاجة إلى إعادة التدريب ومجموعات بيانات أفضل أو أكثر تنوعًا”.

ربما يكون من المدهش بالنسبة للعامة أن علماء البيانات يعتبرون الافتقار إلى البيانات تحديًا كبيرًا، على الرغم من التوسع السريع في عالم البيانات. ومع ذلك، قد لا يكون هناك ما يكفي من البيانات المتنوعة أو التاريخية لتجنب النتائج المتحيزة.

يقول ليبرمان: “إن أحد الحلول لهذه المشكلة هو استخدام شبكات تنافسية توليدية مشروطة قادرة على توليد بيانات اصطناعية تدمج خصائص انتقائية للبيانات الأصلية مع سمات أكثر تنوعًا وتمثيلًا”. “تتوافق استراتيجيات التخفيف الأخرى في الغالب مع أفضل الممارسات المتعلقة بجمع البيانات. إذا تبين أن مجموعة البيانات ناقصة، فسوف يكون من الضروري جمع البيانات حول المجموعات غير الممثلة. يعد تصنيف البيانات أيضًا عنصرًا بالغ الأهمية وهو عملية يجب أن تتوافق مع أطر البيانات والمبادئ التوجيهية التنظيمية. على سبيل المثال، إذا أصاب التحيز الذاتي عملية التصنيف، فسوف ينعكس هذا في النتائج الناتجة”.

نصيحته هي التأكد من وجود أطر ومبادئ توجيهية لإدارة البيانات التنظيمية التي تعالج المشاكل المختلفة حول التحيز.

يقول ليبرمان: “من خلال خلق ثقافة واعية بالضرر الذي قد يسببه التحيز للعملاء والمؤسسة، فإن احتمالات تسلل الأنواع المختلفة من التحيز ستقل إلى حد كبير. قم بإنشاء مجموعات مناصرة داخلية ومنتديات لتبادل المعرفة حتى يكون الجميع على دراية بالمخاطر ودورهم في الحد من التحيز والعواقب المحتملة لعدم القيام بذلك”.





Source link

زر الذهاب إلى الأعلى