لماذا يجب أن تقود المملكة المتحدة على البيانات لإلغاء تأمين إمكانات الذكاء الاصطناعي الكاملة

تمتلك حكومة المملكة المتحدة بعضًا من مجموعات البيانات الأكثر قيمة في العالم ، بما في ذلك الإحصاءات الرسمية وسجلات التراث الثقافي وبيانات صحة NHS. تعمل مجموعات البيانات هذه على اختراقات علمية ، وابتكار تجاري ، والتحسينات في الخدمات العامة.
مع نشر خطة عمل فرص الذكاء الاصطناعى التي طال انتظارها ، لم تكن الإمكانات التحويلية للبيانات الحكومية لمنظمة العفو الدولية أكثر وضوحًا. ومع ذلك ، فإن الأبحاث الحديثة التي أجراها معهد البيانات المفتوحة (ODI) تكشف عن أوجه القصور الحرجة في كيفية إعداد مجموعات البيانات الحكومية ونشرها لمنظمة العفو الدولية.
البيانات الحكومية وتحدي الموثوقية من الذكاء الاصطناعي
نماذج الأساس (FMS) ، مثل ChatGPT و Gemini ، يتم استخدامها بشكل متزايد لتوفير معلومات عن السياسات والخدمات العامة. ومع ذلك ، فإن بحث ODI يبرز أنه على الرغم من أن هذه النماذج تتخلص من مستودعات البيانات الحكومية ، فإنها غالبًا ما تفشل في تقديم مخرجات دقيقة بناءً عليها. بدلاً من ذلك ، تعتمد النماذج على مصادر ثانوية أو غير موثوقة ، مثل منشورات وسائل التواصل الاجتماعي أو مقالات الرأي ، أو ببساطة تصنيع الإجابات.
العواقب كبيرة. على سبيل المثال ، قد يتلقى المواطنون الذين يستخدمون أدوات الذكاء الاصطناعى لفهم استحقاقات الفوائد نصيحة مضللة أو غير مكتملة ، مما يؤدي إلى تقويض ثقة الجمهور في كل من الخدمات الحكومية والحكومة. هذا يهم بشكل خاص بالنظر إلى تركيز حكومة المملكة المتحدة على تحسين تقديم الخدمات العامة من خلال ابتكار الذكاء الاصطناعي.
عجز البيانات في النظام البيئي لمنظمة العفو الدولية
ال خطة عمل فرص الذكاء الاصطناعي، تأليف مات كليفورد ، يؤكد بحق دور مكتبة البيانات الوطنية (NDL) كوسيلة لإلغاء قفل البيانات الحكومية لمبتكري الذكاء الاصطناعي. ومع ذلك ، فإن الوضع الحالي لمجموعات البيانات الحكومية يمثل حواجز كبيرة أمام تحقيق هذه الرؤية.
وجد تحليل ODI لـ CommonCrawl ، وهو مستودع مجموعة بيانات رئيسية لنماذج الذكاء الاصطناعى ، أنه كشط 13،556 صفحة من Data.gov.uk اعتبارًا من أبريل 2024. ومع ذلك ، نادراً ما ساهمت هذه الصفحات في مخرجات نموذج دقيقة. عبر 195 استعلامات اختبار ، تم الإشارة إلى النماذج بشكل صحيح Data.gov.uk إحصائيات في خمس حالات فقط.
تنشأ هذه القضية لأن البيانات الحكومية لا يتم نشرها غالبًا بتنسيقات جاهزة للانعدام الذكاء. في حين يتم استخدام تقنيات مثل DCAT لجعل مجموعات البيانات قابلة للاكتشاف ، فإن البنية التحتية للكشط مثل CommonCrawl لا تدعم هذه التقنيات بالكامل. نتيجة لذلك ، تعتمد نماذج الذكاء الاصطناعى على مصادر أقل موثوقية ، مما يديم المعلومات الخاطئة. تشير نتائج ODI إلى أن طموح المملكة المتحدة في القيادة في ابتكار الذكاء الاصطناعي يمكن أن يتعثر ما لم يتم معالجة هذا الانفصال.
دليل من تجارب ODI
أجرت ODI تجربتين لدراسة كيفية دعم البيانات الحكومية نماذج الذكاء الاصطناعى ، وبالتالي ، كيف يتم تمكين نماذج الذكاء الاصطناعى لدعم سكان المملكة المتحدة.
قامت التجربة الأولى بتحليل مدى أهمية مواقع الحكومة في المملكة المتحدة لمنظمة العفو الدولية. أجرى الباحثون دراسة الاجتثاث باستخدام “تقنية غير متوفرة للآلة” لإزالة مواقع الويب Gov.uk من مجموعة مختارة من بيانات تدريب FMS.
كشفت النتائج عن زيادة بنسبة 42.6 ٪ في عدم دقة النماذج عند حرمانها من محتوى Gov.uk ، مما يؤدي إلى أخطاء أساسية. على سبيل المثال ، وجد أحد الاختبارات أن النماذج التي لم تتمكن من الوصول إلى مواقع الويب الحكومية ألقوا معلومات عن أهليتهم لصالح الطفل.
في المقابل ، وجدت التجربة الثانية أن مجموعات البيانات الحكومية غير معروفة حاليًا لنماذج الذكاء الاصطناعي. هذه التجربة ، وهي دراسة لقدرة النماذج على استدعاء إحصائيات محددة من Data.gov.uk ، وجدت أنه من بين 195 استعلامات ، أشارت النماذج بدقة إلى الإحصاءات الحكومية الرسمية خمس مرات فقط.
كان الاستنتاج من هذه التجارب أنه على الرغم من أن المواقع الحكومية أمر حيوي لدقة الذكاء الاصطناعي ، فإن مجموعات بيانات الإحصاءات الحكومية غير مستغلة على الرغم من قيمتها الهائلة وإمكاناتها في تقديم الخدمات العامة. إذا كنا نريد أن ندرك إمكانات الذكاء الاصطناعى لتقديم فوائد مثل تحسين جودة الرعاية والسلامة وفعالية التكلفة في NHS ، يجب على الحكومة تحديد أولويات تحسين جودة بياناتها وسهولة الوصول إليها.
الطريق إلى الأمام
اعتماد مبادئ عادلة – ضمان اكتشاف البيانات ، ويمكن الوصول إليها ، قابلة للتشغيل ، وقابلة لإعادة الاستخدام – تم دافعها منذ فترة طويلة بواسطة data.gov.uk ولا تزال أساسًا قويًا. أدوات ناشئة مثل كرواسون ، تنسيق بيانات تعريف قابلة للقراءة الآلة المصمم للتعلم الآلي ، يمكن أن يعزز قابلية الاكتشاف والتكامل في سير عمل المطورين. إذا تم تحسين أوصاف مجموعة البيانات ، فستكون أكثر قابلية للاستخدام لمستخدمي الإنسان والآلات.
يجب على الحكومة تحفيز مشاركة البيانات المسؤولة لضمان الوصول العادل إلى البيانات عالية الجودة. يمكن أن يشمل ذلك الحوافز الضريبية لمشاركة بيانات القطاع الخاص ، أو تفويضات للمشاريع الممولة من القطاع العام لفتح بياناتها عند الاقتضاء ، أو حتى ضريبة على المحتوى الذي تم إنشاؤه بواسطة AI لتمويل مصادر المعلومات الموثوق بها. يجب أن نستخدم تقنيات تعزيز الخصوصية مثل الصلبة، التي توفر للأفراد الوصول المباشر والتحكم في بياناتهم – على سبيل المثال ، بيانات الرفاهية والصحية – لضمان الوصول إلى البيانات الحساسة دون المساس بالخصوصية الشخصية أو الحساسية التجارية أو الأمن القومي. قد يوفر هذا فوائد مهمة ، مثل استخدام التعلم الآلي لتحديد عوامل الخطر الشخصية للظروف الصحية ، وتمكين العمل الوقائي. يمكن بناء صناديق البيانات على رأس البيانات الصلبة إلى إجمالي. يمكن تجميع هذه البيانات المجمعة في مجموعات بيانات باستخدام بيانات التعريف الكرواسون لإعدادها للاستخدام البحثي.
التوافق مع خطة العمل
يتوافق تركيز خطة عمل فرص AI على البيانات عالية الجودة والحوكمة القوية مع التزام ODI منذ فترة طويلة بالحلول الاجتماعية التقنية التي تدمج البنية التحتية للبيانات المتقدمة مع الثقة العامة. لدعم تطوير الأنظمة القابلة للتشغيل المتبادل ، ومجموعات البيانات الجاهزة من الذكاء الاصطناعى ، وتقنيات تعزيز الخصوصية ، فإن ODI تدافع عن خريطة طريق للبنية التحتية للبيانات الوطنية لمدة عشر سنوات. ستدعم خريطة الطريق هذه تركيز خطة العمل على قيادة ابتكار الذكاء الاصطناعي من خلال الاستثمار في البنية التحتية للبيانات طويلة الأجل.
ومع ذلك ، فإن خطة العمل تترك عدة فجوات دون معالجة. لا يوضح بالتفصيل تمامًا كيف ستقوم مكتبة البيانات الوطنية بدمج مدخلات المستخدم أو إشراك أصحاب المصلحة المتنوعين لضمان توفرها بشكل عام. هناك تفاصيل محدودة حول المعايير الرسمية لجودة البيانات ومصدرها ، والتي تعتبر ضرورية لضمان مجموعات البيانات الجاهزة لمنظمة العفو الدولية. علاوة على ذلك ، في حين أن خطة العمل تبرز الحاجة إلى دعم مبتكري الذكاء الاصطناعي ، فإنها يمكن أن تعزز بشكل أكثر صراحة من الشركات الناشئة التي تركز على البيانات المتخصصة في إعداد البيانات وأدوات الحوكمة. نأمل أن تتم معالجة هذه الثغرات لأن الحكومة تطرح التوصيات.
القيادة الدولية من خلال التعاون
يسلط بحث ODI الضوء على الأهمية العالمية للنهج التي تركز على البيانات في حوكمة الذكاء الاصطناعي. ومع ذلك ، فإن القليل من الدول تعطي الأولوية لهذا التركيز ، مما يخاطر بتقويض الاعتماد الأوسع لممارسات البيانات المفتوحة والمشتركة. بدون حوكمة قوية تتمحور حول البيانات ، يمكن أن تضعف أسس أنظمة الذكاء الاصطناعى الشفافة والمساءلة.
أطلقت ODI مرصد بيانات سياسة الذكاء الاصطناعى العالمي لمعالجة هذا. توفر هذه المبادرة موارد عملية لدعم صانعي السياسات في تطوير حوكمة الذكاء الاصطناعي المتمحورة حول البيانات. من خلال تقديم رؤى حول البيانات الوصفية القابلة للقراءة الآلي ، وأدوات أدوات لاستخدام البيانات المسؤولة ، وأفضل الممارسات للشفافية ، يهدف المرصد إلى تعزيز قاعدة الأدلة العالمية ل AI المتمحورة حول البيانات.
إدراك إمكانات منظمة العفو الدولية في المملكة المتحدة
يعد الوصول إلى البيانات الحكومية عالية الجودة أمرًا ضروريًا لتحقيق إمكانات الذكاء الاصطناعي في تقديم الخدمات العامة. من خلال تحسين ممارسات نشر البيانات والاستثمار في البنية التحتية على المدى الطويل ، يمكن للمملكة المتحدة أن تضع نفسها كقائد عالمي في توفير البيانات لمنظمة العفو الدولية. ستقوم هذه القيادة بإلغاء تأمين الفوائد الاقتصادية والاجتماعية التحويلية ، حيث تتماشى مع طموحات خطة عمل فرص الذكاء الاصطناعى.
التقرير الكامل متاح للتنزيل على تقرير ODI: حكومة المملكة المتحدة كموفر بيانات لمنظمة العفو الدولية.
إيلينا سيمبيرل هي مديرة الأبحاث في ODI. نيل ماجاليا باحث في ODI.