اختفاء السجل العام يجعل بيانات المؤسسة أحد الأصول

كانت البيانات العامة في العديد من البلدان، بما في ذلك الولايات المتحدة، تبدو ذات يوم وكأنها مصدر موثوق للمعلومات، ولكن الآن بعد أن أصبحت البيانات هشة وخاضعة للتدخل السياسي والإهمال المنهجي. بالنسبة لمدراء تكنولوجيا المعلومات، يمكن أن تكون الآثار عميقة: بدون مجموعات بيانات خارجية مستقرة، يجب أن تتطور أصول المعلومات الداخلية من مجرد سجلات تشغيلية إلى عوامل تمييز استراتيجية، وفرص إيرادات جديدة، وشريان حياة تنظيمي.
وقال: “إن البيانات العامة التي تتسم بالمصداقية والقابلة للاستخدام تنفد بسرعة. وستبدأ المزيد والمزيد من الشركات في تخصيص قيمة لبياناتها والذهاب إلى ما هو أبعد من الشراكات لتحقيق الدخل منها. على سبيل المثال، يمكن أن تكون قياسات الرياح التي تلتقطها شركة توربينات الرياح مفيدة للعديد من الشركات غير المنافسة”. أولغا كوبريانوفا، المستشار الرئيسي للذكاء الاصطناعي وهندسة البيانات في ISG.
في حين أن التلاعب بالبيانات يعد قصة خالدة في السياسة، فقد قامت حكومة الولايات المتحدة هذا العام بتسريع الجهود الرامية إلى التلاعب بالبيانات التي يمكن للعامة الوصول إليها. وحتى البيانات التي تبدو غير سياسية وغير ضارة، مثل سجلات المناخ والطقس، والمؤشرات الاقتصادية والبحث العلمي، تم حذفها أو ميلها نحو تحيز أو آخر. وهذه مشكلة أكبر بكثير مما قد يدركه البعض.
قال فرشيد ثابت، الرئيس التنفيذي لشركة “إننا ندخل لحظة حاسمة في الذكاء الاصطناعي، حيث أصبح الوصول إلى البيانات الموثوقة والقابلة للتطوير والأخلاقية هو عنق الزجاجة المركزي، وأيضًا الأصول الأكثر قيمة. ومع تضييق الضغوط القانونية والتنظيمية على الوصول إلى البيانات العامة، بسبب الدعاوى القضائية لحقوق الطبع والنشر، أو المخاوف المتعلقة بالخصوصية، أو التلاعب بمستودعات البيانات المفتوحة، تضطر الشركات إلى إعادة التفكير في مصدر ميزة الذكاء الاصطناعي الخاصة بها”. مؤسس مشارك في Corvic AI، مطور منصة إدارة GenAI.
اختفاء البيانات العامة
على سبيل المثال، في أوائل عام 2025، قامت الحكومة الأمريكية بإزالة الآلاف من مجموعات البيانات وصفحات الويب، وفقًا لصحيفة نيويورك تايمز، عبر وكالات مثل وكالة حماية البيئة، وإدارة المحيطات والغلاف الجوي (NOAA)، ومركز السيطرة على الأمراض (CDC)، مما يؤدي بشكل فعال إلى حذف المصادر الرئيسية لبيانات المناخ والصحة والعدالة البيئية من السجل العام. لقد كانت خطوة خطيرة ومروعة ولا تزال تشكل مخاطر كبيرة على القطاع الخاص والأفراد على حد سواء. تعتمد المنظمات على البيانات العامة لتعمل، ويحتاج الجمهور إلى معرفة المخاطر التي يتعرضون لها في الكوارث المناخية، وانتشار الأمراض المعدية، والعوامل الاقتصادية مثل معدلات البطالة والتضخم.
وقال نيك هارت، الرئيس والمدير التنفيذي لشركة “من خلال تقاريرنا الشهرية عن نبض قدرة الأدلة، قمنا بتوثيق تأثيرات تشغيلية محددة لها آثار واقعية على مستخدمي البيانات”. مؤسسة البيانات، وهي منظمة غير ربحية مقرها في واشنطن العاصمة تدعم استخدام البيانات المفتوحة والسياسة العامة المبنية على الأدلة. “على سبيل المثال، خفضت هيئة الأرصاد الجوية الوطنية قوتها العاملة بأكثر من 500 موظف، مع وجود معدلات شغور في 52 من أصل 122 مكتبًا للتنبؤات الجوية تزيد عن 20٪، مما أدى إلى تغييرات تشغيلية في التنبؤ بالطقس تؤثر على كل شيء بدءًا من الزراعة وحتى تخطيط النقل”.
ومن بين الضحايا كان “مؤشر المخاطر المستقبلية” التابع للوكالة الفيدرالية لإدارة الطوارئ (FEMA)، وهو أداة متطورة ترسم خريطة لتعرض المجتمع للفيضانات، والحرائق، والحرارة الشديدة، والأعاصير. ولم يؤدي حذفها إلى تقويض التخطيط للكوارث فحسب، بل أدى أيضا إلى محو المورد الذي اعتمدت عليه شركات التأمين ومخططو المدن والشركات لفهم مخاطر المناخ. واعتبرت الأداة ذات أهمية كبيرة للسلامة العامة أعادت صحيفة الغارديان إنشائها.
إن العواقب الاقتصادية المترتبة على فقدان البيانات أصبحت واضحة بالفعل. ويقدر المحللون أن البيانات العامة الأمريكية عززت ما يقرب من 750 مليار دولار من النشاط التجاري حتى عام 2022، وفقًا لوزارة التجارة. إن فقدان مثل هذه البيانات يعمي الشركات التي تبني نماذج لكل شيء بدءًا من التنبؤ بسلسلة التوريد إلى استراتيجية الاستثمار والتنبؤات. إن إزالة هذه الموارد أو زعزعة استقرارها لا يؤدي إلى الإضرار بالثقة في الحكومة فحسب، بل يؤدي أيضًا إلى تشويش التوقعات الاقتصادية، مما يترك الشركات والأسواق عرضة للخطر. بحسب رويترز.
ولا يمكن احتواء هذه الاضطرابات داخل الولايات المتحدة وحدها. وبحسب رويترز، وقد أدرك المسؤولون في أوروبا مدى هشاشة الاعتماد على مجموعات البيانات العلمية الأمريكية. تعمل البلدان في جميع أنحاء الاتحاد الأوروبي على تسريع الجهود لبناء أنظمة بديلة لجمع وتخزين المعلومات البيئية والمناخية الهامة. كما أطلق الناشطون والباحثون وموظفو الخدمة المدنية أيضًا مشاريع “أرشفة حرب العصابات” لعكس البيانات والحفاظ عليها قبل اختفائها.
لا شك أن الثقة العالمية في البنية التحتية المشتركة للمعلومات منقسمة. لكن الثقة في العلماء الأميركيين لا تزال راسخة. “في شهر مارس، حثت أكثر من اثنتي عشرة دولة أوروبية مفوضية الاتحاد الأوروبي على التحرك بسرعة لتوظيف العلماء الأمريكيين الذين فقدوا وظائفهم بسبب تلك التخفيضات”. بحسب رويترز. كما أن هجرة الأدمغة الناتجة عن ذلك تؤدي إلى تقليص القدرة على الوصول إلى المعلومات في الولايات المتحدة
حفظ البيانات العامة والبحث عنها في أماكن غير متوقعة
وفي الوقت نفسه، سارع باحثون من القطاع الخاص وبعض المنظمات غير الربحية إلى العمل لمراقبة البيانات العامة والحفاظ عليها. هناك مثالان هما جهود إنقاذ البيانات المذكورة أعلاه من خلال أرشفة حرب العصابات في الاتحاد الأوروبي ومؤشر المخاطر المستقبلية، الذي أعادت صحيفة الغارديان صياغته بعد أن تم تكليف الوكالة الفيدرالية لإدارة الطوارئ بتدميره.
تم العثور على مثال آخر في مجموعة من الباحثين والطلاب في كلية هارفارد تي إتش تشان للصحة العامة الذين قاموا على الفور بدأ ماراثون الحفاظ على البيانات في سباق غير مقدس لاستخراج البيانات العامة وتنزيلها من مواقع الويب بشكل أسرع من قدرة الوكالات الحكومية على إزالتها. تم بعد ذلك توزيع البيانات العامة التي تمكنوا من حفظها مرة أخرى على الجمهور من خلال مستودعات مثل جامعة هارفارد داتافيرس. ولسوء الحظ، حدثت التغييرات في المواقع الحكومية بشكل أسرع مما يمكن للباحثين أن يتفاعلوا معه. لم يتم الحفاظ على كافة البيانات.
ولحسن الحظ، لم نفقد كل شيء. على سبيل المثال، تستمر البيانات الفيدرالية المفتوحة في التوسع. “يتضمن موقع Data.gov أكثر من 317000 مجموعة بيانات اعتبارًا من تقريرنا الصادر في 31 يوليو، ارتفاعًا من حوالي 308000 أصول بيانات في يناير. وهذا يوضح أنه على الرغم من وجود مخاوف بشأن القدرات في بعض المناطق، فإن الوصول إلى البيانات مستمر في النمو في مناطق أخرى. ولاحظنا أيضًا أنه في المركز الوطني لإحصاءات التعليم التابع لوزارة التعليم – وهي وكالة إحصائية اتحادية – تم التراجع عن قرار إزالة الوصول عن بعد للاستخدام المقيد لبيانات التعليم، مما يسمح للباحثين بالوصول إلى البيانات حتى نهاية عام 2025”. هارت.
وقال هارت أيضًا إن خدمة البيانات الآمنة الوطنية في NSF واصلت إصدار العقود لبناء قدرة فعالة لمشاركة البيانات متعددة الأطراف عبر الوكالات، مما يؤدي بسرعة إلى توسيع نطاق ربط البيانات الآمن والمسؤول لأغراض البحث. تعتمد NSDS على البنية التحتية الحالية للبيانات من الوكالات الفيدرالية والولايات والشركاء الآخرين.
وأضاف هارت: “نشرت وزارة النقل مؤخرًا خطة البيانات المفتوحة التي يتطلبها قانون البيانات الحكومية المفتوحة الذي وقعه الرئيس ترامب في عام 2019 وباتباع التوجيهات الصادرة عن الرئيس السابق بايدن. وقد نشرت وكالات أخرى تتراوح من هيئة الأوراق المالية والبورصات إلى وكالة ناسا بالفعل خططًا أيضًا، ومن المتوقع المزيد في الأسابيع المقبلة”.
ال موارد الصحفي تقدم كلية كينيدي بجامعة هارفارد نصائح قوية للصحفيين وغيرهم ممن يبحثون عن بيانات عامة نظيفة أو بديل لها. فيما يلي نصائح لمدراء تكنولوجيا المعلومات وقادة الشركات الآخرين الذين يبحثون عن البيانات التي تلاعبت بها الحكومة أو حذفتها:
-
للعثور على مواقع الويب المفقودة، انتقل إلى آلة وايباك واكتب عنوان URL لموقع الويب في شريط البحث.
-
تحقق مع مركز تنسيق الأبحاث CAFE، والتي تعمل مع عشرات الباحثين في جميع أنحاء البلاد للحفاظ على البيانات الصحية والمناخية. تشمل البرامج الرئيسية CAFE Dataverse وCAFE GitHub.
جهود إنقاذ البيانات مقترح من مكتبة Muhlenberg College Trexler تقديم النصائح التالية حرفيا:
-
جهود إنقاذ البيانات: قائمة متطورة من الجهود الجماعية للحفاظ على إمكانية الوصول إلى البيانات والحفاظ عليها. الموقع الإلكتروني لمشروع إنقاذ البيانات، والتي تطورت من مبادرة إنقاذ البيانات هذه متوفر الآن هنا، وتعقب إنقاذ البياناتيكون متاح هنا.
-
نهاية المدة الزحف: مخبأ لأرشيف الإنترنت لمواقع الويب الحكومية، تم الزحف إليها وجمعها في الأشهر ما بين الانتخابات الرئاسية وتنصيب الرئيس.
-
GovWayback: طريقة بسيطة للوصول إلى الإصدارات التاريخية من مواقع الحكومة الأمريكية قبل 20 يناير 2025. من المحتمل ألا يتم تضمين بعض الموارد، مثل مواقع الويب التفاعلية ونماذج الويب والمحتويات الكامنة وراء مصادقة كلمة المرور، في ذاكرة التخزين المؤقت لـ GovWayback.
-
مختبر الابتكار في مكتبة هارفارد: جهد من مكتبة كلية الحقوق بجامعة هارفارد لتوفير الوصول إلى مجموعات البيانات الرئيسية من data.gov وPubMed ومستودعات GitHub الفيدرالية
-
DataLumos، هو أرشيف اتحاد الجامعات للبحوث السياسية والاجتماعية (ICPSR) لموارد البيانات الحكومية القيمة. يحتفظ هذا الاتحاد الدولي الذي يضم أكثر من 760 مؤسسة أكاديمية ومنظمة بحثية بأرشيف بيانات يضم أكثر من 500000 ملف بحثي في العلوم الاجتماعية، بما في ذلك 16 مجموعة متخصصة من البيانات في التعليم، والشيخوخة، والعدالة الجنائية، وتعاطي المخدرات، والإرهاب، وغيرها من المجالات.
-
استعادة مركز السيطرة على الأمراضهو “مشروع مستقل، غير تابع لمركز السيطرة على الأمراض أو أي كيان فيدرالي. تفضل بزيارة مركز السيطرة على الأمراض.gov للحصول على معلومات رسمية مجانية. نظرًا للأرشفة في 6 يناير 2025، فإن بيانات التفشي الأخيرة غير متاحة. لا تتم استعادة مقاطع الفيديو. وصول data.restoredcdc.org لاستعادة البيانات.”
فرص جديدة لتحقيق الدخل من البيانات
وحتى مع الجهود البطولية العديدة لإنقاذ البيانات العامة أو الاحتفاظ بها أو استعادتها أو إعادة إنشائها، لا يعتقد الجميع أن هذا سيكون كافيا.
وقالت كوبريانوفا: “تمثل البيانات العامة تحديًا بطرق عديدة لأن الجودة غالبًا ما تكون موضع شك، وبالتالي فإن القيمة التي تدفعها هي أيضًا موضع شك. وحتى لو لم تكن جودة البيانات مشكلة، فغالبًا ما يتطلع علماء البيانات إلى البيانات العامة للحصول على معلومات يمكن أن تكمل نماذجهم الخاصة، ولكن في كثير من الحالات، تكون البيانات عديمة الفائدة بشكل أساسي لهذا الغرض. وللمساعدة في استكمال النماذج وسد الثغرات، من المرجح أن تلجأ الشركات إلى الشراكات للحصول على بيانات خارجية موثوقة”.
تنفتح الأبواب على فرص جديدة لمديري تكنولوجيا المعلومات للاستفادة بشكل أفضل من بياناتهم للاستخدام الداخلي والمبيعات الخارجية.
قال نيك آدامز، المؤسس المشارك والرئيس التنفيذي لشركة Orcus، مزود حلول الأمن السيبراني: “أتوقع تطبيع أطر الترخيص الدقيقة التي تتضمن علامات مائية مشفرة وقياس الاستخدام عن بعد في كل جزء من مجموعة البيانات. ستصبح سلاسل المصدر المسجلة عبر دفاتر الأستاذ الموزعة دليلاً قياسيًا للتدقيق النهائي، مما يتيح هياكل حقوق ملكية قابلة للتنفيذ وحل النزاعات بشكل أسرع”.
قد يكون هذا هو الاتجاه الذي تتجه إليه الأمور، ولكن هناك طرق للاستفادة الآن أيضًا.
“بيانات الترخيص الداخلية. على سبيل المثال، يمكن لقياس إنترنت الأشياء عن بعد أو سجلات التشغيل أو الشركات التي تدعم تحليلات المستخدم تجميع مثل هذه التدفقات كخدمة اشتراك أو واجهات برمجة التطبيقات. يمكنك أيضًا إنشاء منصات بيانات رأسية أو تعاونيات. يمكن للمؤسسات الصغيرة مشاركة الإيرادات من الترخيص الخارجي، إلى جانب التكاليف، من خلال تجميع الموارد. ويمكنك تقديم بيانات تركيبية. ومن الممكن للبيانات الاصطناعية الآمنة للخصوصية أن تلبي الطلب الخارجي دون الكشف عن البيانات الحساسة. ” قال ساندرو شوبلادزي، الرئيس التنفيذي والمؤسس في خدمة استخراج البيانات داتمام.
تعمل العقول المبدعة جاهدة على التفكير في طرق للاستفادة من هذا النقص في البيانات. ولكن ليس هناك وقت نضيعه إذا كانت زيادة تسييل البيانات هي لعبتك.
“لقد بدأت الأموال الذكية في التدفق بالفعل. وقال فيرغال جلين، المدافع عن أمن الذكاء الاصطناعي وكبير مسؤولي التسويق في شركة ميندجارد، شركة آلية تعمل بفريق أحمر للذكاء الاصطناعي واختبار الأمان.
وأضاف جلين: “الشركات التي تمتلك بيانات علمية، وسجلات مناخية، وقواعد بيانات اقتصادية، ومعلومات حكومية تجلس على مناجم ذهب. وحتى مجموعات البيانات المتخصصة، مثل لقطات الكاميرا أو قياسات المناخ الإقليمية، يمكن أن تدر إيرادات من خلال نماذج البيانات كخدمة”.




