استجوبت Microsoft وMeta حقوق الطبع والنشر الخاصة بالذكاء الاصطناعي
تم استجواب شركتي مايكروسوفت وميتا، الشركة الأم لفيسبوك وواتساب، من قبل أعضاء البرلمان خلال جلسة مجلس اللوردات اجتماع لجنة الاتصالات والرقمية حول حالة الذكاء الاصطناعي (AI) و نماذج اللغات الكبيرة (LLMs).
وبينما ناقشت مايكروسوفت وميتا التقدم الهائل الذي تم إحرازه، يبدو أن كلاً منهما لم تفكر كثيراً في العواقب المترتبة على عملهما في مجال حماية الملكية الفكرية. يحتاج حاملو شهادات LLM إلى الوصول إلى كميات كبيرة من البيانات المتاحة مجانًا على الإنترنت لتحسين الدقة وتقليل التحيز – ولكن إلغاء النص للاستخدام التجاري ينتهك قانون حقوق الطبع والنشر في المملكة المتحدة.
يبدو أن نائب الرئيس ونائب كبير مسؤولي الخصوصية للسياسة في Meta Rob Sherman ومدير السياسة العامة في مكتب الذكاء الاصطناعي المسؤول في Microsoft أوين لارتر يناقشان قضية تغيير قوانين المملكة المتحدة بما يتماشى مع بعض البلدان الأخرى، وبالتالي السماح للذكاء الاصطناعي الخاص بهم البرمجيات وLLMs لاستخدام البيانات بحرية.
بدأت الجلسة مع ممثلي Microsoft وMeta مع أعضاء البرلمان الذين استفسروا عن الوضع الحالي لـ LLMs والفرص والمخاطر.
عندما سئل عن الضجيج مقابل الواقع للذكاء الاصطناعي التوليدي (GenAI) وLLMs، وصف ميتا شيرمان الصناعة بأنها وصلت إلى “نقطة انعطاف مهمة حقًا في تطوير الذكاء الاصطناعي”، حيث تكون النماذج قادرة على العمل بكفاءة أكبر.
وأضاف: “أحد مجالات الاستثمار الكبيرة بالنسبة لنا هو القدرة على اكتشاف التحيز في نماذج التعلم الآلي حيثما وجدت وتصحيح هذا التحيز حتى نتمكن في الواقع من جعل العالم أكثر عدالة وشمولاً حيثما نستطيع”. .
وقال لارتر من شركة مايكروسوفت إنه متحمس حقًا لفرصة الذكاء الاصطناعي، خاصة فيما يتعلق بالإنتاجية. استخدم لارتر السؤال للعرض مايكروسوفت مساعد الطيار AI, ولا سيما GenAI في GitHib Copilot، والذي قال إنه يعزز بشكل كبير إنتاجية مطوري البرامج من خلال “الإكمال التلقائي” لمقتطفات من التعليمات البرمجية.
وكان النواب حريصين على سماع رأي الخبيرين حول نماذج البيانات المفتوحة والمغلقة وكيفية الموازنة بين المخاطر والابتكار. وقال شيرمان: “لقد ركزت شركتنا بشكل كبير على [this]. لقد كنا داعمين جدًا للمصادر المفتوحة جنبًا إلى جنب مع الكثير من الشركات الأخرى والباحثين والأكاديميين والمنظمات غير الربحية باعتبارها عنصرًا حيويًا ومهمًا في النظام البيئي للذكاء الاصطناعي.
وإلى جانب العمل الذي يمكن للمجتمع الأوسع تقديمه في ضبط نماذج البيانات وتحديد المخاطر الأمنية، أشار شيرمان إلى أن النماذج المفتوحة تقلل من حاجز الدخول. وهذا يعني أن تطوير LLMs لا يقتصر على الشركات الكبرى – فالشركات الصغيرة والمتوسطة الحجم قادرة أيضًا على الابتكار.
وعلى الرغم من التزام مايكروسوفت بالمصادر المفتوحة، بدا لارتر أكثر حذرًا. وقال للنواب إنه يجب أن يكون هناك حوار حول بعض المفاضلات بين الانفتاح والسلامة والأمن، خاصة حول ما وصفه بـ “النماذج الحدودية ذات القدرة العالية”.
وقال: “أعتقد أننا بحاجة إلى اتباع نهج قائم على المخاطر هناك”. قد توفر الأجيال القادمة من نماذج الذكاء الاصطناعي قدرات كبيرة تقدم فوائد مجتمعية، ولكنها قد تشكل مخاطر جسيمة. “نحن بحاجة إلى التفكير بعناية شديدة حول ما إذا كان من المنطقي فتح هذه النماذج أم لا.”
اعتبارات حقوق النشر
سأل اللورد دونالد فوستر Microsoft وMeta عن الآثار المترتبة على قوانين حقوق الطبع والنشر في المملكة المتحدة فيما يتعلق بالبيانات المستخدمة لتدريب حاملي شهادة الماجستير في القانون، قائلًا: “في المملكة المتحدة، يتطلب التنقيب عن النصوص والبيانات بشكل أساسي شراء ترخيص حقوق الطبع والنشر مع عدد من الاستثناءات، ليس أقلها النشاط التجاري. ولكن إذا كان الغرض من استيعاب النصوص والبيانات لتدريب شركة ذات مسؤولية محدودة هو إنشاء منتج تجاري، فمن الواضح جدًا أن ترخيص حقوق الطبع والنشر سيكون مطلوبًا. التركيز على النية.”
جادل شيرمان بذلك قوانين حقوق النشر تم تأسيسها قبل وقت طويل من LLMs وستقرر المحاكم في النهاية ما هو الاستخدام العادل وما هو غير ذلك. وقال: “أعتقد أن الحفاظ على الوصول على نطاق واسع إلى المعلومات على الإنترنت واستخدام الابتكار مثل هذا أمر مهم للغاية. أنا أؤيد منح أصحاب الحقوق القدرة على إدارة كيفية استخدام معلوماتهم. وادعى أن آليات مثل ملف robot.txt الموجود على مواقع الويب تسمح لأصحاب مواقع الويب بالسماح للآخرين بمعرفة ما إذا كان من الممكن حذف النصوص والبيانات من مواقعهم على الويب.
قال لارتر: “لقد أوضحت سلطات قضائية مثل الاتحاد الأوروبي واليابان مؤخرًا أن هناك استثناءً في قوانينها للتنقيب عن النصوص والبيانات في سياق تدريب نموذج الذكاء الاصطناعي. هناك قائمة أطول من الدول التي لديها هذا النوع من النظام”.
ومع ذلك، لا يوجد إجماع حول ما إذا كان ينبغي إعفاء الذكاء الاصطناعي من قانون حقوق النشر. مؤلفو الحديث مراجعة أعمال هارفارد كتب المقال: “يجب على مطوري الذكاء الاصطناعي التأكد من امتثالهم للقانون فيما يتعلق بحصولهم على البيانات المستخدمة لتدريب نماذجهم. وينبغي أن يشمل ذلك ترخيص وتعويض الأفراد الذين يمتلكون الملكية الفكرية التي يسعى المطورون إلى إضافتها إلى بيانات التدريب الخاصة بهم، سواء عن طريق ترخيصها أو المشاركة في الإيرادات الناتجة عن أداة الذكاء الاصطناعي.