القضايا القانونية تشكك في الملكية الفكرية في التدريب على نماذج اللغات الكبيرة
أثار التحذير الأخير من OpenAI حول العواقب المحتملة لحملة حقوق الطبع والنشر الصارمة على تطوير الذكاء الاصطناعي (AI) نقاشًا قانونيًا معقدًا حول التوازن بين تقدم الذكاء الاصطناعي وحقوق الملكية الفكرية (IP).
جوهر القضية القانونية هو ما إذا كان ينبغي تعويض الشركات التي تجني المال من ترخيص محتوى الويب أو بيعه عندما نموذج لغة كبير (LLM) يستخدم هذا المحتوى للتدريب. أخبر منشئو المحتوى المحاكم أن نماذج أعمالهم يتم تقويضها، ويمكن استخدام المحتوى الذي أنشأه ماجستير إدارة الأعمال والذي تم تدريبه باستخدام الملكية الفكرية الخاصة بهم لإنشاء محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي والذي يصعب تمييزه عن المحتوى الذي ينتجه مالك الملكية الفكرية.
دعوى قضائية مرفوعة في 27 ديسمبر من قبل اوقات نيويورك تدعي أن Microsoft وOpenAI استخدمتا مقالات متاحة للجمهور على اوقات نيويورك’ موقع إلكتروني لإنشاء منتجات ذكاء اصطناعي تتنافس وتهدد قدرة الصحيفة على تقديم خدمة الأخبار على شبكة الإنترنت. “تعتمد أدوات الذكاء الاصطناعي التوليدية الخاصة بالمتهمين على نماذج لغوية كبيرة تم إنشاؤها عن طريق نسخ واستخدام الملايين من اللغات الأوقاتالمقالات الإخبارية المحمية بحقوق الطبع والنشر والتحقيقات المتعمقة ومقالات الرأي والمراجعات والأدلة الإرشادية والمزيد. اوقات نيويورك جاء في الايداع.
وقالت الصحيفة إنه على الرغم من أن مايكروسوفت وOpenAI انخرطتا في النسخ على نطاق واسع من العديد من المصادر، إلا أنهما قدمتا محتوى من اوقات نيويورك التركيز بشكل خاص عند بناء LLMs الخاصة بهم. “خلال دردشة مايكروسوفت بينج (التي أعيدت تسميتها مؤخرًا باسم “Copilot”) وChatGPT من OpenAI، يسعى المدعى عليهم إلى الاستفادة مجانًا من الأوقاتوجاء في ملف الصحيفة: “استثمارها الضخم في صحافتها من خلال استخدامها لبناء منتجات بديلة دون إذن أو دفع”.
وفي الوقت نفسه، في المملكة المتحدة، لقد فشل الذكاء الاصطناعي في الاستقرار في محاولة لإلغاء بعض الادعاءات بأنها انتهكت حقوق الملكية الفكرية لشركة Getty Images قبل إحالة القضية إلى المحاكمة في المملكة المتحدة.
قال بول جوزيف، شريك الملكية الفكرية في Linklaters، أثناء مناقشة الدعويين القضائيتين وكيفية تدريب حاملي شهادة الماجستير في القانون: “مما قرأته، يوجد بشكل عام على الأقل عنصر قراءة الأشياء، وعمل نسخ منها، ثم تشغيل برامج الزحف أو الذكاء الاصطناعي. أنظمة عليهم للتعلم. يعد عمل النسخ على طول الطريق جزءًا من عملية التدريب. ومع ذلك، فإن عمل نسخ من المحتوى، وفقًا لجوزيف، مقيد بقوانين حقوق الطبع والنشر.
بالنسبة لمزود LLM أو مستخدم مؤسسي لمادة LLM تجارية تم تدريبه بهذه الطريقة، قال: “ما لم تقع في أحد استثناءات حقوق الطبع والنشر القليلة، فسيكون ذلك بمثابة انتهاك، وليس من السهل الحصول على هذا النوع من الإعلانات التجارية تمرين تدريبي على أي استثناءات.
وفي حين أن الحجج القانونية قد تكون مختلفة في الولايات المتحدة مقارنة بأوروبا أو المملكة المتحدة، قال جوزيف: “من العدل أن نفترض أنه من بين جميع الأنشطة التجارية لمختلف الشركات التي تقدم شهادات الماجستير في القانون، فإن بعض هذه الأنشطة على الأقل ربما تنتهك حقوق الملكية الفكرية. “
وقال إن أي شخص يجني أمواله من كونه منشئ محتوى يجب أن يشعر بالقلق إزاء قدرة هذه المنتجات على محاكاة عنوان IP الخاص به. على سبيل المثال، جيتي تجني المال من الترخيص حقوق استخدام الصور في مكتبة الصور الواسعة الخاصة بها. غالبًا ما يتم دمج هذه الصور في كتيبات الشركة وعروض الشرائح. إذا كان بإمكان ماجستير صناعة الصور إنشاء محتوى مشابه للصور في شركة مكتبة صور، فإن هذا من شأنه أن يقوض نموذج الأعمال الخاص بتلك الشركة.
وقال جوزيف إن الدروس يمكن تعلمها من الأيام الأولى لبث الموسيقى، حيث تقدم أمثال نابستر تنزيلات مجانية. وقال: “حصل الناس على الموسيقى من خلال زيارة موقع نابستر وغيره من المواقع”. “لقد كان الأمر برمته عبارة عن الغرب المتوحش. ولم يكن أحد يعرف حقًا ما هو قانوني وما هو غير قانوني.
مع تقديم Spotify جاء نموذج مرخص. قال جوزيف: “كنت تعلم أن الموسيقى الموجودة على Spotify آمنة ولن تصاب بفيروس عند استخدامها”. “ولكن الأهم من ذلك هو أن Spotify جعل التفاعل مع العميل أفضل بكثير من مواقع القرصنة التي كان الناس على استعداد لدفع اشتراك كل شهر للوصول إلى هذه الخدمة الموسيقية الجديدة. قد يمر عالم الذكاء الاصطناعي بنفس الشيء.
أما بالنسبة للوضع الحالي، فقال إن مستخدمي مؤسسات LLM التجارية بحاجة إلى أن يكونوا على دراية بالسيناريو الأسوأ، وهو أن أي محتوى للذكاء الاصطناعي يستخدمونه قد ينتهك حقوق الطبع والنشر لشخص ما.
قال جوزيف: “في أفضل الأحوال، هناك حالة من عدم اليقين بشأن كيفية تدريب الأنظمة المختلفة”. “نحن الآن في المراحل الأولى من التقاضي ومحادثات التسوية ومحادثات الترخيص. وبعد ذلك سنخرج من الطرف الآخر بنظام أكثر تماسكا وتوازنا”.