تزعم شركة OpenAI أن صحيفة نيويورك تايمز “قامت باختراق” ChatGPT للحصول على أدلة قضائية
طلبت OpenAI من القاضي رفض أجزاء من اوقات نيويورك“دعوى قضائية ضدها، تزعم أن شركة الإعلام “دفعت لشخص ما لاختراق منتجات OpenAI،” مثل ChatGPT، لإنشاء 100 مثال على انتهاك حقوق الطبع والنشر لقضيتها.
في ملف يوم الاثنين في محكمة مانهاتن الفيدرالية، OpenAI المزعوم لقد استغرق الأمر “عشرات الآلاف من المحاولات من صحيفة التايمز لتوليد نتائج شاذة للغاية”، وأن الشركة فعلت ذلك باستخدام “مطالبات خادعة تنتهك بشكل صارخ شروط استخدام OpenAI”.
وكتب OpenAI في الملف: “لا يستخدم الأشخاص العاديون منتجات OpenAI بهذه الطريقة”.
يمكن أيضًا تسمية “القرصنة” التي تزعمها OpenAI في الملف بالهندسة السريعة أو “الفريق الأحمر”، وهي طريقة شائعة لفرق الثقة والسلامة في الذكاء الاصطناعي وعلماء الأخلاق والأكاديميين وشركات التكنولوجيا “لاختبار الضغط” على أنظمة الذكاء الاصطناعي بحثًا عن نقاط الضعف. انه تدريب مشترك في صناعة الذكاء الاصطناعي وطريقة شائعة لتنبيه الشركات إلى المشكلات الموجودة في أنظمتها، على غرار الطريقة التي يقوم بها متخصصو الأمن السيبراني باختبار مواقع الويب الخاصة بالشركات بحثًا عن نقاط الضعف.
ولم تستجب صحيفة نيويورك تايمز على الفور لطلب التعليق.
ويأتي التقديم مع احتدام معركة أوسع بين OpenAI والناشرين والمؤلفين والفنانين حول استخدام المواد المحمية بحقوق الطبع والنشر لبيانات التدريب على الذكاء الاصطناعي، بما في ذلك الدعوى القضائية رفيعة المستوى التي رفعتها صحيفة Times، والتي يرى البعض أنها لحظة فاصلة بالنسبة لهذه الصناعة. تسعى الدعوى القضائية التي رفعتها وسائل الإعلام الإخبارية، والتي تم رفعها في ديسمبر، إلى تأجيلها مايكروسوفت و OpenAI مسؤولة عن أضرار بمليارات الدولارات.
في الماضي، قالت OpenAI إنه “من المستحيل” تدريب أفضل نماذج الذكاء الاصطناعي دون أعمال محمية بحقوق الطبع والنشر.
“نظرًا لأن حقوق الطبع والنشر اليوم تغطي تقريبًا كل أنواع التعبير البشري – بما في ذلك منشورات المدونات والصور الفوتوغرافية ومشاركات المنتديات وقصاصات من أكواد البرامج والوثائق الحكومية – فسيكون من المستحيل تدريب نماذج الذكاء الاصطناعي الرائدة اليوم دون استخدام مواد محمية بحقوق الطبع والنشر،” كتب OpenAI في مذكرة تم تقديمه الشهر الماضي في المملكة المتحدة، ردًا على استفسار من مجلس اللوردات في المملكة المتحدة.
“إن قصر بيانات التدريب على الكتب والرسومات العامة التي تم إنشاؤها منذ أكثر من قرن من الزمان قد يؤدي إلى تجربة مثيرة للاهتمام، لكنه لن يوفر أنظمة ذكاء اصطناعي تلبي احتياجات مواطني اليوم،” واصلت OpenAI في التسجيل.
وفي الشهر الماضي، في دافوس، قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، إنه “فوجئ” بالدعوى القضائية التي رفعتها صحيفة نيويورك تايمز، قائلاً إن نماذج OpenAI لا تحتاج إلى التدريب على بيانات الناشر.
“نحن في الواقع لا نحتاج إلى التدريب على بياناتهم،” ألتمان قال في حدث نظمته بلومبرج في دافوس. “أعتقد أن هذا شيء لا يفهمه الناس. أي مصدر تدريب معين، لا يحرك الإبرة بالنسبة لنا كثيرًا.”
على الرغم من أن ناشرًا واحدًا قد لا يحدث فرقًا في قدرات تشغيل ChatGPT، إلا أن ملف OpenAI يشير إلى أن قرار العديد من الناشرين بإلغاء الاشتراك قد يكون له تأثير. وفي الأشهر الأخيرة، بدأت الشركة في مغازلة الناشرين للسماح باستخدام المحتوى في بيانات التدريب.
وقد أبرمت الشركة بالفعل صفقات مع شركة Axel Springer، وهي مجموعة وسائل الإعلام الألمانية التي تمتلك Business Insider وMorning Brew ومنافذ بيع أخرى، كما أنها أيضًا يقال في محادثات مع CNN وFox Corp وTime لترخيص عملهم.
وكتب OpenAI في الملف: “نتوقع أن تسفر مفاوضاتنا المستمرة مع الآخرين عن شراكات إضافية قريبًا”.
في الملف ومنشورات المدونة الخاصة به، سلطت OpenAI الضوء على عملية إلغاء الاشتراك للناشرين، والتي تسمح للمنافذ بمنع زاحف الويب الخاص بالشركة من الوصول إلى مواقع الويب الخاصة بهم. ولكن في ملف التقديم، تقول OpenAI إن المحتوى حيوي لتدريب نماذج الذكاء الاصطناعي الحالية.
“بينما نتطلع إلى مواصلة تطوير آليات إضافية لتمكين أصحاب الحقوق من إلغاء الاشتراك في التدريب، فإننا نشارك معهم بنشاط لإيجاد ترتيبات مفيدة للطرفين للوصول إلى المواد التي لا يمكن الوصول إليها بطريقة أخرى، وكذلك لعرض المحتوى بطرق كتبت الشركة: “تجاوز ما يسمح به قانون حقوق الطبع والنشر”.
—ساهم رايان براون من سي إن بي سي في هذا التقرير.