أخبار التقنية

Reddit يرفع دعوى قضائية ضد شركة Perplexity بسبب إلغاء المنشورات، وتوسيع معركة بيانات المستخدم مع صناعة الذكاء الاصطناعي


صور سوبا | صاروخ لايت | صور جيتي

عملاق وسائل التواصل الاجتماعي رديت رفعت دعوى قضائية ضد شركة الذكاء الاصطناعي Perplexity، زاعمة أنها ألغت بشكل غير قانوني منشورات المستخدمين لتدريب نموذج الذكاء الاصطناعي الخاص بها، مما يمثل أحدث صراع حول حقوق البيانات بين مالكي المحتوى وصناعة الذكاء الاصطناعي.

كما حددت الشكوى المقدمة في المحكمة الفيدرالية في نيويورك يوم الأربعاء ثلاثة متهمين، يقول موقع Reddit إنهم ساعدوا شركة Perplexity في جمع بياناتها: مكشطة البيانات الليتوانية Oxylabs، وشبكة الروبوتات الروسية السابقة AWMProxy، وشركة SerpApi الناشئة في تكساس.

وزعم موقع Reddit أن الكيانات الثلاثة الأصغر كانت قادرة على استخراج محتواها المحمي بحقوق الطبع والنشر “من خلال إخفاء هوياتهم وإخفاء مواقعهم وإخفاء كاشطات الويب الخاصة بهم كأشخاص عاديين”.

أنكرت شركة Perplexity، التي تدير محرك بحث يعمل بالذكاء الاصطناعي، هذه المزاعم واتهمت Reddit بـ “الابتزاز” ومعارضة الإنترنت المفتوح، بينما قالت SerpApi لـ CNBC إنها “لا توافق بشدة” على ادعاءات Reddit وتعتزم الدفاع عن نفسها في المحكمة.

تمثل القضية واحدة من العديد من القضايا المرفوعة من قبل مالكي المحتوى الذين يتهمون شركات الذكاء الاصطناعي باستخدام مواد محمية بحقوق الطبع والنشر دون إذن لتدريب نماذجهم اللغوية الكبيرة. وكان موقع Reddit، على وجه الخصوص، في الخطوط الأمامية لتلك المعركة، حيث أطلق معركة مماثلة الدعوى الجارية ضد شركة الذكاء الاصطناعي الناشئة Anthropic في يونيو. لم تتمكن CNBC من الوصول إلى Oxylabs وAWMProxy.

في بيان تمت مشاركته مع CNBC، قال بن لي، كبير المسؤولين القانونيين في Reddit، إن شركات الذكاء الاصطناعي “تخوض سباق تسلح للحصول على محتوى بشري عالي الجودة” وأن هذا الضغط أدى إلى تغذية “اقتصاد غسيل البيانات” على المستوى الصناعي”.

يقول ريتش جرينفيلد من شركة Lightshed Partners، إن موقع Reddit سيصبح قريبًا أكثر قيمة لمحركات البحث

تتجاوز أدوات الكشط وسائل الحماية التكنولوجية لسرقة البيانات، ثم بيعها للعملاء المتعطشين للمواد التدريبية. يعد Reddit هدفًا رئيسيًا لأنه أحد أكبر مجموعات المحادثات البشرية وأكثرها ديناميكية على الإطلاق.

قالت Reddit – التي تستضيف أكثر من 100.000 مجتمع “subreddit” قائم على الاهتمامات – في الدعوى القضائية التي رفعتها إن منشورات مستخدميها أصبحت المصدر الأكثر شيوعًا للإجابات التي ينشئها الذكاء الاصطناعي على Perplexity.

وأضافت أنها أرسلت إلى شركة Perplexity خطابًا بالتوقف والكف، وبعد ذلك قامت بزيادة حجم الاستشهادات إلى Reddit “أربعين ضعفًا”.

لاحظ باحثو الذكاء الاصطناعي سابقًا أن الحجم الكبير للمحادثات الخاضعة للإشراف على موقع Reddit يمكن أن يساعد في جعل روبوتات الدردشة المدعمة بالذكاء الاصطناعي تنتج استجابات أكثر طبيعية.

في عصر الذكاء الاصطناعي، عملت ريديت على الاستفادة من مجمع البيانات الضخم لديها، ولم تسمح بالوصول إليها إلا من خلال اتفاقيات الترخيص المتعلقة بالذكاء الاصطناعي. وقعت شركة التواصل الاجتماعي مثل هذه الاتفاقيات مع OpenAI و الأبجديةجوجل.

ردًا على الدعوى القضائية، جادلت شركة Perplexity، في منشور على منصة Reddit، بأنها لا تقوم بتدريب نماذج الذكاء الاصطناعي على المحتوى ولكنها تلخص فقط مناقشات Reddit العامة وتستشهد بها. ولذلك، قالت إنه “من المستحيل” التوقيع على اتفاقية الترخيص.

وجاء في البيان: “قبل عام، بعد توضيح ذلك، أصر موقع Reddit على أننا ندفع على أي حال، على الرغم من الوصول بشكل قانوني إلى بيانات Reddit. إن الخضوع لتكتيكات الذراع القوية ليس الطريقة التي نؤدي بها أعمالنا”، واستمر في وصف الدعوى بأنها “استعراض للقوة في مفاوضات Reddit بشأن بيانات التدريب مع Google وOpenAI”.

وأضافت بيربليكسيتي: “تعتقد بيربليكسيتي أن هذا مثال محزن لما يحدث عندما تصبح البيانات العامة جزءًا كبيرًا من نموذج أعمال الشركة العامة”، مشيرةً إلى أن ترخيص البيانات أصبح مصدرًا متزايد الأهمية لإيرادات ريديت.

في فبراير، قال جين وونغ، المدير التنفيذي للعمليات في Reddit لـ النشر التجاري Adweek أن صفقات ترخيص الذكاء الاصطناعي مع Google وOpenAI تشكل ما يقرب من 10% من إيرادات Reddit.



Source link

زر الذهاب إلى الأعلى