يخطط قانون Barings لمقاضاة شركتي Microsoft وGoogle بشأن بيانات تدريب الذكاء الاصطناعي
بدأت شركة محاماة في مانشستر في استقطاب العملاء لرفع دعوى جماعية محتملة ضد شركتي مايكروسوفت وجوجل، والتي تعتقد أنها تجمع البيانات الشخصية للأشخاص وتستخدمها بشكل غير قانوني لتدريب نماذج الذكاء الاصطناعي (AI) الخاصة بهم.
بعد تحقيق دام عامين في ممارسات البيانات لعمالقة التكنولوجيا، يعتقد قانون بارينجز أن المعلومات الشاملة التي يتم جمعها عن المستخدمين – بما في ذلك البيانات الصوتية والبيانات الديموغرافية ومعلومات استخدام التطبيق والبيانات الوصفية وتفاصيل الدفع ومجموعة من التفاصيل الشخصية الأخرى – من المحتمل أن تتم مشاركتها لتدريب وتطوير مختلف الذكاء الاصطناعي نماذج لغوية كبيرة (ماجستير في القانون).
يدعي بارينجز أن هذا كله يحدث دون إذن أو موافقة مناسبة من المستخدمين، على الرغم من أنهم قد يفهمون أنه يتم جمع البيانات، إلا أنهم قد لا يكونون على دراية بالدور الذي تلعبه هذه البيانات في تدريب LLMs في مجال الذكاء الاصطناعي.
وقال عدنان مالك، رئيس الشركة: “تقوم كلا الشركتين بجمع بيانات مثل الفرق الرياضية التي تتابعها، ولغات البرمجة التي تفضلها، والأسهم التي تتتبعها، والطقس المحلي أو حركة المرور، والطريق الذي تسلكه إلى العمل وكيف يبدو صوتك”. من خرق البيانات في قانون بارينغز. “نشعر بالصدمة والاشمئزاز عندما علمنا بمستوى البيانات التي تم وما زال يتم جمعها.”
وأضاف مالك أنه في حين أن انتشار الذكاء الاصطناعي يغير العالم كما نعرفه، فإن تطوير التكنولوجيا يجب ألا يأتي على حساب حق الناس في الخصوصية.
وقال: “للأفراد الحق في معرفة البيانات الخاصة بهم التي يتم تخزينها وفي أي غرض يتم استخدامها”. “لهم أيضًا الحق في اختيار عدم استخدام سلوكياتهم وأصواتهم وهيئاتهم وعاداتهم ومعرفتهم لتدريب الذكاء الاصطناعي لصالح عمالقة التكنولوجيا.
“مع استمرار تطور التقنيات، أصبحت البيانات الفردية هي السلعة الأكثر قيمة في العالم. نحن نعلم أنه من غير القانوني سرقة السلع مثل المال والذهب والنفط. كمجتمع، لا يمكننا أن نقبل أنه من المقبول سرقة سلعة البيانات الشخصية.
الانضمام إلى الدعوى
يدعو Barings الآن أي شخص لديه حساب Microsoft أو Google، أو أولئك الذين استخدموا خدمات أي من الشركتين، للانضمام إلى الدعوى القضائية. يتضمن ذلك أولئك الذين استخدموا الأنظمة الأساسية والخدمات مثل YouTube وGmail وGoogle Docs وGoogle Maps وLinkedIn وOneDrive وOutlook وMicrosoft 365 وXbox.
وقالت الشركة إنها تتوقع أن تغمرها عمليات الاشتراك، وتخطط لبدء إجراءات المحكمة رسميًا في بداية عام 2025.
تواجه Microsoft وOpenAI، الشركة التي تقف وراء ChatGPT، مشكلة دعوى قضائية جماعية منفصلة في الولايات المتحدة من شركة كلاركسون للمحاماة، بسبب مزاعم بأنها انتهكت خصوصية مئات الملايين من مستخدمي الإنترنت من خلال جمع كميات هائلة من البيانات الشخصية سرًا لتدريب روبوتات الدردشة التي تعمل بالذكاء الاصطناعي. وقد تم رفع هذه الدعوى أمام محكمة اتحادية في سان فرانسيسكو في 28 يونيو/حزيران، وتسعى للحصول على تعويضات قدرها 3 مليارات دولار.
دعوى قضائية أخرى تم رفع دعوى قضائية أيضًا ضد Google، مرة أخرى من قبل شركة Clarkson Law Firm، التي تزعم أن عملاق التكنولوجيا قد وصل إلى بيانات الملايين من المستخدمين لاستخدامها في تطوير برنامج الدردشة الآلي الخاص به، Bard، والذي تم تغيير علامته التجارية منذ ذلك الحين إلى Gemini. وتزعم الدعوى القضائية أن جوجل سرقت خلسة “كل شيء تم إنشاؤه ومشاركته على الإنترنت من قبل مئات الملايين من الأمريكيين”.
وقال مالك إنه على الرغم من أن الحالات متشابهة، وتمثل مجتمعة شهادة على القلق الدولي المتزايد بشأن أمن البيانات، فإن بارينجز يتخذ إجراءات ضد مايكروسوفت وجوجل، بدلاً من OpenAI.
وقال: “إذا شعرت بالصدمة أو الانزعاج أو الفزع أو الانزعاج من استخدام بياناتك دون علمك وموافقتك، فإن رسالتي إليك بسيطة – افعل شيئًا حيال ذلك من خلال الانضمام إلى المعركة”. “سجل اليوم ودعنا نأخذ مستقبل بياناتنا والذكاء الاصطناعي بأيدينا.”
اتصلت مجلة Computer Weekly بكل من Microsoft وGoogle بخصوص الدعوى القضائية. وبينما رفضت مايكروسوفت التعليق، لم ترد جوجل حتى وقت النشر.
لقد قدم مطورو الذكاء الاصطناعي الآخرون بالفعل حججًا مختلفة للدفاع عن استخدامهم للبيانات الشخصية للأشخاص و مواد محمية بحقوق الطبع والنشر في تدريب نماذجهم، بما في ذلك أن المادة تندرج ضمن “الاستخدام العادل” (الذي يسمح بالاستخدام المحدود للمواد المحمية بحقوق الطبع والنشر دون إذن، لأغراض مثل النقد والتقارير الإخبارية والتدريس والبحث).
على سبيل المثال، في أ دعوى حقوق النشر التي رفعها ناشرو الموسيقى في يناير 2024 ضد مطور LLM Anthropic AIوقالت الشركة المدعومة من أمازون إن “استخدام الأعمال لتدريب كلود أمر عادل لأنه لا يمنع بيع الأعمال الأصلية، وحتى عندما تكون تجارية، فإنها تظل تحويلية بما فيه الكفاية”.
كما زعمت أنثروبيك أن “أدوات الذكاء الاصطناعي ذات الأغراض العامة اليوم لا يمكن أن توجد ببساطة” إذا اضطرت شركات الذكاء الاصطناعي إلى دفع تراخيص مقابل المواد، مضيفة أنها ليست الوحيدة التي تستخدم البيانات “التي تم تجميعها على نطاق واسع من الإنترنت المتاح للجمهور”؛ وأنه “من الناحية العملية، لا توجد طريقة أخرى لتجميع مجموعة تدريبية بالحجم والتنوع اللازمين لتدريب ماجستير في اللغة الإنجليزية معقد يتمتع بفهم واسع للغة البشرية والعالم بشكل عام”.