تقنيات كسر الحماية من الذكاء الاصطناعى تثبت فعالة للغاية ضد ديبسيك

جالب الأخبار31 يناير,2025

27 4 دقائق

يتم طرح أسئلة جديدة على سلامة وأمن ديبسيك، منصة انهيار الذكاء الاصطناعي الصيني (AI) ، بعد الباحثين في شبكات بالو ألتو كشفت أن المنصة معرضة للغاية لما يسمى بتقنيات كسر الحماية المستخدمة من قبل الجهات الفاعلة الضارة لخداع القواعد التي من المفترض أن تمنع نماذج اللغة الكبيرة (LLMs) من استخدامها لأغراض شائنة ، مثل كتابة رمز البرامج الضارة.

أدت الزيادة المفاجئة في الاهتمام في Deepseek في نهاية شهر يناير إلى مقارنات مع اللحظة في أكتوبر 1957 عندما أطلق الاتحاد السوفيتي أول قمر صناعي مصطنع ، سبوتنيك، أخذت الولايات المتحدة وحلفائها على حين غرة وترسب سباق الفضاء في الستينيات من القرن الماضي بلغت في Apollo 11 Moon Landing. كما تسبب في الفوضى في صناعة التكنولوجيا ، مما يمنح مليارات الدولارات من قيمة الشركات مثل NVIDIA.

الآن ، أثبتت الفرق الفنية لـ Palo Alto أن ثلاث تقنيات تم وصفها مؤخرًا فعالة ضد نماذج Deepseek. وقال الفريق إنه حقق معدلات تجاوز كبيرة مع القليل من المعرفة أو الخبرة المتخصصة المطلوبة.

وجدت تجاربهم أن أساليب كسر الحماية الثلاثة التي تم اختبارها أسفرت عن إرشادات صريحة من Deepseek على مجموعة من الموضوعات التي تهم الأخوة الإجرامية الإلكترونية ، بما في ذلك ترشيح البيانات وخلق Keylogger. تمكنوا أيضًا من إنشاء تعليمات حول إنشاء أجهزة متفجرة مرتجلة (IEDS).

“في حين أن المعلومات المتعلقة بإنشاء كوكتيلات Molotov و Keyloggers متاحة بسهولة عبر الإنترنت ، فإن LLMs مع قيود السلامة غير الكافية يمكن أن تقلل من حاجز الدخول للجهات الفاعلة الضارة عن طريق تجميع وتقديم مخرجات قابلة للاستخدام بسهولة وقابلة للتنفيذ. وقال الفريق: “يمكن أن تسرع هذه المساعدة إلى حد كبير عملياتهم”.