أخبار التقنية

بعد عام واحد من انقطاع CrowdStrike: ماذا تعلمنا؟


لقد مر عام على انقطاع النطاق على نطاق واسع تم إرسال تموجات عبر البنية التحتية لتكنولوجيا المعلومات والعمليات التجارية العالمية.

أبرز الحادث ، الذي تسبب في تحديث معيب لمنتج Falcon 9 من Crowdstrike ، نقاط الضعف الحرجة في النظم الإيكولوجية الرقمية المترابطة والأسئلة التي أثيرت حول المرونة والمسؤولية وإدارة المخاطر في عالم يعتمد على السحابة بشكل متزايد.

أثر الانقطاع على ما يقدر بنحو 8.5 مليون جهاز Windows على مستوى العالم، يمثل حوالي 1 ٪ من الحوزة Windows في جميع أنحاء العالم. من المتوقع أن يتراوح التأثير المالي بين 10 مليارات دولار و 12.5 مليار دولار ، مع أتعطلت الخطوط والبنوك وتجار التجزئة والخدمات الحكومية بشكل كبير.

شهدت دلتا إيرلاينز وحدها تأثيرًا لمدة خمسة أيام ، مما أدى إلى إلغاء 7000 رحلة و 1.3 مليون مسافر تأثروا ، الذين تكبدوا تكلفة تقدر بـ 550 مليون دولار.

إن الانتشار الفوري للمشكلة عبر Microsoft Azure Public Cloud ومنصة الإنتاجية عبر الإنترنت M365 (والبيئات السحابية الأخرى والأنظمة المستضافة ذاتيًا) تؤكد على الترابط العميق لتكنولوجيا المعلومات الحديثة.

سهّلت Microsoft ، على الرغم من عدم كونها سبب الخطأ الأولي ، انتشارها العالمي السريع بسبب بنية النظام الأساسي المتمحورة حول الولايات المتحدة والترابط ، والتي تسمح بالانتشار العالمي السريع للتكوين وتغييرات الهوية.

كانت الطبيعة الأساسية لنظام تشغيل Windows الخاص بهم ، والتي قدموا إليها Ring 0 kernel الوصول إلى CrowdStrike مما يجعل المشكلة ممكنة في المقام الأول ، عامل مساهم أيضًا.

المساءلة والمسؤولية المحدودة

واحدة من أكثر الوجبات السريعة من حادثة الحشود هي الافتقار الواضح إلى تداعيات مالية أو سمعة كبيرة لمقدمي الخدمات السحابية أنفسهم.

شهدت سعر سهم Microsoft فقط 1 ٪ في يوم انقطاع التيار الكهربائي ، مما يعكس النسبة المئوية لأجهزة Windows المتأثرة.

انخفض سعر سهم CroldStrike في البداية بنسبة 11 ٪ في يوم انقطاع التيار الكهربائي ، وما مجموعه 36 ٪ في غضون أسبوعين.

ومع ذلك ، بعد مرور عام ، تتداول أسهمها بنسبة 65 ٪ من يوم انقطاع التيار الكهربائي. إن نمو إيراداتها السنوي المتكرر (ARR) ، في حين أنه أقل قليلاً في الربع بعد الحادث مباشرة (158 مليون دولار مقابل 218 مليون دولار في الربع السابق) ، لا يزال يظهر زيادة على أساس سنوي بنسبة 34 ٪ بحلول نهاية العام.

يمكن أن يعزى هذا الاسترداد السريع لمقدمي الخدمات جزئيًا إلى الجمل الواقية المضمنة في شروط الخدمة الخاصة بهم.

تشير شروط CrowdStrike ، على سبيل المثال ، بشكل صريح إلى أنه لا ينبغي استخدام برامجها من أجل “المعالجة ذات القيمة العالية” حيث يمكن أن يؤدي الفشل إلى المخاطر على الحياة أو السلامة أو الأضرار البيئية أو الخسائر المالية الكبيرة.

علاوة على ذلك ، عادةً ما يتم توج مسؤولية الشركة عن الخسائر بتكلفة الخدمة التي تم شراؤها في تلك السنة المالية. هذه الجمل ، التي ليست فريدة من نوعها بالنسبة إلى CrowdStrike وتناقش في شروط خدمة Microsoft ، تحد بشكل فعال اللجوء المالي للعملاء الذين يعانون من خسائر كبيرة. هذا يسلط الضوء على جانب حاسم ، ولكن غالبًا ما يتم تجاهله ، من تبني الخدمة السحابية: ينخفض نقل المخاطر التشغيلية إلى حد كبير على العميل.

مخاطر دائمة وضرورات استراتيجية

بعد مرور عام ، تستمر المخاطر الأساسية التي كشفها انقطاع الحشود إلى حد كبير. تعني الطبيعة المترابطة للمنصات السحابية الرئيسية أن نقطة فشل واحدة ، حتى من بائع طرف ثالث ، لا تزال لا تزال تؤدي إلى تعطيل واسع النطاق. في حين أن “Big One” – وهو فشل في السحابة العالمية الكارثية – لم يتحقق بعد ، فإن حادثة CrowdStrike هي بمثابة تذكير صارخ لإمكانية مثل هذا الحدث.

لذلك يجب على المؤسسات أن تفهم أن الاعتماد على السحابة العامة والإنترنت كنسخة احتياطية لفشل السحابة العامة والإنترنت ليس استراتيجية قابلة للحياة. إن تطوير التعافي الكوارث القوي والمستقل (DR) وتخطيط استمرارية الأعمال (BCP) قابل للتنفيذ حتى أثناء انقطاع انقطاع واسع النطاق على نطاق واسع. ويشمل ذلك وجود قنوات اتصال بديلة واستراتيجيات الوصول إلى البيانات التي لا تعتمد على أي جزء من البيئة السحابية المعرضة للخطر.

أخيرًا ، هناك بعد جيوسياسي سياسي. أبلغت دول مثل روسيا والصين ، التي حدت تاريخيا اعتمادها على التكنولوجيا الغربية وغالبًا ما يتم الاستشهاد بها باعتبارها ممثلين ضارين أساسيين في الحرب الإلكترونية ، عن أي تأثير على انقطاع التيار الكهربائي.

تعمل مثل هذه الأحداث كذكاء قيّم لهؤلاء الجهات الفاعلة ، مما يتيح لهم تحديد نقاط الضعف وصقل مواقفهم الوقائية الخاصة بهم ، وربما استراتيجيات الهجوم المستقبلية على البنية التحتية السحابية العالمية. قد لا نتعلم بسهولة دروس هذه الانقطاعات ، ولكن يمكننا أن نكون متأكدين من أنها بالتأكيد تفعل ذلك.

كان انقطاع CrowdStrike حدثًا مهمًا كان ينبغي أن يدفع إعادة تقييم جماعي للمرونة الرقمية. بينما مرت الأزمة الفورية ، تظل نقاط الضعف الأساسية والآثار المترتبة على إدارة المخاطر اعتبارات حرجة لكل مؤسسة تعمل في السحابة.

هل تعلمت الشركات هذه الدروس حقًا ، وهل تتخذ التدابير اللازمة لمنع اضطرابات مماثلة أو أكثر حدة في المستقبل؟ الأدلة لا تشير.



Source link

زر الذهاب إلى الأعلى