تؤكد AWS أنها تعمل على “استعادة الخدمات بالكامل” بعد انقطاع كبير

قالت Amazon Web Services (AWS) إنها تعمل على “استعادة” البيئات السحابية لعملائها بشكل كامل، بعد أن أدت “مشكلة تشغيلية” داخل منطقة مركز البيانات في شمال فيرجينيا إلى تعطيل العديد من مواقع وخدمات الإنترنت في جميع أنحاء العالم.
من المعروف أن مستخدمي خدمات السحابة العامة العملاقة بدأوا في الإبلاغ عن المشكلات في حوالي الساعة الثامنة صباحًا بتوقيت المملكة المتحدة، وفقًا لموقع تتبع انقطاع الخدمة كاشف التوقف.
كان هذا في نفس الوقت تقريبًا الذي بدأت فيه خدمة AWS Health Dashboard، التي توفر للمستخدمين ملخصًا لكيفية أداء البيئات السحابية للشركة، في تتبع المشكلات مع الخدمات المتعددة المستضافة داخل منطقة US-East-1 في شمال فيرجينيا.
أعقب هذه الرسالة العديد من الاعترافات بـ “معدلات الخطأ الجسيمة” التي تؤثر على خدمات AWS داخل منطقة شرق الولايات المتحدة، إلى جانب التأكيدات على أن الشركة لديها مهندسون “يشاركون على الفور ويعملون بنشاط على تخفيف المشكلة، وفهم السبب الجذري بشكل كامل”.
أكدت Dashboard لاحقًا، في حوالي الساعة 10 صباحًا بتوقيت المملكة المتحدة أن: “الخدمات أو الميزات العالمية التي تعتمد على نقاط النهاية US-East-1… قد تواجه مشكلات أيضًا.”
قالت AWS لاحقًا إن انقطاع الخدمة يتعلق بمشكلة DNS تؤثر على خدمة قاعدة بيانات DynamoDB NoSQL الخاصة بها: “لقد حددنا السبب الجذري المحتمل لمعدلات الخطأ لواجهات برمجة تطبيقات DynamoDB في منطقة شرق الولايات المتحدة-1. وبناءً على تحقيقاتنا، يبدو أن المشكلة مرتبطة بحل DNS لنقطة نهاية DynamoDB API في منطقة شرق الولايات المتحدة-1.”
ومن المعروف أن الصعوبات التقنية كان لها تأثير غير مباشر على العديد من عملاء AWS في جميع أنحاء العالم، الذين أبلغوا أيضًا عن مشكلات نتيجة لتعطل خدمات السحابة العملاقة.
ومن بين المتأثرين مزود الخدمات المالية Lloyds Bank، إلى جانب شركتي Halifax وRoyal Bank of Scotland التابعتين له، بالإضافة إلى خدمات التواصل الاجتماعي والاتصالات مثل Snapchat وSignal، وبوابات الألعاب عبر الإنترنت، Fortnite وRoblox.
كما عانت خدمات الإنترنت المملوكة لشركة أمازون، مثل موقع البيع بالتجزئة وخدمة Ring Doorbell، من انقطاع الخدمة نتيجة للانقطاع.
اتصلت شركة Computer Weekly بـ AWS لطلب تفاصيل عن الوقت الذي تأمل فيه في حل المشكلة. ردًا على ذلك، تم توجيه Computer Weekly إلى AWS Health Dashboard من قبل متحدث رسمي، حيث من بين آخر التحديثات تصريحات حول كيفية سعي الشركة لاستعادة الخدمات المتأثرة بالكامل، وقد وصلت إلى مرحلة بدأت فيها إعادة تشغيل تلك المتضررة من المشاكل بنجاح.
ومع ذلك، سارع مراقبو السوق السحابية العامة إلى الإشارة إلى كيف أن المجموعة الواسعة من المستخدمين والخدمات التي تم قطع اتصالها بالإنترنت نتيجة للانقطاع يمكن أن تكون مؤشرًا على مدى اعتماد العالم المفرط على خدمات AWS.
ادعى الخبراء أن هذه الحوادث تسلط الضوء على سبب أهمية قيام الشركات بتنويع مزيج موفري الخدمات السحابية الذين يعملون معهم لصالح وقت التشغيل وتوافر الخدمة.
قال نيكي ستيوارت، كبير مستشاري The Open Cloud Coalition، وهو منظمة مؤيدة للمنافسة في منظمة الدفاع عن السحابة العامة، إن انقطاع الخدمة هو “تذكير عميق بمخاطر الاعتماد المفرط على اثنين من موفري الخدمات السحابية المهيمنين”، بالنظر إلى مدى انتشار آثاره اللاحقة.
وقال ستيوارت: “من السابق لأوانه قياس التداعيات الاقتصادية، ولكن بالنسبة للسياق، تشير التقديرات إلى أن انقطاع خدمة CrowdStrike العالمي في العام الماضي كلف اقتصاد المملكة المتحدة ما بين 1.7 مليار جنيه إسترليني و2.3 مليار جنيه إسترليني”.
“توضح حوادث مثل هذه الحاجة إلى سوق سحابية أكثر انفتاحًا وتنافسية وقابلية للتشغيل البيني – سوق حيث لا يمكن لمزود واحد أن يوقف الكثير من عالمنا الرقمي.”
وقال داي فوغان، كبير مسؤولي التكنولوجيا في شركة استشارات التحول الرقمي Public Digital، إن انقطاع خدمة AWS يوضح أن الفشل التكنولوجي العرضي يمكن أن يشكل خطرًا كبيرًا على عمليات الشركة مثل الهجوم السيبراني.
ولهذا السبب، قال إن الشركات يجب أن تغتنم أخبار اليوم لتطوير “عقلية دفاعية” عندما يتعلق الأمر بتجنب تهديدات التوقف عن العمل التي “تتبنى الاستعداد والمرونة” على المدى الطويل.
وقال فوغان: “هناك شيء واحد يجب على جميع المؤسسات القيام به للاستعداد وهو إنشاء فريق مخصص للاستجابة للأزمات. ويجب أن يكون هذا الفريق أقل من 12 شخصًا وأن يشمل ذوي الخبرة في تكنولوجيا المعلومات وإدارة البيانات والاتصالات وإدارة أصحاب المصلحة، بالإضافة إلى القيادة العليا”.
“في نهاية المطاف، لا تتعلق القدرة على الصمود بالقضاء على المخاطر بالكامل، بل بفهمها والتخطيط لها وغرس ثقافة يمكنها امتصاص الصدمات والتعافي بسرعة.”
وتابع: “أولئك الذين يتبعون هذا النهج الشامل والاستباقي وعصر الإنترنت لن يحموا عملياتهم فحسب، بل سيحافظون أيضًا على الثقة مع العملاء والشركاء في مشهد رقمي غير مؤكد”.




