أخبار التقنية

القصة وراء جبال الألب ، ثاني أكبر كمبيوتر في أوروبا


ال مركز الحوسبة الوطنية السويسرية، والمعروفة أيضًا باسم CSCs ، التي تم بناؤها ونشر حاسوبًا جديدًا جديدًا بالتعاون مع NVIDIA و HPE.

الجهاز ، الذي يسمى جبال الألب ، جاء على الخط في نهاية عام 2024 ، وهو بالفعل المدرجة في سابع أقوى الحاسبات الخارقة في العالم – وثاني أقوى في أوروبا. جلس الكمبيوتر الأسبوعي مع توماس شولثس، مدير CSCs وأستاذ الفيزياء الحسابية في ETH [Eidgenössische Technische Hochschule or Federal Institute of Technology] زيوريخ ، لمعرفة المزيد.

ما هو تاريخ جبال الألب وما هي القرارات المعمارية التي اتخذتها على طول الطريق؟

توماس شولثس: سأبدأ بشرح الفرق بين CSCs و Alps. CSCS هو مركز مع الناس. المنشأة الرئيسية في لوغانو ، بالقرب من ملعب كرة القدم واستاد هوكي الجليد. تأسست في عام 1991 ، قبل وصولي بوقت طويل ، وينشر وتشغيل أجهزة الكمبيوتر العملاقة ، وأكبرها هو جبال الألب ، التي جاءت عبر الإنترنت في عام 2024. قبل جبال الألب ، نشرنا بالفعل العديد من الحواسيب الفائقة الأخرى.

على سبيل المثال ، كان لدينا Piz Daint، آلة Cray XC40/XC50 الهجينة ، والتي كانت أول مجموعة كبيرة من GPU في أوروبا. لقد نشرناها في الفترة من 2012 إلى 2013 ، والتي كانت في وقت قريب من جاكوار في مختبر أوك ريدج الوطني في الولايات المتحدة.

أحد الأشياء التي تجعلنا مميزين هو أن نقوم بتصميم وإنشاء وتشغيل الحواسيب الفائقة ل الأرصاد الجويةخدمة الأرصاد الجوية السويسرية. عادة ، تدير خدمات الطقس أجهزة الكمبيوتر الخاصة بها ، ولكن في حالتنا ، نفعل ذلك من أجلهم. نتيجة لذلك ، تعاوننا مع Meteoswiss لعقود.

ALPS هي محاولة لجلب أجهزة كمبيوتر مختلفة إلى منصة واحدة – وكان مدفوعًا بمراجعة النظراء للمركز التي كان لدينا في عام 2015 ، حيث تلقينا الرسالة القوية للغاية التي تخبرنا بأننا قمنا بعمل رائع في نشر Piz Daint ، لكننا الآن نحن الآن يجب أن تواجه تحديات البيانات وسير العمل المعقدة في الحوسبة العلمية.

وذلك عندما بدأنا في البحث عن خيارات حول كيفية تطوير الحوسبة الفائقة. وما حدث كتعاون مع ما كان آنذاك كراي ، والآن HPE ، الذي حصل على كراي في عام 2019. بنيان. بالنسبة لنا ، كان هذا تطورًا جيدًا حقًا ، ولكن اتضح أنه صعب للغاية ، وأكثر صعوبة بكثير مما توقعه أي شخص.

لكننا قررنا أن نذهب بهذه الطريقة من 2018 إلى 2019. قمنا بتشغيل المشتريات ، وفاز كراي بالعقد. ثم فكرنا في البنية المتنافسة – nvidia مقابل AMD – وفي النهاية ، ذهبنا لكليهما. لقد فعلنا النطاق مع غريس هوبر [from Nvidia]؛ والآن لدينا أيضًا قسم مهم من مسرعات MI300A [from AMD] على جبال الألب.

وكيف يتم تشغيل جبال الألب اليوم؟

شولثس: الطريقة التي يعمل بها جبال الألب اليوم هي أن لديها كبيرة جدًا مقلاع الشبكة ، مثل الحدود و لومي – ويمكننا تقسيم الشبكة. في نهاية كل نقطة نهاية شبكة إما جهاز تخزين أو عقدة حسابية. والعقد الحسابية إما Grace Hopper (GH200) قائم أو AMD-MI300A. لدينا أيضًا معالجات NVIDIA A100 و AMD MI250X ، مما يجعل العقدة كما هي في LUMI وفي الحدود. لدينا العقد المستندة إلى AMD Rome أيضًا ، لذلك قسم تقليدي متعدد الأزهار.

وبالتالي ، فإننا ندعم العديد من بنيات الحساب على جبال الألب. الفكرة هي أنه يمكننا تقديم أعباء عمل مختلفة. ولدينا تركيز كبير على تطوير برامج التطبيق. لذلك ، يمكننا إتاحة كل هذه الأنواع من البنية لمطوري البرامج. وهذا هو المكان الذي نحن فيه اليوم.

كيف تقدم خدمة على جبال الألب؟

شولثس: يمكنك عرض جبال الألب مثل تجربة تشبه السحابة ، مع أنواع مختلفة من الخدمة. يمكننا تقديم البنية التحتية كخدمة (IAAS). عادة ، نحن نقدم IAAS للبنية التحتية البحثية الأخرى ، مثل معهد بول شرير يدير العديد من برامج المستخدم الكبيرة ، بما في ذلك الوصول إلى synchrotron [the Swiss Light Source]، ال ليزر الإلكترون الحر [SwissFEL]و النيوترون السويسري تسهيلات لدراسة علوم مون. وبالتالي يحصلون على قسم على جبال الألب ويديرون منصاتهم الخاصة.

في حالات أخرى ، قد نقوم بإنشاء منصة لـ AI أو HPC التقليدية أو المناخ والطقس للمستخدمين. ثم لدينا مستخدمون أو مجتمعات تدير وظيفتهم الخاصة كخدمة ، ونحن نوفر لهم منصة كخدمة. نحن متورطون أيضًا في تجارب كبيرة مثل صفيف كيلومتر مربع أو المستوى السويسري الثاني لتحليل بيانات LHC الذي يعد جزءًا من شبكة حساب LHC العالمية ، وهو قسم على جبال الألب.

وربما أهم شيء الآن هو أنه حيث اعتدنا أن يكون لدينا جهاز كمبيوتر منفصل لـ Meteoswiss ، مع النموذج الجديد ، ندير نظام التنبؤ العددي الخاص بهم رمز في قسم على جبال الألب.

يبدو أن حقيقة أن أيقونة تعمل الآن في قسم مؤشر جيد على حجم جبال الألب؟

شولثس: حسنًا ، يظهر لك الحجم ، ولكن أيضًا اتساعنا الذي يمكننا تغطيته. تقليديًا ، يعد الحاسوب الخارق نظامًا فريدًا. قد يكون غير متجانس-على سبيل المثال ، piz daint غير متجانسة من حيث أنه يحتوي على عقد متعددة ، وعقد تسريع GPU. قد يكون ذلك غير متجانس ، ولكن تم أرخّمه كنظام موحد من حيث أنه حل يناسب الجميع ، من حيث بيئة البرمجة وأشياء من هذا القبيل.

عادةً ما يتعين على المستخدمين التكيف مع حاسوب فائق معين. لذلك ، لديك أساسًا مطرقة وتحتاج إلى جعل كل شيء يبدو وكأنه مسمار. الآن على جبال الألب ، يمكننا إنشاء أقسام وبيئة البرمجيات في تلك الأقسام للتكيف مع المستخدمين.

من يمول CSCs و ALPS؟

شولثس: يتم تمويل جبال الألب كبنية تحتية بحثية بواسطة مجال ETH. CSCS هي وحدة من إيث زيوريخ، حيث أنا أيضًا أستاذ فيزياء. يتم ربط Eth Zurich و EPFL ، المدرسة الشقيقة في لوزان ، وأربعة مختبرات وطنية تحت ما يسمى بمجال ETH.

يتم تمويل المجال بأكمله من قبل أمانة الدولة للتعليم والبحث والابتكار – وهذا هو مصدر التمويل الرئيسي لدينا. ولكن يتم تمويل الجزء الأرصاد الجوية من قبل Meteoswiss وأي مصادر التمويل الخاصة بهم. لذلك ، علينا الحفاظ على فصل واضح هناك. وأيضًا تمويل من طرف ثالث ، مثل معظم البنى التحتية للأبحاث ، في حدود حوالي 20 ٪.

نظرًا لأننا بنية تحتية تمولها علنًا ، حتى لو عملنا مع أطراف ثالثة أخرى والحصول على استرداد كامل للتكاليف ، فإننا لا نزال مدعمين ، ولا توجد إعانات لا تتوسع. لا يمكن أن يكون لدينا أنشطة تجارية على البنية التحتية لدينا ، على الرغم من أننا نستطيع الانخراط في التعاون البحثي مع الشركات التجارية. وعندما نتعاون مع الشركات ، يجب عليهم تمويل تكاليف استرداد تلك التعاون.

ماذا عن مشاركتك في Openchami كونسورتيوم؟

شولثس: يتضمن اتحاد OpenChami حاليًا خمسة شركاء: مختبر لوس ألاموس الوطنيو NERSC [National Energy Research Scientific Computing Center]و لورانس بيركلي المختبر الوطنيو جامعة بريستولو HPE و CSCs.

يقوم الكونسورتيوم بتطوير البنية التحتية لإدارة النظام في المستقبل. جبال الألب هي حالة استخدام أساسية في هذا التطور. ولهذا السبب سيستمر برنامج إدارة النظام في التطور على مدار العامين أو الثلاثة أعوام القادمة – هنا في CSCS ، وأيضًا في بريستول ، في لوس ألاموس ، وفي بيركلي.



Source link

زر الذهاب إلى الأعلى