مع الذكاء الاصطناعي (AI)، يمكن أن نواجه أكبر حدث لتحديث التكنولوجيا في التاريخ ، حيث قد تنشر كل مؤسسة ما يصل إلى 2000 وكيل لكل موظف.
ولتلبية تلك الحاجة ، ستتأثر البنية التحتية بالكامل لتكنولوجيا المعلومات – والتخزين على وجه الخصوص -.
هذه هي آراء جيف دنورث ، المؤسس المشارك لـ Vast Data ، الذي يتحدث في هذا البودكاست حول تحديات البنية التحتية للوكيل الذكاء الاصطناعى ، والتحديات التي تواجه تخزين وكيل الذكاء الاصطناعي، وكيف يمكن للعملاء أن يبدأوا في مواجهة هذه التحديات عبر بياناتهم والسحابة.
ويشمل ذلك حذراً للغاية في تحديد وتوفير البنية التحتية للبنية التحتية بشكل واضح مع عدم الإفراط في شراء ، بالإضافة إلى ضمان التخزين وحساب العمل جنبًا إلى جنب مع بنيات التطبيق وفرق قاعدة البيانات.
ما هي التحديات الإضافية التي يطرحها العميل من الذكاء الاصطناعي للبنية التحتية لتكنولوجيا المعلومات؟
إنه سؤال واسع للغاية. ولكن ، للبدء ، أعتقد أنه من المهم الإشارة إلى أن هذا في بعض النواحي يشكل شكلًا جديدًا تمامًا من منطق الأعمال وشكل جديد من الحوسبة.
وهكذا ، يصبح السؤال الأول ، إذا أنظمة الوكيل هي نماذج التفكير المقترنة بالعوامل التي تؤدي مهام من خلال الاستفادة من نماذج التفكير ، بالإضافة إلى الأدوات المختلفة التي تم تخصيصها لهم لمساعدتهم على إنجاز مهامهم … تحتاج هذه النماذج إلى التشغيل على آلات عالية الأداء.
غالبًا ما تعمل البنية التحتية للذكاءات الاصطناعية بشكل أفضل على وحدات معالجة الرسومات [graphics processing units] وأنواع أخرى من تسارع الذكاء الاصطناعي. وهكذا ، يصبح السؤال الأول ، كيف يمكنك إعداد البنية التحتية لحساب هذا الشكل الجديد من الحوسبة؟
وهنا ، يتحدث العملاء عن نشر مصانع الذكاء الاصطناعي و خرقة [retrieval augmented generation]ويميل نشر وكيل الذكاء الاصطناعى إلى أن يكون قضية الاستخدام الأولي يفكر فيها الناس عند بدء نشر مصانع الذكاء الاصطناعي هذه.
هذه هي أنظمة مقترنة بإحكام تتطلب شبكات سريعة تربط معالجات AI سريعة للغاية و GPU ، ثم توصيلها بمستودعات البيانات المختلفة وموارد التخزين التي قد ترغب في الذهاب إليها وتغذية هذه العوامل.
الشيء المثير للاهتمام حول البنية التحتية للوكيل هو أن الوكلاء يمكنهم العمل في نهاية المطاف عبر عدد من مجموعات البيانات المختلفة ، وحتى في المجالات المختلفة. لديك نوعان من نوعين من الوكلاء – العمال ، والوكلاء الآخرين ، وهما المشرفون أو الوكلاء الإشرافيين.
لذلك ، ربما أريد أن أفعل شيئًا بسيطًا مثل تطوير توقعات مبيعات لمنتجتي أثناء مراجعة جميع محادثات العملاء وقواعد البيانات المختلفة أو مجموعات البيانات التي يمكن أن تُعلم توقعاتي.
حسنًا ، سيؤدي ذلك إلى الحصول على وكلاء يعملون على عدد من مجموعات البيانات المستقلة المختلفة التي قد لا تكون في مرحلة البيانات الخاصة بي ومعالجتها. مثال رائع هو إذا كنت تريد شيئًا ما للذهاب ومعالجة البيانات في Salesforce ، فقد يستخدم الوكيل الإشرافي وكيلًا تم نشره داخل Salesforce.com للذهاب وفرز هذا الجزء من نظام الأعمال الذي يريد معالجة البيانات عليه.
لذا ، يصبح السؤال الأول ، كيف تحدد خط الأنابيب هذا؟ كيف يمكنك تحديد جميع مصادر البيانات المختلفة التي قد ترغب في معالجتها؟ كيف يمكنك الحجم لما تعتقد أنه نوع من عبء العمل التشغيلي الاسمي ، بحيث يكون لديك ما يكفي من موارد حسابية للحالة الثابتة؟
هناك العديد من الجوانب المختلفة لاتخاذ القرارات التي تلعب دورها عندما يعتقد الناس أنهم يريدون البدء في نشر أعباء عمل وكيل
جيف دنورث ، بيانات واسعة
وبعد ذلك ، تنقلك مناقشة الحساب إلى مسار المركز الثاني والبنية التحتية للبنية التحتية ، وهي غلاية مختلفة تمامًا من الأسماك لأن بعض هذه الأنظمة الجديدة – على سبيل المثال ، GB200 و L72 أنظمة من nvidia – هي رفوف من وحدات معالجة الرسومات المقترنة بإحكام والتي لها شبكات سريعة للغاية بينهما. هذه تتطلب شيئًا مثل 120 كيلو واط لكل رف مركز بيانات ، والذي لا يملكه معظم العملاء.
ثم تبدأ العمل من خلال اعتبارات متطلبات GPU الخاصة بي وأين يمكنني نشرها؟ في كولو؟ هل هو في مركز بيانات لدي؟ هل من المحتمل أن يتم استضافتها في بعض البيئة السحابية أو السحابة الجديدة؟ الغيوم الجديدة هي هذه الغيوم الجديدة من الذكاء الاصطناعي المولودة في عصر الذكاء الاصطناعي. هناك العديد من الجوانب المختلفة لاتخاذ القرارات التي تلعب دورها عندما يعتقد الناس أنهم يريدون البدء في نشر أعباء عمل وكيل.
ما هي التحديات الرئيسية للبنية التحتية للتخزين ، على وجه الخصوص ، في AICEC AI؟
حسنًا ، كما هو الحال مع السؤال الأول ، إنه متعدد الأبعاد حقًا.
أعتقد أن أول ما يرفع حجمه هو ما هو التخزين في AIGNIC AI؟ وهذا شيء تغير جذريًا منذ أن بدأ الناس في تدريب نماذج الذكاء الاصطناعي. عمل معظم الناس عمومًا على افتراض أنه إذا كان لديك نظام ملفات جيد وسريع ، فهذا جيد بما فيه الكفاية. وهكذا ، فإن الفرق هنا هو أنه عندما يتدرب الناس على شعور الذكاء الاصطناعي ، وحتى الضبط الدقيق ، غالبًا ما تكون هذه مجموعات بيانات منظمة جيدًا يتم تغذيتها في آلات الذكاء الاصطناعي ، وانتظر بضع ساعات أو بضعة أيام ، وتخرج من طراز جديد.
وهذا هو مستوى التفاعل الذي لديك مع أنظمة التخزين الأساسية ، بخلاف نظام التخزين هذا الذي يحتاج أيضًا إلى أن تكون قادرًا على التقاط نقاط تفتيش متقطعة للتأكد من أنه إذا فشلت المجموعة ، فيمكنك التعافي من وقت ما في وظيفة والبدء من جديد.
إذا كنت تفكر في الوكلاء ، فإن المستخدم يحصل على نظام ويقوم بإجراء موجه ، وسيقوم هذه المطالبة بعد ذلك بإرسال الوكيل للقيام بمستوى حوسبة لا يمكن التنبؤ به تقريبًا ، حيث سيذهب نموذج الذكاء الاصطناعي ثم يتطلع إلى العمل مع مجموعات بيانات مساعدة مختلفة.
وليس فقط التخزين التقليدي ، مثل أنظمة الملفات وتخزين الكائنات ، التي يحتاجها العملاء. كما أنهم يحتاجون إلى قواعد بيانات. إذا رأيت بعض الإعلانات من DataBricks ، فإنهم يتحدثون عن كيفية إنشاء أنظمة الذكاء الاصطناعي الآن أكثر من البشر. وتعد مستودعات البيانات مهمة بشكل خاص حيث يتطلع وكلاء الذكاء الاصطناعى إلى العقل عبر مستودعات بيانات واسعة النطاق.
لذلك ، أي شيء يتطلب تحليلات يتطلب مستودع بيانات. أي شيء يتطلب فهم البيانات غير المهيكلة لا يتطلب فقط نظام ملفات أو نظام تخزين كائن ، ولكنه يتطلب أيضًا قاعدة بيانات متجه لمساعدة وكلاء AI على فهم ما هو موجود في أنظمة الملفات من خلال عملية تسمى Retrieval المعززة AI.
أول ما يجب تصارعه هو تسوية هذه الفكرة أن هناك كل أنواع مصادر البيانات المختلفة ، وكلها تحتاج إلى تحديث أو استعداد لحوسبة الذكاء الاصطناعى التي على وشك الوصول إلى مصادر البيانات هذه.
أحب أن أنظر نوعًا ما إلى ما تغير وما لم يتغير في السوق. وهذا صحيح أن هناك كل أنواع التطبيقات الجديدة التي يتم نشرها في شكل تطبيقات جديدة تستخدم وكلاء التفكير ، ويستخدمون نماذج التفكير كجزء من منطق أعمالهم. ولكن هناك أيضًا الكثير من التطبيقات القديمة التي يتم الآن تراجعها لدعم هذا النوع الجديد من حوسبة الذكاء الاصطناعى.
وهكذا ، فإن استنتاجنا العام هو أن كل تطبيق عمل واحد في المستقبل سيكون له بعض مكونات منظمة العفو الدولية المضمنة فيه. وستكون هناك مجموعة كاملة من التطبيقات الجديدة التي ستكون أيضًا تتمحور حول الذكاء الاصطناعي والتي لم نخطط لها أو لم تكن موجودة بعد.
الخيط المشترك هو أن هناك هذا النمط الجديد للحوسبة يحدث على مستوى التطبيق على نوع جديد من المعالج الذي لم يكن تاريخيا شائعًا في المؤسسة ، وهو معالج GPU أو معالج الذكاء الاصطناعي. لكنني أعتقد أن الشيء الذي لا يدركه الناس هو أن مجموعات البيانات التي سيعالجون عليها هي الكثير من البيانات التاريخية.
لذلك ، في حين أن فرصة تحديث مركز البيانات هي الحقول الخضراء على مستوى التطبيق وعلى مستوى المعالج أو على مستوى الحساب ، [there is] فرصة براونفيلد لتحديث البنية التحتية للبيانات القديمة التي تحمل اليوم القيمة والمعلومات التي سيبحثها وكلاء الذكاء الاصطناعي هذه ونماذج التفكير.
قد نشرع في ما يمكن أن يكون أكبر حدث لتحديث التكنولوجيا في العالم في التاريخ
جيف دنورث ، بيانات واسعة
ثم يصبح السؤال ، لماذا أقوم بتحديث ، ولماذا هذا مهم بالنسبة لي؟ هذا هو المكان الذي يعود فيه المقياس إلى المعادلة.
أعتقد أنه من المهم نقطة التفتيش حيث نحن فيما يتعلق بسير العمل وكيف سيؤثر ذلك على المؤسسة. من العدل أن نقول إن أي شيء روتيني أو نهج مرتبط بالعملية سيكون آليًا قدر الإمكان من الناحية الإنسانية.
هناك الآن أمثلة على العديد من المنظمات التي لا تفكر في عدد قليل من الوكلاء في جميع أنحاء المؤسسة ، ولكن مئات الآلاف ، وفي بعض الحالات ، مئات الملايين من الوكلاء.
على سبيل المثال ، أدلى Nvidia ببيان عام للغاية بأنهم سيقومون بنشر 100 مليون وكيل خلال السنوات القليلة المقبلة. وسيكون ذلك في وقت ستكون فيه منظمتهم 50000 موظف. الآن ، إذا وضعت هذين البيانين معًا ، فإن ما لديك ما يقرب من 2000 إلى واحد من AI وكيل إلى موظف قد تفكر في التخطيط له.
إذا كان هذا صحيحًا ، فستتطلب شركة تضم 10000 موظف بنية تحتية واسعة النطاق لحساب الحوسبة الفائقة لمجرد معالجة هذا المستوى من الوكالة. لذلك ، أفكر في الأمر من حيث ما هو السائقين لتحديث البنية التحتية. إذا بدأ نصف أو جزء صغير من هذا المستوى من مقياس وكيل الذكاء الاصطناعى في الوصول إلى شركة قياسية ، فإن كل نظام قديم يحمل بياناته سيكون غير قادر على دعم الكثافة الحسابية التي تأتي من هذا المستوى من الآلات.
وهذا هو الشيء الذي جعلنا نفكر في أننا قد نشرع في ما يمكن أن يكون أكبر حدث لتحديث التكنولوجيا في العالم في التاريخ. من المحتمل أن يكون أحدث ما يصل إلى السوق هو المحاكاة الافتراضية ، مما أدى إلى مطالب جديدة على مستوى التخزين وقاعدة البيانات. يبدو أن هذا الشيء نفسه صحيح بالنسبة إلى الذكاء الاصطناعى ، حيث أن العملاء المختلفين نعمل مع بدء إعادة التفكير في البيانات والبنية التحتية للتخزين للنشر على نطاق واسع.
كيف يمكن للعملاء ضمان أن بنيتهم التحتية تصل إلى وظيفة Agentic AI؟
إنه بالتأكيد يتطلب مستوى من التركيز وفهم عبء عمل العملاء.
لكن أحد الأشياء التي أراها تحدث في جميع أنحاء السوق هي الإفراط في الدوران ، حيث لن يفهم ممارسو البنية التحتية بالضرورة الاحتياجات التي تأتي من منطق العمل الجديد أو أبحاث الذكاء الاصطناعي.
وهكذا ، يميلون إلى التعويض عن المجهول. وهذا أمر خطير أيضًا ، لأن ذلك يخلق ذوقًا سيئًا في الفم بالنسبة للمؤسسات التي بدأت تنحدر إلى مبادرات مختلفة من الذكاء الاصطناعي عندما تدرك ، حسنًا ، لقد شراؤنا هنا ، لقد اشترينا الأشياء الخاطئة هنا.
أول شيء أقوله هو أن هناك أفضل الممارسات في السوق التي يجب الالتزام بها بالتأكيد. على سبيل المثال ، قامت Nvidia بعمل رائع حقًا للمساعدة في التعبير عن ما يحتاجه العملاء وتحجيمهم وفقًا لتعريفات GPU المختلفة ، بحيث يمكنهم بناء البنية التحتية التي يتم غرضها بشكل عام ومحسّن ، ولكن ليس بالضرورة.
الشيء الثاني الذي أود أن أقوله هو أن استراتيجيات السحابة الهجينة تحتاج بالتأكيد إلى التوفيق ، ليس فقط للبنية التحتية كخدمة-هل أقوم بنشر أشياء في مركز البيانات الخاص بي؟ هل أقوم بنشر بعض الأشياء في غيوم منظمة العفو الدولية أو السحب العامة؟ – ولكن أيضا SaaS مختلفة [software-as-a-service] خدمات.
والسبب هو أن الكثير من العمل الوظيفي سيحدث هناك. لديك الآن ، على سبيل المثال ، Slack ، التي لديها خدمات منظمة العفو الدولية الخاصة بها. إلى حد كبير أي عرض SaaS الرئيسي يحتوي أيضًا على مكون فرعي لمنظمة العفو الدولية يتضمن بعض العوامل. أفضل ما يجب فعله هو الجلوس مع فريق Application Architects ، الذي لا يتمتع به الكثير من عملائنا في التخزين بالضرورة.
الشيء الثاني هو الجلوس مع فرق قاعدة البيانات. لماذا؟ نظرًا لأن مستودعات بيانات المؤسسة تحتاج إلى إعادة التفكير وإعادة تخيلها في هذا العالم من الحوسبة الوكيل ، ولكن أيضًا هناك حاجة إلى أنواع جديدة من قواعد البيانات في شكل قواعد بيانات المتجهات. هذه لها متطلبات مختلفة ، في البنية التحتية والحساب وكذلك على مستوى التخزين.
أخيرًا ، يجب أن يكون هناك بعض التنسيق حول ما سيحدث مع مركز البيانات وعبر السحب المختلفة. تحتاج إلى التحدث إلى البائعين المختلفين الذين تعمل معهم. ذلك والممارسة كلها لمساعدة الناس في هذا.
لدينا ما يقرب من حوالي 1.2 مليون وحدة معالجة الرسومات التي قمنا بتشغيلها في جميع أنحاء العالم ، وهناك كل أنواع الأساليب المثيرة للاهتمام ليس فقط للحجم ، ولكن أيضًا أنظمة البيانات المستقبلية من خلال فهم كيفية الاستمرار في توسيع نطاق مشاريع AI المختلفة وتثبت أنها ناجحة.