إن التقدم في التكنولوجيا، وتطوير “اللغة الصغيرة” ونماذج مفتوحة المصدر، والأداء، وفوائد تحديد موقع الذكاء الاصطناعي بالقرب من مصادر البيانات، يخلق مواقف تفضل البنية الداخلية. ثم هناك اعتبارات تتعلق بالأمان وخصوصية البيانات وحماية الملكية الفكرية والتكلفة. ولكل منها، هناك حجة قوية للذكاء الاصطناعي داخل الشركة، على الرغم من أن معظم اهتمام الصناعة ينصب على الحلول السحابية.
“تقوم معظم المؤسسات حاليًا بتشغيل أعباء عمل الذكاء الاصطناعي الخاصة بها في السحابة، مدفوعة بالمزايا الكبيرة المتمثلة في قابلية التوسع وكفاءة التكلفة والنشر السريع الذي توفره الأنظمة الأساسية السحابية مثل AWS [Amazon Web Services], مايكروسوفت أزور يقول ديريك فان جيلديرين، رئيس استراتيجية الذكاء الاصطناعي في شركة PA Consulting: “وعرض Google Cloud”.
“لقد طور موفرو الخدمات السحابية أنظمة بيئية شاملة تسمح للشركات بتجاوز تكاليف البنية التحتية الكبيرة المقدمة وبدلاً من ذلك الوصول إلى الموارد المرنة التي تعتبر مثالية للتعامل مع العمليات الحسابية العالية متطلبات الذكاء الاصطناعي – والآن الذكاء الاصطناعي التوليدي [GenAI] – ويضيف: “النماذج، خاصة خلال مراحل التدريب كثيفة الاستخدام للموارد”.
ويرى جون جاسباريني، قائد الإستراتيجية والتكنولوجيا السحابية في شركة KPMG، اتجاهات مماثلة. ويقول: “من المؤكد أن غالبية العملاء الذين أعمل معهم يستخدمون خدمات الذكاء الاصطناعي المستندة إلى السحابة لاختبار بعض حالات الاستخدام المبكر هذه”. “إنهم يستفيدون من بعض اللغات الكبيرة أو النماذج الأساسية الموجودة، أو يبنون نماذجهم الخاصة فوق هذه الخدمات السحابية.”
ويشير إلى أن بناء قدرات الذكاء الاصطناعي داخل الشركة يتطلب “استثمارات رأسمالية كبيرة”، لكن عائد الاستثمار (ROI) من الذكاء الاصطناعي ليس مضمونا بعد.
تسمح البنية التحتية السحابية للمؤسسات ببناء أنظمة الذكاء الاصطناعي بسرعة، ولكنها تسمح أيضًا بتقليص المشاريع التي تفشل في تحقيق النجاح. توفر السحابة أيضًا إمكانية الوصول بسهولة إلى النماذج المتطورة، بما في ذلك أحدث جيل من نماذج اللغات الكبيرة (LLMs). العديد من نماذج GenAI الرائدة، في الوقت الحالي على الأقل، متاحة فقط في السحابة.
لكن السحابة لها حدودها. وتصبح بعض هذه القيود عبئا أكبر مع توسع الشركات في استخدامها للذكاء الاصطناعي – إما من حيث اتساع نطاق المهام التي ينفذها، أو من خلال ربطها ببيانات أكثر حساسية.
حدود الذكاء الاصطناعي في السحابة
تعكس القيود المفروضة على الذكاء الاصطناعي القائم على السحابة إلى حد كبير عيوب الحوسبة السحابية لتطبيقات المؤسسات الأخرى: سيادة البياناتوالأمن واللوائح المتزايدة والتكلفة.
“إن ميزة السحابة العامة هي أنه يمكنك اختبار الأفكار. يقول جاسباريني، من شركة KPMG: “إذا لم تنجح، يمكنك إيقاف تشغيلها، ولن يكون لديك تكاليف شطب كبيرة للتعامل معها في تلك المرحلة”.
ميزة السحابة العامة هي أنه يمكنك اختبار الأفكار. إذا لم تعمل، يمكنك إيقاف تشغيلها، ولن يكون لديك تكاليف شطب كبيرة للتعامل معها في تلك المرحلة
جون جاسبريني، كيه بي إم جي
ولكن مع نمو مشاريع الذكاء الاصطناعي، تنمو الفواتير أيضًا. “لقد أجريت بالتأكيد محادثات مع العملاء مؤخرًا والذين بدأوا في البحث عن كيفية الحصول على رؤية واضحة تكاليف الذكاء الاصطناعييضيف.
كما هو الحال مع أي تطبيق سحابي آخر، تحتاج الشركات إلى فهم كيفية التنبؤ بهذه التكاليف وإدارتها. وبالنسبة للذكاء الاصطناعي، يمكن أن تزيد التكاليف مع زيادة حجم البيانات المخصصة للتدريب ومع قيام عدد أكبر من المستخدمين بإجراء المزيد من الاستعلامات من خلال أدوات الذكاء الاصطناعي.
يقول جرانت كالي، مدير الحلول في المملكة المتحدة وأيرلندا في شركة NetApp، مورد التكنولوجيا: “يمكن للسحابة أن تتوسع وبتكلفة قصيرة المدى، مما يعمل بشكل جيد حقًا”. “ولكن بمجرد ترك الأشياء هناك، [including] البيانات نفسها، عليك أن تدفع ثمن ذلك. إنها تصبح حجة تتعلق بالتكلفة بسرعة كبيرة.”
بالإضافة إلى ذلك، إذا كانت الشركة تستخدم قواعد بيانات متجهة لمشاريع الذكاء الاصطناعي – ومعظمها تفعل ذلك – تشير أرقام الصناعة إلى أنها قد تحتاج إلى مساحة أكبر بعشرة أضعاف مما كانت عليه بالنسبة للبيانات الأصلية. وهذا يزيد التكاليف بسرعة. تعد سيادة البيانات والخصوصية والأمان أيضًا من أسباب الانتقال من السحابة إلى الذكاء الاصطناعي داخل الشركة.
يحذر فان جيلديرين من PA Consulting من أن “بعض التحديات الأساسية التي تواجهها المؤسسات هي خصوصية البيانات وسيادتها”. “وهذا أمر بالغ الأهمية بشكل خاص في قطاعات مثل الدفاع، والطاقة النووية، والرعاية الصحية وغيرها من المنظمات شديدة التنظيم التي تحتاج إلى رقابة قوية على البيانات.”
يمكن أن يكون الأداء أيضًا مشكلة. ويقول: “يعد زمن الاستجابة مصدر قلق آخر، لا سيما بالنسبة للتطبيقات التي تتطلب استجابات في الوقت الفعلي أو استجابات منخفضة زمن الاستجابة، مثل الأنظمة المستقلة أو الحلول القائمة على الحافة”. “يمكن أن يكون التأخير الناتج عن نقل البيانات من وإلى الخوادم السحابية عاملاً مقيدًا.”
نقل الذكاء الاصطناعي داخل الشركة
تدفع القيود المفروضة على السحابة بعض المؤسسات على الأقل إلى تشغيل الذكاء الاصطناعي داخل الشركة، أو البحث عن خيارات داخل الشركة مع نمو عمليات الذكاء الاصطناعي الخاصة بها. ويرتبط هذا بنوع مؤسسات الذكاء الاصطناعي التي يتم تشغيلها، وموقع مصادر البيانات، والاحتياجات المختلفة لمراحل التدريب والاستدلال في الذكاء الاصطناعي.
يمكن للسحابة التوسع وبتكلفة قصيرة المدى والتي تعمل بشكل جيد حقًا. ولكن بمجرد ترك الأشياء هناك، [including] البيانات نفسها، عليك أن تدفع ثمن ذلك. تصبح حجة التكلفة بسرعة كبيرة
جرانت كالي، نت آب
يقول فان جيلديرين من PA Consulting: “في الوقت الحاضر، عندما يشير معظم الناس إلى الذكاء الاصطناعي، فإن 90% من الوقت يفكرون في تقنيات GenAI”. “ومع ذلك، فإن الذكاء الاصطناعي التوليدي والماجستير في إدارة الأعمال ليسا سوى جزء من المشهد الأوسع للذكاء الاصطناعي ولديهما احتياجات بنية تحتية متميزة مقارنة بالذكاء الاصطناعي “التقليدي” – على سبيل المثال، تصنيف التعلم الآلي ونماذج الانحدار، ومجموعات فرعية أخرى مثل معالجة اللغة الطبيعية ورؤية الكمبيوتر. “
يشير هذا إلى أن المؤسسات ستحتاج إلى أكثر من نهج واحد فيما يتعلق بتكنولوجيا الذكاء الاصطناعي. بالإضافة إلى ذلك، فإن الأهمية المتزايدة للجيل المعزز بالاسترجاع (RAG) تضيف طبقة أخرى من التعقيد. تستخدم المؤسسات RAG لإضافة سياق أعمالها الخاص إلى مخرجات نموذج الذكاء الاصطناعي. يمكن أن يؤدي هذا إلى نتائج أكثر حساسية، أو تحتاج إلى مزيد من الأمان، من النتائج الأولية من نموذج لغة كبير.
يقول باتريك سميث، كبير مسؤولي التكنولوجيا الميدانيين في شركة Pure Storage لمنطقة أوروبا والشرق الأوسط وأفريقيا: “يبدو أن RAG أصبح غير قابل للتفاوض بالنسبة للمؤسسات التي تستخدم الذكاء الاصطناعي التوليدي في بيئاتها الخاصة”.
“أولاً، يتغلب على معظم التحديات، إن لم يكن كلها، بالهلوسة. ثانيًا، يمنحك القدرة على استخدام بياناتك الخاصة مع الذكاء الاصطناعي التوليدي دون الحاجة إلى إجراء أي ضبط. ثالثًا، يتيح لك التغلب على مشكلة الوقت العصيب المتمثلة في عدم القدرة على استخدام البيانات الحالية إلا في حالة إعادة التدريب [the model]. ويضيف: “لذلك، يتم تناول عملة الرؤى أيضًا”.
لكن هذا يؤثر على البنية التحتية اللازمة لتشغيل الذكاء الاصطناعي. ووفقا لسميث، فإنه يؤثر على الأداء و”خطورة البيانات”. ويشير إلى أن أفضل مكان لتحديد موقع البيانات لا يعتمد على نموذج اللغة الكبير بقدر ما يعتمد على قواعد البيانات المتجهة.
ويقول: “إنها تحدد مكان الحل الشامل، والذي يؤثر بعد ذلك على الأشخاص لسحب حلول الذكاء الاصطناعي من السحابة العامة وإعادتها إلى مركز البيانات الخاص بهم”. “بمجرد الانتهاء من قاعدة بيانات المتجهات ومنهج RAG، فأنت تريد النموذج بجوار قاعدة بيانات المتجهات الخاصة بك.”
كما أن الشركات لا تحتاج دائمًا إلى أحدث نماذج الذكاء الاصطناعي المبنية على السحابة. هناك اهتمام متزايد ببرامج LLM مفتوحة المصدر، مثل ميتا اللاما.
وتظهر نماذج يمكنها العمل على أجهزة أقل قوة، من شركات مثل شركة ميسترال الفرنسية، فضلاً عن نماذج خاصة بقطاعات محددة.
ويعمل الباحثون أيضا على نماذج لغوية صغيرة. قد تكون هذه أكثر ملاءمة للتعامل مع البيانات الأكثر حساسية، وأسهل في التشغيل داخل الشركة. في نهاية المطاف، يمكن تشغيل هذه النماذج على خادم متوافق مع معايير الصناعة، أو حتى على جهاز كمبيوتر محمول قوي. لكن هذه الخيارات تمثل اقتراحًا مختلفًا تمامًا لتشغيل الجيل الحالي من شهادات LLM داخل الشركة، خاصة أثناء مرحلتي التدريب والضبط.
تشغيل الذكاء الاصطناعي داخل الشركة – اعتبارات عملية
تحتاج المؤسسات التي تتطلع إلى تشغيل أعباء عمل الذكاء الاصطناعي داخل الشركة إلى الموازنة بين المتطلبات الفنية والتكاليف الأولية للبنية التحتية لتكنولوجيا المعلومات مقابل تكاليف السحابة المستمرة والمحتملة الارتفاع.
“يطرح تشغيل أعباء عمل الذكاء الاصطناعي داخل الشركة العديد من التحديات، بما في ذلك ارتفاع تكاليف الأجهزة، ومتطلبات الطاقة والتبريد، ومتطلبات الصيانة المستمرة. يحذر فان جيلديرين من PA Consulting من أن بناء بنية تحتية قادرة على دعم نماذج GenAI واسعة النطاق يتطلب الكثير من رأس المال. “في مرحلة التدريب، حيث تكون هناك حاجة إلى مجموعات بيانات كبيرة وقدرة معالجة هائلة، غالبًا ما توفر البيئات السحابية ميزة واضحة.”
إن الفشل في السحابة أمر رخيص، ولكن النجاح مكلف
باتريك سميث، التخزين النقي
تحتاج الشركات أيضًا إلى التفكير فيما إذا كان لديها مساحة مركز البيانات والطاقة والمكونات المطلوبة.
تعد أجهزة الذكاء الاصطناعي المتخصصة، وخاصة وحدات معالجة الرسومات (GPUs)، باهظة الثمن وقد يكون من الصعب الحصول عليها. يتمتع Hyperscalers وعملاء الذكاء الاصطناعي السحابي لديهم بإمكانية الوصول إلى وحدات معالجة الرسومات من حيث الحجم. “الطلب على [GPU] ويقول جاسباريني من شركة KPMG: “إن الرقاقات تفوق العرض”. “لذلك، لم يتبق سوى القليل جدًا للشركات لاستهلاكه.”
قد تحتاج المؤسسات إلى النظر في نماذج أقل استهلاكًا للموارد لتطبيقات الذكاء الاصطناعي داخل الشركة، والتي يمكن تشغيلها على الأجهزة الموجودة.
ولكن هناك أيضًا حجج تتعلق بالكفاءة للقيام بذلك. في مرحلة الاستدلال، قد تعمل نماذج الذكاء الاصطناعي بشكل مستمر، مما يجعلها أكثر اقتصادا للتشغيل داخل الشركة، بشرط أن تتمتع المؤسسات بقدرة مركز البيانات.
“إن إعادة الأمور إلى مركز البيانات أمر جيد من خلال ملف تعريف التكلفة، خاصة إذا كانت [the models] “سوف يتم تشغيلها طوال الوقت”، يقترح كالي من شركة NetApp. “إذا كنت ستقوم فقط بتدوير مجموعة من وحدات معالجة الرسومات لمدة 10 ساعات لتنفيذ مشروع ما، فربما تكون السحابة أفضل لذلك.”
يوافق سميث من شركة Pure Storage على ذلك. ويقول: “إن الفشل في السحابة أمر رخيص، ولكن النجاح مكلف”. “اصنع نماذجك الأولية هناك – يمكنك التخلص منها كلها إذا لم تسير وفقًا للخطة. ولكن عندما تدخلها في مرحلة الإنتاج، لأنك أثبتت عائد استثمارك، فقد أثبتت أنها خدمة أعمال قيمة، وتريد التركيز على التكاليف المحتملة.
ومن المرجح أن يدفع ذلك المؤسسات في نهاية المطاف إلى إيجاد نماذج للذكاء الاصطناعي تعمل مع البنية التحتية لتكنولوجيا المعلومات التي تمتلكها أو يمكنها تحمل تكاليف بنائها، بدلاً من الاعتماد على السحابة في استراتيجية الذكاء الاصطناعي طويلة المدى.