البيانات النظيفة والبسيطة هي حجر الزاوية في استدامة الذكاء الاصطناعي
لم تعد المخاوف بشأن التأثير البيئي لأعباء عمل الذكاء الاصطناعي مجرد نقاش يقتصر على الباحثين والتقنيين. كما بدأت المناقشات حول أزمة الطاقة المتوقعة وتأثيرات المناخ المرتبطة بتشغيل متطلبات الذكاء الاصطناعي المتوقعة في الظهور على مائدة العشاء ومحادثات تبريد المياه. وبالنظر إلى الإنجازات الواعدة التي يتوقع الخبراء أن يحققها الذكاء الاصطناعي في مواجهة التحديات العالمية في مجالات الرعاية الصحية وعلوم المناخ والاستدامة، فمن المنطقي أن يهتم الناس بهذا الأمر. ومع ذلك، يتعين علينا أن نعد أنفسنا بعناية لإدارة السقطات المحتملة للذكاء الاصطناعي في حين نحتفل بإمكانياته الواعدة.
في جوهره، يعد التأثير البيئي لأعباء عمل الذكاء الاصطناعي مفهومًا يسهل فهمه إلى حد ما حتى بالنسبة لغير الخبراء: تعمل نماذج الذكاء الاصطناعي على أجهزة كمبيوتر قوية للغاية ومستهلكة للطاقة. وبما أن معظم إنتاج الكهرباء يؤدي إلى انبعاثات غازات الدفيئة، فإن الذكاء الاصطناعي يمكن أن يتسبب في ارتفاع انبعاثات الكربون إذا ترك دون رادع. لكن الحل أبعد ما يكون عن البساطة.
ولمساعدة المؤسسات على تجنب التورط في العديد من المتغيرات المتعلقة بمعضلة استدامة الذكاء الاصطناعي، أوصي بتقسيم استدامة الذكاء الاصطناعي إلى خمسة مجالات للكفاءة، بدءًا من كفاءة البيانات. وكقاعدة عامة، فإن جعل تكنولوجيا المعلومات أكثر استدامة يتطلب منا بذل المزيد من الجهد بموارد أقل، وزيادة كفاءة النظام إلى الحد الأقصى للحصول على المزيد من المخرجات من موارد أقل. الركائز الخمس لتكنولوجيا المعلومات المستدامة التي أرشد عملائي من خلالها هي: كفاءة المعدات، وكفاءة الطاقة، وكفاءة الموارد، وكفاءة البرمجيات، وكفاءة البيانات.
على الرغم من أن معالجة كل مجال من مجالات الكفاءة تعمل على تحسين استدامة الذكاء الاصطناعي، نظرًا لطبيعة أعباء عمل الذكاء الاصطناعي كثيفة البيانات، تحتاج المؤسسات إلى البدء بتحسين مجموعات البيانات التي تغذيها في نماذج الذكاء الاصطناعي الخاصة بها.
كيفية التعامل مع كفاءة البيانات لأحمال عمل الذكاء الاصطناعي
قم بتخطيط إستراتيجية البيانات الخاصة بك مقدمًا: ابدأ بمعرفة البيانات التي تحتاجها، ومن أين ستأتي، وعدد المرات التي ستجمعها فيها، والعملية التي ستستخدمها للحصول على رؤى منها (على سبيل المثال، ما هي نماذج الذكاء الاصطناعي التي ستستخدمها)، وكيف سيتم استخدام البيانات يتم نقلها بين الأنظمة، وأين ومدة تخزينها. هل يمكن دمج البيانات أو التخلص منها أو تخزينها باستخدام تقنيات منخفضة التأثير، مثل الشريط أو طرق النسخ الاحتياطي الأخرى؟ غالبًا ما يمكن تفريغ البيانات التي لا تحتاج إلى استرجاعها على الفور إلى المزيد من الوسائط منخفضة الطاقة.
قم بالتنظيف قبل البدء: بالنسبة لأحمال العمل التقليدية، كانت كفاءة البيانات تعني أننا نركز فقط على تخزين البيانات التي كنا سنقوم بإنشاء قيمة تجارية لها. ولكن بالنسبة لأحمال عمل الذكاء الاصطناعي، يجب أن تكون مجموعات البيانات ذات حجم مناسب، وأن يتم تنظيفها وتحسينها بشكل مناسب قبل تدريب النموذج – لأنه عندما تستخدم ببساطة مجموعات البيانات أو المستودعات الجاهزة دون تقليلها قبل ضبط النموذج، ينتهي بك الأمر إلى القيام بأشياء غير ضرورية العمل وإنجاح حل الذكاء الاصطناعي أصعب.
احصل على مجموعة بيانات التدريب بشكل صحيح: يعد تحسين مجموعة البيانات في المقام الأول، قبل إجراء التدريب، جزءًا أساسيًا من استدامة الذكاء الاصطناعي، وبعد ذلك يمكنك استخدام البيانات المحددة لعميلك أثناء ضبط هذا النموذج أيضًا. من خلال البدء أولاً بكفاءة البيانات – والحصول على مجموعة البيانات هذه بإيجاز قدر الإمكان من المراحل المبكرة الأولى من العملية – فإنك تقود الكفاءة طوال الطريق.
معالجة البيانات مرة واحدة فقط: يجب معالجة البيانات المستخدمة للتدريب/الضبط مرة واحدة فقط، مع إجراء إعادة تدريب/ضبط إضافي للبيانات الجديدة التي يتم جمعها فقط
تجنب ديون البيانات: تصبح إدارة البيانات والحفاظ عليها أمرًا بالغ الأهمية بشكل خاص مع أعباء عمل الذكاء الاصطناعي لأنها تتطلب مثل هذه الكميات الهائلة من البيانات، بما في ذلك البيانات غير المنظمة. تتمثل إحدى طرق تخفيف الضغط على أنظمة تخزين البيانات في التخلص من البيانات غير الدقيقة أو الخاطئة أو القديمة أو المكررة. يصبح دين البيانات، مثل الدين الفني، مشكلة في أنظمة الذكاء الاصطناعي لأن نتائج الذكاء الاصطناعي تعتمد على البيانات التي يتم إدخالها في النماذج.
الموقع مهم: يجب معالجة البيانات في أقرب مكان ممكن من الموقع الأصلي لتقليل آثار الطاقة الناتجة عن الحركة وتوقيت المعلومات.