أخبار التقنية

يضع Falcon-H1 Arab من معهد دراسات الترجمة معيارًا عالميًا للذكاء الاصطناعي العربي


كشف معهد أبوظبي للإبتكار التكنولوجي (TII) عن فالكون-H1 عربيوهو نموذج لغوي كبير يرسخ مكانته كنظام الذكاء الاصطناعي العربي الرائد على مستوى العالم، مما يعزز طموح دولة الإمارات العربية المتحدة للتنافس مع القادة العالميين في مجال الذكاء الاصطناعي عالي الأداء.

تم تطويره بواسطة معهد دراسات الترجمة، ذراع الأبحاث التطبيقية في أبوظبي مجلس أبحاث التكنولوجيا المتقدمة (ATRC)، يمثل Falcon-H1 Arab تحولًا معماريًا أساسيًا عن نماذج Falcon السابقة. بدلاً من الاعتماد فقط على تصميمات المحولات التقليدية، تم بناء النموذج على بنية Mamba-Transformer الهجينة، مما يتيح دقة أعلى بشكل كبير وقدرة على التفكير أثناء التشغيل بأحجام معلمات أصغر.

ووفقا لمعهد دراسات الترجمة، فقد حقق هذا التغيير المعماري نتائج فورية. يتصدر Falcon-H1 Arab الآن قائمة المتصدرين العربية المفتوحة LLM (OALL)، حيث يتفوق في الأداء على النماذج العربية ومتعددة اللغات عدة مرات من حجمه عبر نطاق واسع من فهم اللغة والتفكير والمعايير الثقافية.

يمثل هذا الإنجاز علامة فارقة ليس بالنسبة لمعهد دراسات الترجمة فحسب، بل أيضًا لتطوير الذكاء الاصطناعي باللغة العربية على نطاق أوسع. لقد تخلفت نماذج اللغة العربية عالية الجودة تاريخياً عن نظيراتها في المملكة المتحدة، وغالباً ما كانت مقيدة بمجموعات البيانات المحدودة، وتغطية اللهجات الأضعف، وانخفاض الأداء المنطقي. يهدف Falcon-H1 Arab إلى سد هذه الفجوة بشكل حاسم.

وقال فيصل البناي، مستشار رئيس دولة الإمارات العربية المتحدة والأمين العام لـ ATRC: “يعكس هذا التزامنا المستمر بتعزيز مكانة دولة الإمارات العربية المتحدة كمركز عالمي للتكنولوجيا المتقدمة والذكاء الاصطناعي المسؤول”. “من خلال تقديم نماذج تدعم الاحتياجات اللغوية والثقافية للمنطقة، فإننا نمكن الابتكار الذي يمكن الوصول إليه وذو صلة ومؤثر عبر مجتمعاتنا.”

ويقول معهد دراسات الترجمة إن النماذج تقدم تحسينات كبيرة في جودة البيانات، وتغطية اللهجات، واستقرار السياق الطويل، والتفكير الرياضي. تُترجم هذه التحسينات إلى فهم أكثر موثوقية ودقة للغة العربية لحالات الاستخدام في العالم الحقيقي، بما في ذلك تحليل المستندات والذكاء الاصطناعي للمحادثة ومنصات التعليم وإدارة المعرفة المؤسسية.

وقالت نجوى أعرج، الرئيس التنفيذي لمعهد دراسات الترجمة: “من خلال تطوير البنية وجودة البيانات والتفكير طويل السياق، نقوم بإنشاء عوامل تمكين تفتح إمكانيات جديدة في التعليم والرعاية الصحية والحوكمة والمؤسسات، كل ذلك باللغة العربية”. “يمثل هذا النموذج خطوة مهمة في مهمتنا لتقديم ذكاء اصطناعي عالمي المستوى يخدم المنطقة ويساهم في التقدم العالمي.”

وتؤكد النتائج المعيارية حجم قفزة الأداء. وفقًا لمعيار OALL، الذي يقيم النماذج العربية عبر مجموعة واسعة من المهام اللغوية والاستدلالية، يُظهر Falcon-H1 Arab قيادة واضحة في جميع الأحجام. يحقق نموذج 3B متوسط ​​درجة 61.87%، متفوقًا على منافسي 4B الرائدين بأكثر من 10 نقاط. ويتفوق الطراز 7B على كافة الطرازات، بما في ذلك الأنظمة التي تم تطويرها في قطر والمملكة العربية السعودية.

التقدم الرئيسي الآخر هو التوسع الكبير في طول السياق. يدعم Falcon-H1 Arab نوافذ سياقية تصل إلى 256000 رمز مميز، مما يتيح تحليل العقود القانونية الطويلة أو السجلات الطبية أو البحث الأكاديمي أو وثائق المؤسسة في تفاعل واحد دون فقدان التماسك.

وقال حكيم حامد، كبير الباحثين في مركز الذكاء الاصطناعي والأبحاث الرقمية التابع لمعهد دراسات الترجمة: “من خلال تحسين الكفاءة وعمق الفهم والتغطية اللغوية، نقوم بتمكين أنظمة الذكاء الاصطناعي التي يمكنها دعم المؤسسات والمطورين والمجتمعات في جميع أنحاء المنطقة بشكل أفضل”.

منذ عام 2023، تم تصنيف طرازات فالكون من طراز TII باستمرار في أعلى المعايير الإقليمية والدولية. ومع ريادة Falcon-H1 Arab الآن في جميع أحجام الطرازات العربية، تثبت دولة الإمارات العربية المتحدة أن تطوير الذكاء الاصطناعي السيادي يمكن أن يتنافس على أعلى مستوى دولي، مع تلبية الاحتياجات اللغوية والثقافية والتشغيلية المحددة للمستخدمين الناطقين باللغة العربية.

ويؤكد الإطلاق أيضًا على استراتيجية أبوظبي الأوسع نطاقًا لتصبح مركزًا لأبحاث الذكاء الاصطناعي عالية الأداء، وإنشاء أدوات يمكنها تعزيز كفاءة المؤسسات، والابتكار في القطاع العام، والتقدم التعليمي في جميع أنحاء المنطقة. يمثل Falcon-H1 Arab فصلاً جديدًا في الذكاء الاصطناعي العربي، حيث يجمع بين الأداء العالمي والأهمية الثقافية والاستعداد للنشر العملي، وهي خطوة يمكن أن تسرع اعتماد الذكاء الاصطناعي في دولة الإمارات العربية المتحدة وفي جميع أنحاء الشرق الأوسط.



Source link

زر الذهاب إلى الأعلى