أخبار التقنية

الذكاء الاصطناعي التوليدي: Databricks تكشف عن نموذج لغة كبير مفتوح المصدر


شركة البيانات والذكاء الاصطناعي (AI). طوب البيانات كشفت النقاب عن DBRX، للأغراض العامة نموذج اللغة الكبير (LLM) التي تدعي أنها يمكن أن تتفوق على النماذج مفتوحة المصدر الأخرى.

وقالت الشركة إن DBRX يتفوق في الأداء على LLMs مفتوحة المصدر مثل Llama 2 70B و ميكسترال-8x7B على معايير الصناعة بما في ذلك فهم اللغة والبرمجة والرياضيات والمنطق.

وقالت الشركة: “تضفي DBRX طابعًا ديمقراطيًا على تدريب وضبط حاملي شهادات LLM المخصصة عالية الأداء لكل مؤسسة، بحيث لم تعد بحاجة إلى الاعتماد على عدد قليل من النماذج المغلقة”.

وقال علي قدسي، المؤسس المشارك والرئيس التنفيذي لشركة Databricks، إن DBRX يمكّن الشركات من بناء “قدرات تفكير مخصصة بناءً على بياناتها الخاصة”. لأن DBRX يدق جي بي تي-3.5 فيما يتعلق بمعظم المعايير، قال إنه ينبغي تسريع الاتجاه الذي تشهده Databricks عبر عملائها – وهو قيام المؤسسات باستبدال النماذج الخاصة بنماذج مفتوحة المصدر.

وقالت Databricks إن DBRX يتفوق على GPT-3.5 في فهم اللغة (MMLU)، والبرمجة (HumanEval)، والرياضيات (GSM8K).

تم تطوير DBRX بواسطة Mosaic AI وتم تدريبه على Nvidia DGX Cloud. قامت Databricks بتحسين DBRX لتحقيق الكفاءة من خلال بنية مزيج من الخبراء (MoE)، المبنية على مشروع MegaBlocks مفتوح المصدر. وقالت الشركة إن النموذج الناتج يتمتع بكفاءة حوسبة تصل إلى الضعف مقارنة ببرامج LLM الرائدة الأخرى المتاحة.

DBRX متاح على GitHub وHugging Face للبحث والاستخدام التجاري. على منصة Databricks، يمكن للمؤسسات التفاعل مع DBRX وبناء نماذج DBRX مخصصة على بياناتها الفريدة. DBRX متاح أيضًا على Amazon Web Services (AWS) وGoogle Cloud، وكذلك مباشرة على Microsoft Azure من خلال Azure Databricks. ومن المتوقع أيضًا أن يكون DBRX متاحًا من خلال Nvidia Catalog API ومدعومًا على خدمة Nvidia NIM الصغيرة للاستدلال.

على الرغم من أن النموذج مفتوح المصدر، إلا أن Databricks تقدم أيضًا خدمات من حوله لمساعدة المؤسسات على بناء ونشر تطبيقات الذكاء الاصطناعي (GenAI) عالية الجودة.

“سيكون هذا أفضل نموذج مفتوح المصدر على الإطلاق – فهو يفوق GPT-3.5 من حيث الجودة وهو مفتوح المصدر تمامًا”

نافين راو، Databricks

قال نافين راو، “سيكون هذا أفضل نموذج مفتوح المصدر على الإطلاق – فهو يتفوق على GPT-3.5 من حيث الجودة وهو مفتوح المصدر تمامًا، والأكثر من ذلك، لقد ابتكرنا في البنية الحاسوبية لهذا النموذج”. نائب رئيس GenAI في Databricks.

وقال راو إن بنية مزيج الخبراء المستخدمة في النموذج تشبه وجود 16 نموذجًا في نموذج واحد.

“عندما تستعلم عن النموذج وتقول، “أنشئ هذا الناتج”، فإن الأمر يتطلب مجموعة فرعية – أربعة منها – لإنشاء الاستجابة. وهذا مفيد لأنك تنشر المعرفة بين الخبراء المختلفين ويكون لديك هذا التوجيه المستفادة الذي يحدد أن “هؤلاء الخبراء هم من يستعلمون عن هذه الاستجابة”.

“يمكننا الحصول على السرعة وزمن الوصول لنموذج صغير بقدرات نموذج أكبر بكثير. وهذا شيء سريع للغاية، بسبب بنيته الحاسوبية. إنه مفتوح المصدر بالكامل، [so] يمكن للشركات أن تأخذ هذا النموذج، ويمكنها البناء عليه، وضبط النموذج، كما أنها تمتلك أوزان النموذج – وهذا جزء مهم هنا. وقال لـ Computer Weekly: “إنهم يحصلون على أفضل الاقتصاديات مقابل الجودة”.

يجب أن يسمح كونك مفتوح المصدر للعملاء بالشعور براحة أكبر بشأن مشاركة بياناتهم لأن لديهم سيطرة أكبر على النموذج مقارنة بالنموذج المغلق المصدر.

“نحن نؤمن بعالم تستطيع فيه الشركات بناء الملكية الفكرية [intellectual property] لأغراضهم ويمارسون تلك الملكية الفكرية كيفما يريدون. إن القدرة على ضبط النموذج وتقديمه خلف جدار الحماية الذي لا يمكنك الوصول إليه مطلقًا لا يعد إنشاء IP. وقال راو: “هذا في الواقع إنشاء IP لموفر النموذج”.

وأضاف راو أن الصناعات الخاضعة للتنظيم مترددة في استخدام بياناتها الأكثر أهمية وحساسية لتدريب نماذج الملكية، ويرجع ذلك جزئيا إلى أنها لا تملك السيطرة.

وأضاف أن جعل النموذج مفتوح المصدر يمنح عملاء المؤسسات حافزًا لاستخدامه عبر مجموعة متنوعة من حالات الاستخدام. وقال: “إن فكرة قابلية النقل بأكملها مهمة جدًا، ومن الصعب جدًا القيام بذلك إذا لم تكن مفتوحة المصدر”.

وقال إنه إذا كان العملاء قادرين على أخذ النموذج في مكان آخر، فإن ذلك يمنح Databricks الحافز لإضافة قيمة لعملائها مع منحهم المرونة التي يحتاجون إليها.

تم تضمينه في إعلانات Databricks كانت تعليقات من العملاء، بما في ذلك Zoom، والتي قالت إنها تتطلع إلى “تقييم إمكانات DBRX لجعل التدريب وخدمة نماذج الذكاء الاصطناعي التوليدية المخصصة أسرع وأكثر فعالية من حيث التكلفة لحالات الاستخدام الأساسية لدينا”.

وقال مايك أورورك، رئيس قسم الذكاء الاصطناعي وخدمات البيانات في ناسداك: “إن الجمع بين أداء النموذج القوي واقتصاديات الخدمة المواتية هو نوع الابتكار الذي نبحث عنه بينما نعمل على تنمية استخدامنا للذكاء الاصطناعي التوليدي في ناسداك”.

من الممكن أنه بعد فترة من هيمنة عدد صغير من الشركات، قد يكون سوق GenAI للمؤسسات قد بدأ يتغير.

Databricks هي واحدة من عدد من الشركات، الكبيرة والصغيرة، بما في ذلك Meta (Llama 2)، وGoogle (Gemma)، وxAI (Grok)، وMistral AI، وHugging Face وغيرها، التي تقدم خيارات GenAI متعددة مفتوحة المصدر.

وفقا لشركة رأس المال الاستثماري (VC). أندريسن هورويتز، استحوذت أدوات GenAI مغلقة المصدر على 80% إلى 90% من السوق العام الماضي، وذهبت غالبية الحصة إلى OpenAI. لكن أبحاثها وجدت أن نصف المديرين التنفيذيين للشركات الذين تحدثت إليهم يفضلون الآن النماذج مفتوحة المصدر.

وقالت شركة رأس المال الاستثماري: “في عام 2024 وما بعده، تتوقع الشركات تحولًا كبيرًا في الاستخدام نحو المصادر المفتوحة، مع استهداف البعض صراحةً تقسيمًا بنسبة 50/50 – ارتفاعًا من التقسيم المغلق بنسبة 80٪ / 20٪ مفتوح في عام 2023”.

وقالت إنه في حين أن الشركات لا تزال مهتمة بتخصيص النماذج، مع ظهور نماذج مفتوحة المصدر عالية الجودة، فإن معظمها يختار استخدام توليد الاسترجاع المعزز (RAG) أو ضبط نموذج مفتوح المصدر.

في حين أن التأثير الحقيقي لـ GenAI لا يزال غير واضح، فقد وجدت دراسة حديثة أن الذكاء الاصطناعي يمكن أن يساعد في أتمتة مجموعة واسعة من العمل الذي تقوم به موظفي الخدمة المدنية عبر مئات الخدمات الحكومية. ووجد استطلاع آخر ذلك لقد استثمر 80% من قادة الأعمال في شكل ما من أشكال الذكاء الاصطناعي في عام 2023، لكنه قال إن أكبر العوائق التي تحول دون إعداد القوى العاملة للذكاء الاصطناعي تشمل الافتقار إلى الخبرة التنظيمية، وتشكك الموظفين، ونقص التنظيم.



Source link

زر الذهاب إلى الأعلى