تطلق DataStax GenAI داخل الشركة بتنسيق “متقارب للغاية”.
مقرها تكساس DataStax أطلقت منصة البيانات فائقة التقارب (HCDP) كعرض جاهز لعملاء المؤسسات الذين يرغبون في إنشاء قواعد بيانات متجهة لـ الذكاء الاصطناعي التوليدي الداخلي (جيناي).
ثلاثة أبعاد عبارة عن تمثيلات رياضية للمفاهيم والكلمات والصور التي تستخدمها أنظمة GenAI للسماح للأسئلة والمقارنات بين مجموعات البيانات بتقديم نتائج ثاقبة.
يهدف HCDP إلى السماح للشركات ببناء منصات GenAI في مراكز البيانات الخاصة بها حتى يتمكنوا من استخدام التكنولوجيا في بياناتهم الخاصة. جزء لا يتجزأ من الافراج هي خدمات نفيديا الصغيرة والجيل المعزز للاسترجاع (RAG) القدرة.
إن HCDP ليس بنية تحتية شديدة التقارب بمعنى أنه جهاز أو برنامج تخزين وخادم مدمج، ولكن المقصود من DataStax أن يتم نشره بشكل افتراضي وافتراضي في بيئة العميل.
بدأت DataStax في عام 2010، وهي متجذرة في قاعدة بيانات NoSQL فضاء. كما أنها توفر قاعدة بيانات Astra DB المستندة إلى السحابة كخدمة وDataStax Enterprise (DSE) لعمليات النشر داخل الشركة. يأتي الإصدار 6.9 من DSE جنبًا إلى جنب مع إطلاق HCDP. تم بناء كل من Astra DB وDSE على قاعدة بيانات Apache Cassandra NoSQL.
وقال بيل ماكلين، كبير مسؤولي التكنولوجيا السحابية في DataStax، إن HCDP يستهدف العملاء الذين يرغبون في بناء البنية التحتية الخاصة بهم لـ GenAI داخل الشركة.
وقال: “يجمع HCDP بين إمكانات الذكاء الاصطناعي والبحث المتجهي لأعباء عمل بيانات المؤسسة المُدارة ذاتيًا”. “لذا، فإن الشركات التي ترغب في تقديم خدمات ذكاء اصطناعي توليدية ولكنها لا ترغب في العمل في السحابة يمكنها تحقيق نفس أنواع الأهداف التي يمكن أن تحققها الخدمات السحابية.”
وقال ماكلين إن المنتج يستهدف الشركات التي ترغب في تشغيل مراكز البيانات الخاصة بها وضمان التحكم الكامل في كيفية استخدام البيانات في GenAI.
وقال ماكلين: “مع تطبيق هذا، يمكن للشركات استخدام الذكاء الاصطناعي التوليدي مع بياناتها الخاصة ونماذج اللغة الكبيرة، ولكن دون تسليم تلك البيانات إلى طرف ثالث حيث لا يكون لها سيطرة على كيفية استخدام تلك البيانات في الممارسة العملية”.
يستخدم HCDP إمكانات البحث والتصور في OpenSearch، بالإضافة إلى Apache Pulsar، وهو نظام أساسي للرسائل يستخدم لبناء خطوط أنابيب البيانات، وتحميل البيانات وتوزيعها.
وقال ماكلين إن جوهر وظيفة HCDP وDataStax هو استخدام المتجهات في GenAI. وأوضح أن “أنظمة الذكاء الاصطناعي التوليدية تجمع البيانات معًا استجابةً للأسئلة المحتملة بناءً على استعلامات بحث المتجهات”. “يتم تحويل هذه الاستعلامات إلى متجهات – تمثيلات رياضية للكلمات أو المفاهيم المعنية – ثم تتم مقارنتها بالمجموعة الحالية من البيانات المتجهة التي تمتلكها الشركة. يتم بعد ذلك تقديم هذه المعلومات مرة أخرى إلى نموذج اللغة الكبير واستخدامها لإعداد الرد مرة أخرى للمستخدم.
يمكن تحويل أي بيانات إلى متجهات – كتالوجات المنتجات أو سجلات العملاء السابقة أو غيرها من سجلات البيانات غير المنظمة – ويمكن تخزينها جاهزة للبحث.
يمكن للعملاء الذين يرغبون في استخدام بياناتهم الخاصة في نظام GenAI الذي يستخدم قاعدة بيانات متجهة إلى جانب قاعدة بيانات المعاملات الخاصة بهم دفق البيانات الجديدة لإنشاء بيانات المتجهات وتحديثها.
يمكن أن يناسب هذا الشركات التي ترغب في الاحتفاظ بالتحكم في بياناتها لأسباب تتعلق بالامتثال والأمن، أو تلك التي لديها بالفعل عمليات تثبيت كبيرة لقواعد البيانات، على سبيل المثال، لا تريد ترحيل تلك البيانات إلى السحابة للتكلفة.