مقابلة تنفيذية: إضافة الحس السليم إلى إبداع الذكاء الاصطناعي التوليدي
هناك علاقة صحية بين نماذج اللغات الكبيرة (LLMs) وقواعد البيانات الرسومية، والتي تُستخدم لسحب المعلومات عبر شبكات البيانات المختلفة، وفقًا لـ جيم ويبر، كبير العلماء في Neo4j.
تحدثت مجلة Computer Weekly إلى Webber بعد التصديق على اتفاقية معيار جي كيو إل آيزو، والذي يوفر طريقة قياسية لإجراء عمليات البحث عبر قواعد بيانات الرسم البياني ويشبه معيار SQL-86 ISO لأنظمة إدارة قواعد البيانات العلائقية.
تتبع قواعد بيانات الرسم البياني نهجًا مختلفًا تمامًا في استعلامات البيانات عن قواعد البيانات العلائقية. عمل ويبر مع قواعد بيانات الرسم البياني لمدة 16 عامًا تقريبًا، 14 منها كانت مع Neo4j. بينما يرى دورًا لقواعد البيانات العلائقية، فإن نقطة ويبر الرئيسية هي أن أداء وقت التشغيل في قاعدة البيانات العلائقية يتدهور.
الفكرة الأساسية وراء نظام قاعدة البيانات العلائقية هي تنظيم البيانات بطريقة موجهة نحو الصف وربط أصول البيانات معًا باستخدام “الصلات” لربط الصفوف في جدول قاعدة بيانات واحد مع صفوف في جدول آخر لتكوين علاقة بين الاثنين. المثال البسيط هو الصف الذي يحدد مرجع العميل الفريد في جدول واحد ويرتبط بتفاصيل الاتصال الخاصة بالعميل الموجودة في جدول آخر.
يقول: “من المفارقات أن قواعد البيانات العلائقية سيئة في عمليات الصلات”. يقول ويبر: “هذا هو الشيء الوحيد الذي لا تريد القيام به في قاعدة بيانات علائقية لأنك تفعله في وقت التشغيل في الجزء المكلف من النظام”.
ويشير إلى أن السبب في ذلك هو أن الصلات يتم تشغيلها بشكل فعال في الذاكرة وتحدث عندما يقوم تطبيق أو مستخدم بتشغيل استعلام يتطلب استجواب جداول قاعدة بيانات متعددة.
ومع ذلك، على الرغم من عدم الكفاءة الواضحة، فإن قواعد البيانات العلائقية هي منصة البيانات الأساسية للعديد من تطبيقات المؤسسات.
“تمكنك شبكات الرسم البياني من النمذجة [messy data] بطريقة عالية الدقة دون المعاناة من الألم والتعقيد الناتج عن الاضطرار إلى إنشاء جداول ومخططات معقدة والقيام بعمليات الانضمام في وقت التشغيل”
جيم ويبر، Neo4j
ويضيف: “في الأيام الخوالي، كان من المنطقي في الغالب استخدام قواعد البيانات العلائقية، لأن جميع البيانات كانت متطابقة”. يشير ويبر إلى حقيقة أن شيئًا مثل نظام كشوف المرتبات يحتوي على آلاف مثيلات البيانات المنسقة بشكل مماثل لآلاف الموظفين.
ويقول: “كان العالم الذي عشنا فيه في الثمانينيات موحدًا، وكان العالم الذي عشنا فيه في التسعينيات موحدًا في الغالب، لذلك كان من المنطقي تمامًا استخدام قاعدة بيانات علائقية”.
ولكن مع الانفجار الكبير الذي شهدته الأنظمة في الآونة الأخيرة، يقول ويبر إن البيانات أصبحت أكثر فوضوية. ويقول: “تمكنك شبكات الرسم البياني من تصميم تلك الفوضى بطريقة عالية الدقة دون التعرض لنوع من ألم “قنبلة الانضمام” والتعقيد الناتج عن الاضطرار إلى إنشاء جداول ومخططات معقدة وإجراء عمليات ربط في وقت التشغيل”.
الثقة في جي كيو إل
ويعتقد ويبر حديثا اعتماد معيار ISO للغة الاستعلام البيانية (GQL) يمثل نقطة انعطاف هامة للتكنولوجيا. معيار الأيزو ل لغة الاستعلام المنظمة (SQL)تم نشره، والذي يسمى SQL-86، في عام 1986.
مستذكرًا أهمية المعيار، يقول ويبر إنه كان “يبرمج ZX Spectrum في تلك المرحلة”، لذا فإن “SQL لم تكن تعني شيئًا بالنسبة لي” في ذلك الوقت. لكن معيار SQL-86 حسم الجدل الذي بدأ في السبعينيات حول كيفية إدارة قواعد البيانات. قام إدغار كوب، أثناء عمله في شركة IBM، بتطوير نموذج قاعدة البيانات العلائقية. إن معيار SQL – الذي اعتمده المعهد الأمريكي الوطني للمعايير (ANSI) في عام 1986 والمنظمة الدولية للمعايير (ISO) في عام 1987 – أعطى مطوري التطبيقات ومشتري برامج المؤسسات الثقة لاستخدام قواعد البيانات العلائقية.
وقد خسر الاقتراح البديل، وهو قاعدة بيانات الشبكة، التي طورها تشارلز باشمان. لكن نهج باشمان، وفقًا لويبر، هو مقدمة قديمة لقواعد بيانات الرسوم البيانية.
وهو يعتقد أن المعايير مهمة عندما يتعين على صناع القرار في مجال تكنولوجيا المعلومات القيام بالرهانات على التكنولوجيا. “يشعر مدراء تكنولوجيا المعلومات بالتوتر لأنه إذا قمت باستثمار كبير في نظام ما، فإنك لا تريد أن تكون مقيدًا أو تجد أن النظام ليس له مستقبل وأنك دعمت الحصان الخطأ. إنه تشبيه VHS مقابل Betamax. أعتقد أن لغة SQL أعطت دفعة كبيرة في سوق برمجيات التطبيقات لأنها أخبرت الجميع أن تكنولوجيا قواعد البيانات العلائقية ناضجة وآمنة.
وفقًا لـWeber، فإن معيار ISO GQL، مثل SQL-86، يحمي مشتري تكنولوجيا المعلومات من اتخاذ قرارات تجارية سيئة. على الرغم من وجود لهجات مختلفة لـ SQL، إلا أن بناء الجملة الأساسي يظل كما هو. وينبغي أن ينطبق الشيء نفسه على GQL.
ويقول: “من حيث المبدأ، يمكنك دائمًا تبديل البائعين لأن لغتك ستبقى كما هي”. “إن التعلم الإضافي الذي يتعين علي القيام به للتخصص في نظام إدارة قواعد البيانات العلائقية مثل SQL Server أو Oracle هامشي.”
الذكاء الاصطناعي الفطرة السليمة
قام المحلل جارتنر مؤخرًا بوضع الرسوم البيانية المعرفية في مركز رادار التأثير الخاص به الذكاء الاصطناعي التوليدي (GenAI).
“قواعد بيانات الرسم البياني هي الرسوم البيانية المعرفيةيقول ويبر: “إنها شبكة من الحقائق التي توفر التوازن الأنسب لـ GenAI”. إذا كان GenAI يشبه الجانب الأيمن الإبداعي من الدماغ، فإنه يشعر أن الرسوم البيانية تشبه الجانب الأيسر، الذي يركز أكثر على التفكير.
جيم ويبر، Neo4j
“لديك محرك احتمالي في الذكاء الاصطناعي التوليدي. أنا أحبه. أعلم أنه روبوت، لكنه لا يزال يبدو خطيرًا للغاية، وهو قريب بشكل رائع من الحصول على شرارة الخيال تلك. “لكن هذه الشرارة تحتاج إلى التخفيف، وقد تبين أن الرسوم البيانية المعرفية جيدة بشكل خاص في هذا، وذلك باستخدام نهج يسمى الرسم البياني RAG.” هذا هو المكان الذي توفر فيه قاعدة بيانات الرسم البياني معلومات سياقية لـ LLMs.
“ربما تكون هذه هي أفضل طريقة نعرفها للحصول على أفضل النتائج من الذكاء الاصطناعي التوليدي، مع منع تسرب الأكاذيب والأشياء المضللة إلى المستخدم النهائي. إنه الدماغ الأيسر الذي يعمل مع الدماغ الأيمن.
أثناء المناقشة، يتحدث ويبر عن مثال تمت الإشارة إليه خلال أ تبث الإذاعة الوطنية العامة (NPR). حيث سأل أحد باحثي الذكاء الاصطناعي طالبة ماجستير في القانون عن المدة التي سيستغرقها تجفيف قميصين على حبل الغسيل الخاص بها، إذا استغرق تجفيف أحدهما ثلاث ساعات. من الواضح أن الإجابة هي ثلاثة، ولكن قد يستنتج حامل LLM أن القميصين سيستغرقان ضعف الوقت.
يقول ويبر: «يمكنك إيقاف تسرب هذه الأكاذيب عن طريق وضع خريطة المتجهات في الرسوم البيانية المعرفية، والتي يمكن اجتيازها».
على سبيل المثال، يقول إنه عند تقديم كلمة “تفاحة”، قد يرغب المستخدم في أن يفهم نظام الذكاء الاصطناعي أن التفاحة المعنية هي الشركة الموجودة في كوبرتينو التي تصنع أجهزة iPod وiPhone. باستخدام الرسوم البيانية، يقول: “يمكنك اجتياز شبكة غنية من الحقائق حول شركة أبل، شركة التكنولوجيا. إنها ليست التفاحة، الفاكهة، ولا شركة أبل، شركة تسجيلات البيتلز. في الواقع، تطبق قاعدة بيانات الرسم البياني مستوى من المنطق السليم على LLM، والذي، بناءً على السياق، يساعد في توجيه إجاباتها إلى الإجابات الأكثر منطقية.
يقول ويبر: “عندما تكون لديك شبكة من الحقائق لتستغلها، لا يوجد نموذج بيانات آخر يمنحك شبكة الحقائق هذه”. “في الوقت الحاضر، الطريقة التي يمكنك من خلالها استغلال شبكة الحقائق هذه هي كتابة كود الاستعلام في SQL.”
ولكن بالنظر إلى أوجه القصور التي تحدث عنها ويبر في استخدام SQL لإجراء عمليات ربط عبر مصادر بيانات متعددة، فإن تشغيل GQL على الرسم البياني المعرفي قد يكون الطريقة التي يتعلم بها الذكاء الاصطناعي المنطق السليم من الآن فصاعدا.