تقنية

ما هو جدول الحقائق؟


ما هو جدول الحقائق؟

في تخزين البيانات، جدول الحقيقة هو جدول قاعدة بيانات في نموذج الأبعاد. يقوم جدول الحقائق بتخزين المعلومات الكمية للتحليل. يقع الجدول في مركز النموذج البعدي، ويحيط به عدة أبعاد جداول الأبعاد. يحتوي كل جدول أبعاد على مجموعة من العناصر ذات الصلة صفات التي تصف الحقائق في جدول الحقائق. جنبا إلى جنب مع أبعاد، يوفر جدول الحقائق عرضًا موحدًا للبيانات الكمية وبيانات السمات، والتي تم تحسينها للاستعلام وإعداد التقارير و تحليلات.

يحتوي جدول الحقائق عادة على نوعين من الأعمدة: المقاييس و مفاتيح خارجية. تحتوي المقاييس على البيانات الكمية، وعادة ما تكون في شكل قيم رقمية. التدابير تمثل المفتاح مقاييس الأعمال – أو حقائق – عن أ عمليةأو حدث أو حالة. جدول الحقائق المفتاح الأساسي عادة ما يكون مركبًا من أعمدة المفاتيح الخارجية، على الرغم من أنه يمكن أن يكون أيضًا مفتاحًا بديلاً.

تنضم أعمدة المفاتيح الخارجية إلى جداول أبعاد متعددة وسماتها، مما يجعل من الممكن “تقسيم وتقطيع” بيانات المستودع عن طريق مجموعات سمات مختلفة للإجابة على أسئلة عمل محددة. على سبيل المثال، المفتاح المالكون في إحدى المؤسسات، قد ترغب في الإجابة على السؤال: “كم عدد العملاء الإناث في يوتا ونيفادا الذين تتراوح أعمارهم بين 42 إلى 62 عامًا اشتروا أحذية المشي لمسافات طويلة في مايو ويونيو 2023؟”

وأوضح مفاتيح قاعدة البيانات المشتركة.
هناك العديد من مفاتيح قاعدة البيانات الشائعة بما في ذلك المفتاح الأساسي والمفتاح المرشح والمفتاح الفائق والمفتاح الخارجي.

تخطيط مستودع البيانات

عادةً ما يتم وضع مستودع البيانات في ملف مخطط النجمة أو مخطط ندفة الثلج، مع وجود جدول الحقائق في المركز. يمكن أن يحتوي مستودع البيانات على جداول بيانات متعددة، لكن كل جدول من هذه الجداول لا يزال يقع في مركز الأبعاد الخاصة به.

تتيح السمات الوصفية الموجودة في جداول الأبعاد إمكانية تصفية الحقائق وتصنيفها وتلخيصها لاستخراج الإجابات عن أسئلة الأعمال الهامة. يوضح الشكل التالي مخططًا نجميًا بسيطًا يحتوي على جداول ذات أربعة أبعاد وجدول حقائق واحد.

ويكمن جدول الحقائق في قلب هذا الأمر نموذج البيانات. ويتضمن خمسة مقاييس (UnitPrice وSalesAmount وUnitsSold وPercentProfit وDailyInventory) بالإضافة إلى مفاتيح خارجية متعددة الرجوع إلى جداول الأبعاد. تتيح المفاتيح الخارجية إمكانية الوصول إلى سمات الأبعاد، التي تحتوي على معلومات حول العملاء والمنتجات والأقاليم والتواريخ المرتبطة بكل عملية بيع. ال بيانات المستودع يمكن تصفيته بواسطة أي مجموعة من السمات المتوفرة في جداول الأبعاد.

تشير أربعة من المفاتيح الخارجية إلى نفس بُعد التاريخ، مما يجعل من الممكن تقسيم البيانات حسب أي من تلك التواريخ. تحتوي بعض جداول الأبعاد، مثل dimTerritory وdimProduct، على بيانات هرمية، والتي يمكن تقسيمها إلى مقاطع أكثر تفصيلاً. على سبيل المثال، قد يطلب أصحاب المصلحة تقريرًا يوضح إجمالي المبيعات السنوية حسب نوع المنتج ومنطقة المبيعات. ونظرًا للطبيعة الهرمية للبيانات، سيكون بمقدورهم أيضًا التعمق لعرض إجماليات المبيعات للمنتجات الفردية والبلدان.

رسم تخطيطي نموذجي لمخطط نجمي مع جدول حقائق.
مخطط النجوم مع جداول الأبعاد الأربعة (الأزرق) وجدول الحقائق الواحد (الأخضر).

أنواع جداول الحقيقة

تخدم جداول الحقائق أغراضًا مختلفة وتعمل بحبوب مختلفة. تحدد الحبوب ما هو السجل في طاولة يجب أن تمثل في مستواها الذري. قد يتضمن الجدول سجلات لحبوب أخرى، مثل إجماليات المخزون، ولكن الغرض الأساسي للجدول هو استضافة السجلات بناءً على الحبوب المحددة. في المثال السابق، يمكن تحديد جودة جدول الحقائق على أنها “بيع منتج إلى عميل في وقت ومكان محددين”. يجب أن يعتمد تصميم جدول الحقائق على أقل قدر ممكن من الحبوب العملية.

غالبًا ما يتم تصنيف جداول الحقائق على أنها أحد الأنواع التالية:

  • المعاملات. هذا هو النوع الأساسي لجدول الحقائق والأكثر استخدامًا. يتم التعامل مع جودة الجدول عادةً كصف واحد لكل معاملة أو حدث. في المثال، جدول حقيقة المبيعات هو أ المعاملات جدول الحقائق. يسجل كل صف معاملة مبيعات واحدة.
  • لقطة دورية. يخزن جدول الحقائق لقطة من البيانات الأبعاد في فترة زمنية محددة، مثل التقاط إجماليات المبيعات الأسبوعية أو الشهرية.
  • لقطة متراكمة. يقوم جدول الحقائق بتخزين لقطات لعملية أو نشاط له بداية ونهاية محددة. على سبيل المثال، يمكن استخدام هذا النوع من جدول الحقائق لتتبع مكالمات الخدمة أو دورة معالجة الطلب.
قائمة بأدوار ومسؤوليات مهندس البيانات.
تعد أدوار ومسؤوليات مهندس البيانات رائعة وتشمل البحث والتقييم والتكامل والنشر والمراقبة والتعاون.

يمكن أن تتضمن جداول الحقائق أيضًا أنواع مختلفة من التدابير، التي توفر البيانات الكمية اللازمة للعثور على إجابات لأسئلة عمل محددة. يدعم جدول الحقائق ثلاثة أنواع من التدابير:

  • المضافة. يمكن إضافة المقياس عبر أي بعد. في المثال السابق، يمكن تلخيص عمود UnitsSold الخاص بجدول البيانات الفعلية استنادًا إلى العميل أو المنتج أو التاريخ أو المنطقة أو أي مجموعة منها. ونتيجة لذلك، يعتبر العمود مقياسًا إضافيًا. تعتبر التدابير الإضافية هي الأكثر شيوعًا والأسهل في التعامل معها.
  • غير المضافة. لا يمكن إضافة المقياس عبر أي أبعاد. في المثال، يقوم عمود PercentProfit بتخزين النسبة المئوية للربح على كل عملية بيع. إذا تمت إضافة هذه النسب المئوية عبر أحد الأبعاد، فقد ينتهي بك الأمر إلى إجماليات مثل 26000%. ونظرًا لأنه لا ينبغي إضافة النسب المئوية معًا، يعتبر العمود مقياسًا غير إضافي.
  • شبه المضافة. يمكن إضافة المقياس عبر بعض الأبعاد دون غيرها. في المثال، يحتفظ عمود DailyInventory بسجل لعدد المنتجات الموجودة في المخزون كل يوم. على الرغم من أنه من الممكن تجميع هذه الإجماليات للمنتجات والأقاليم، إلا أنه ليس من المنطقي جمعها معًا لبُعد dimDate. على سبيل المثال، إذا كان هناك 25 عنصر واجهة مستخدم في المخزون في 27 يوليو، و25 عنصر واجهة مستخدم في 28 يوليو، فهذا لا يعني أن هناك إجمالي 50 عنصر واجهة مستخدم في المخزون.

ومن الممكن أيضًا إنشاء جداول حقائق لا تحتوي على أي مقاييس. هذه الجداول، والتي يشار إليها بجداول الحقائق غير الحقيقية، هي في الأساس مجموعات من المفاتيح الخارجية التي تنضم إلى جداول الأبعاد. وحتى بدون التدابير، فإن هذا النوع من جدول الحقائق لا يزال ممكنًا تقديم معلومات مفيدة. على سبيل المثال، إذا لم يتضمن جدول الحقائق في المثال أي قياسات، فلا يزال من الممكن ربط العملاء والمنتجات والأقاليم والتواريخ معًا لتوفير صورة كاملة لجميع أحداث المبيعات، والتي يمكن تصفيتها عبر أي من الأبعاد.

عند تصميم جداول الحقائق وجداول الأبعاد المرتبطة بها، مهندسي البيانات ينبغي أن تأخذ في الاعتبار كلا من الاحتياجات الحالية والمستقبلية، وضمان ذلك التصميم مرن كافية لاستيعاب متطلبات العمل المتغيرة دون الحاجة إلى إعادة بناء المستودع.

يقيم خيارات نشر مستودع البيانات وحالات الاستخدام. اكتشف ال الاختلافات بين جداول الأبعاد وجداول الحقائق. تفحص ال إيجابيات وسلبيات مستودعات البيانات المحلية مقابل مستودعات البيانات السحابية. أقرأ عن تحديات تكامل البيانات وكيفية التغلب عليها وانظر كيف تطوير استراتيجية بيانات المؤسسة.



Source link

زر الذهاب إلى الأعلى