تقنية

ما هو البعد؟ | تعريف من TechTarget


ما هو البعد في تخزين البيانات؟

في تخزين البيانات، البُعد عبارة عن مجموعة من المعلومات المرجعية التي تدعم حدثًا قابلاً للقياس، مثل العميل عملية. وفي هذا السياق، يشار إلى الأحداث باسم “الحقائق”. توفر الأبعاد التفاصيل اللازمة لفهم وتحليل مجموعة من الحقائق المترابطة.

على سبيل المثال، قد يتضمن مستودع البيانات مجموعة من الحقائق حول مبيعات منتجات الشركة. كل عملية بيع هي حقيقة تعكس المنتج الذي تم بيعه، ومتى تم بيعه، ومن اشترى المنتج، وكم تكلفته والمعلومات الأخرى ذات الصلة.

تدعم الأبعاد هذه الحقائق من خلال توفير المعلومات الأساسية اللازمة لفهم كل عملية بيع. قد يتضمن مستودع البيانات أبعادًا حول المنتجات والعملاء ومناطق المبيعات والتواريخ التي وقعت فيها أحداث مختلفة، مثل وقت طلب المنتج أو شحنه.

تقوم الأبعاد بتصنيف ووصف الحقائق ومقاييسها بطرق تدعم الإجابات ذات المغزى للأعمال الاستعلامات. أنها بمثابة اللبنات الأساسية لتطوير نموذج البيانات مما يسهل التحليل الفعال للبيانات التاريخية. ولتحقيق هذه الغاية، توفر الأبعاد الأسس الهيكلية اللازمة لفهم مجموعة من الحقائق.

ما هي الأبعاد والحقائق في مستودع البيانات؟

يقوم مستودع البيانات بتنظيم الأبعاد إلى أبعاد ذات صلة صفات التي يتم تنفيذها كأعمدة في جداول الأبعاد. على سبيل المثال، قد يتضمن بُعد العميل سمات مثل الاسم الأول واسم العائلة وعنوان البريد الإلكتروني وتاريخ الميلاد والجنس. وفي الوقت نفسه، قد يتضمن بُعد المنتج سمات مثل اسم المنتج ووصف المنتج ونوع المنتج.

يوضح الشكل التالي (1) مستودع بيانات بسيطًا يتضمن هذين البعدين ويضيف بعدي المنطقة والتاريخ. ال جدول الحقائق (factSales) يقوم بدمج كافة المعلومات المتعلقة بحقائق المبيعات من خلال الرجوع إلى الأبعاد ذات الصلة.

رسم تخطيطي لمستودع بيانات بسيط ذو بعدين
الشكل 1: مستودع بيانات بسيط يشتمل على بعدين مع أبعاد المنطقة والتاريخ.

يحتوي جدول الأبعاد على المفتاح الأساسي العمود الذي يحدد بشكل فريد كل سجل البعد (الصف). يستخدم جدول الحقائق المفتاح للإشارة إلى البيانات الموجودة في جدول الأبعاد. وبهذه الطريقة، تحتوي الحقائق على المعلومات التي تحتاجها لتقديم صورة كاملة عن كل حدث.

يمكن تصفية البيانات الموجودة في جدول الحقائق وتجميعها (“مقطعة ومكعبات“) من خلال مجموعات مختلفة من سمات الأبعاد. على سبيل المثال، يمكن لشخص ما الاستعلام عن حقيقة المبيعات وأبعادها للحصول على إجابة للسؤال: “كم عدد العملاء الذكور في واشنطن وأوريجون الذين تتراوح أعمارهم بين 19 إلى 25 عامًا الذين اشتروا سترات مطر خلال الأسبوع الأخير من شهر أكتوبر 2022؟” لاسترداد هذه المعلومات، سينضم الاستعلام إلى بيانات في جدول الحقائق للبيانات في الأبعاد المشار إليها: العميل والإقليم والمنتج والتاريخ.

تحتوي العديد من الأبعاد على تسلسل هرمي للسمات التي تدعم التنقل لأعلى ولأسفل. على سبيل المثال، يحتوي بُعد التاريخ في المثال أعلاه على تَسَلسُل السنة > الربع > الشهر > الأسبوع > التاريخ. يمكن أن ينتقل التقرير الذي يعرض عدد المبيعات في عام 2022 حسب الأسبوع لعرض المبيعات حسب الشهر أو الانتقال إلى التواريخ الفردية.

عادةً ما يتم وضع الأبعاد ذات الصلة في مستودع البيانات في ملف مخطط النجمة أو مخطط ندفة الثلج، مع وجود جدول الحقائق في المركز. يوضح الشكل أعلاه مخططًا نجميًا صغيرًا يرتبط جدول الحقائق المركزي فيه بجداول الأبعاد المتعددة ذات الصلة. البيانات الموجودة في الأبعاد هي غير طبيعي لتجنب الحمل الزائد للاستعلام الذي يأتي مع مخطط تم تسويته بدرجة كبيرة. يمكن لأي شخص الاستعلام عن جدول البيانات الفعلية وجداول الأبعاد دون الحاجة إلى الانضمام إلى أي جداول تتجاوز جداول الأبعاد الأساسية، مما يساعد على تقليل تعقيد الاستعلام وزيادة الأداء.

يعمل مخطط ندفة الثلج على توسيع مخطط النجمة من خلال ضم واحد أو أكثر من جداول الأبعاد إلى أبعاد أخرى، مما يؤدي في الواقع إلى تسوية جداول الأبعاد. على سبيل المثال، قد تتم تسوية جدول dimTerritory في المثال أعلاه عن طريق نقل بيانات البلد والمنطقة إلى أبعاد منفصلة لخدمة احتياجات العمل المعقدة بشكل أفضل. وفي هذه الحالة يمكن ضم الأبعاد الثلاثة من خلال مفاتيحها الأساسية، كما هو موضح في الشكل التالي (2).

رسم تخطيطي لجدول dimProduct الطبيعي
الشكل 2: جدول المنتجات الخافتة الطبيعية من الشكل 1.

المخطط في الشكل أيضا تطبيع البعد dimProduct عن طريق نقل بيانات نوع المنتج إلى جدول منفصل. قد تقوم بعض مخططات ندفة الثلج أيضًا بتسوية بُعد dimDate، اعتمادًا على متطلبات العمل المحددة. نظرًا لأن مخطط ندفة الثلج يقوم بتطبيع البيانات، فهناك بيانات أقل تكرارًا وبالتالي أقل تخزين مطلوب. ومع ذلك، يصبح الاستعلام عن البيانات أكثر تعقيدًا نظرًا لوجود عدد أكبر من الصلات.

ما هي أنواع الأبعاد في مستودع البيانات؟

غالبًا ما يتم تصنيف أبعاد مستودع البيانات حسب النوع، استنادًا إلى الدور الذي تلعبه داخل مستودع البيانات. تمثل الأبعاد التالية بعض الأنواع الأكثر شيوعًا:

  • البعد المطابق هو بُعد يمكن الرجوع إليه بواسطة جداول حقائق متعددة وله نفس المعنى لكل حقيقة تشير إلى البعد. على سبيل المثال، يمكن أن تكون أبعاد العميل والمنتج في الأمثلة أعلاه بمثابة أبعاد متوافقة إذا كان لها نفس المعنى لأي جداول حقائق في مستودع البيانات تشير إليها.
  • البعد لعب الأدوار هو البعد الذي يمكن أن تستخدمه الحقيقة لأغراض متعددة. على سبيل المثال، تستخدم حقيقة المبيعات في المثال أعلاه بُعد التاريخ لتاريخ الطلب وتاريخ الدفع وتاريخ الشحن. ونتيجة لذلك، يمكن اعتبار بُعد التاريخ بُعدًا لعب الأدوار.
  • البعد المتغير ببطء هو البعد الذي تتغير بياناته بشكل ثابت مع مرور الوقت. على سبيل المثال، ستتغير البيانات الموجودة في بُعد العميل ببطء عندما يقوم العملاء بتحديث عناوينهم ومعلومات الاتصال الخاصة بهم. غالبًا ما يتم تصنيف الأبعاد المتغيرة ببطء حسب النوع، بناءً على كيفية التعامل مع البيانات التاريخية.
  • البعد غير المرغوب فيه هو بُعد يجمع أنواعًا مختلفة من السمات التي لا تتطلب أبعادًا خاصة بها. على سبيل المثال، قد يتم استخدام البعد غير الهام للأعلام أو قيم البحث المنطقية أو السمات الأخرى التي لا تتلاءم بدقة مع أبعاد أكثر تركيزًا مثل المنتجات أو العملاء.
  • البعد المنحط هو البعد الذي يتم تكوينه منطقيًا من السمات الموجودة في جدول الحقائق بدون جداول الأبعاد المرتبطة. على سبيل المثال، قد يتضمن جدول حقائق المبيعات بيانات مثل أرقام الفواتير أو أرقام الطلبات. ستشكل هذه البيانات بُعدًا منحطًا.

هذه ليست الأنواع الوحيدة الممكنة للأبعاد في مستودع البيانات، كما أنها ليست الطريقة الوحيدة لتصنيف الأبعاد. على سبيل المثال، قد يتم تصنيفها حسب ما إذا كانت تتغير أو عدد مرات التغيير، مثل تصنيفها على أنها ثابتة أو كما تتغير ببطء.

على الرغم من أن الأبعاد تلعب دورًا حيويًا في مستودعات البيانات، إلا أنها تلعب أيضًا دورًا في مستودعات أخرى التطبيقات. على سبيل المثال، يتم استخدام الأبعاد في المعالجة التحليلية عبر الإنترنت (OLAP) مكعبات وفي ذكاء الأعمال (بي) وتحليل الأعمال (بكالوريوس) التطبيقات.

تعرف على الاختلافات بين بحيرة البيانات ومستودع البيانات و تقييم خيارات نشر مستودع البيانات وحالات الاستخدام. استكشف أيضًا أهم خمسة عناصر مطلوبة لمستودع بيانات ناجح.



Source link

زر الذهاب إلى الأعلى