المكعبات متعددة الأبعاد، OLAP وMDX. بناء المكعب الأول الخاص بك

02.08.2019

كجزء من هذا العمل، سيتم النظر في القضايا التالية:

  • ما هي مكعبات OLAP؟
  • ما هي المقاييس والأبعاد والتسلسلات الهرمية؟
  • ما أنواع العمليات التي يمكن إجراؤها على مكعبات OLAP؟
مفهوم مكعب OLAP

الفرضية الرئيسية لـ OLAP هي تعدد الأبعاد في عرض البيانات. في مصطلحات OLAP، يتم استخدام مفهوم المكعب، أو المكعب الفائق، لوصف مساحة بيانات منفصلة متعددة الأبعاد.

مكعبهي بنية بيانات متعددة الأبعاد يمكن من خلالها لمحلل المستخدم الاستعلام عن المعلومات. يتم إنشاء المكعبات من الحقائق والأبعاد.

بيانات- هذه بيانات حول الأشياء والأحداث في الشركة التي ستخضع للتحليل. حقائق من نفس النوع قياسات. المقياس هو نوع القيمة في خلية مكعب.

قياسات- هذه هي عناصر البيانات التي يتم من خلالها تحليل الحقائق. تشكل مجموعة من هذه العناصر سمة البعد (على سبيل المثال، أيام الأسبوع يمكن أن تشكل سمة البعد الزمني). في مهام تحليل الأعمال للمؤسسات التجارية، غالبًا ما تتضمن الأبعاد فئات مثل "الوقت"، و"المبيعات"، و"المنتجات"، و"العملاء"، و"الموظفون"، و"الموقع الجغرافي". غالبًا ما تكون الأبعاد هياكل هرمية، تمثل فئات منطقية يمكن للمستخدم من خلالها تحليل البيانات الفعلية. يمكن أن يحتوي كل تسلسل هرمي على مستوى واحد أو أكثر. وبالتالي، فإن التسلسل الهرمي لبعد "الموقع الجغرافي" قد يشمل المستويات: "البلد - المنطقة - المدينة". في التسلسل الهرمي الزمني، يمكننا التمييز، على سبيل المثال، التسلسل التالي من المستويات: يمكن أن يحتوي البعد على عدة تسلسلات هرمية (يجب أن يكون لكل تسلسل هرمي لبعد واحد نفس السمة الرئيسية لجدول الأبعاد).

يمكن أن يحتوي المكعب على بيانات فعلية من جدول حقائق واحد أو أكثر، وغالبًا ما يحتوي على أبعاد متعددة. عادة ما يكون لأي مكعب معين تركيز محدد للتحليل.

ويبين الشكل 1 مثالاً لمكعب مصمم لتحليل مبيعات المنتجات البترولية من قبل شركة معينة حسب المنطقة. يحتوي هذا المكعب على ثلاثة أبعاد (الوقت والمنتج والمنطقة) ومقياس واحد (حجم المبيعات معبرًا عنه من الناحية النقدية). يتم تخزين قيم القياس في الخلايا المقابلة للمكعب. يتم تحديد كل خلية بشكل فريد من خلال مجموعة من الأعضاء من كل بعد، تسمى الصف. على سبيل المثال، يتم تحديد الخلية الموجودة في الركن الأيسر السفلي من المكعب (تحتوي على القيمة 98399 دولارًا) بواسطة الصف [يوليو 2005، الشرق الأقصى، ديزل]. هنا تظهر قيمة 98.399 دولارًا حجم مبيعات الديزل (من الناحية النقدية) في الشرق الأقصى لشهر يوليو 2005.

ومن الجدير بالذكر أيضًا أن بعض الخلايا لا تحتوي على أي قيم: هذه الخلايا فارغة لأن جدول الحقائق لا يحتوي على بيانات خاصة بها.

أرز. 1.مكعب يحتوي على معلومات عن مبيعات المنتجات البترولية في مختلف المناطق

الهدف النهائي من إنشاء مثل هذه المكعبات هو تقليل وقت معالجة الاستعلامات التي تستخرج المعلومات المطلوبة من البيانات الفعلية. لإنجاز هذه المهمة، تحتوي المكعبات عادةً على إجماليات محسوبة مسبقًا تسمى التجمعات(التجمعات). أولئك. يغطي المكعب مساحة بيانات أكبر من المساحة الفعلية - توجد به نقاط منطقية ومحسوبة. تتيح لك وظائف التجميع حساب قيم النقاط في المساحة المنطقية بناءً على القيم الفعلية. أبسط وظائف التجميع هي SUM، MAX، MIN، COUNT. لذلك، على سبيل المثال، باستخدام الدالة MAX، بالنسبة للمكعب الموضح في المثال، يمكنك تحديد متى حدثت ذروة مبيعات الديزل في الشرق الأقصى، وما إلى ذلك.

ميزة أخرى محددة للمكعبات متعددة الأبعاد هي صعوبة تحديد الأصل. على سبيل المثال، كيف يمكنك تعيين النقطة 0 لبُعد المنتج أو المناطق؟ الحل لهذه المشكلة هو تقديم سمة خاصة تجمع كل عناصر البعد. تحتوي هذه السمة (التي تم إنشاؤها تلقائيًا) على عنصر واحد فقط - الكل. بالنسبة لوظائف التجميع البسيطة مثل المجموع، فإن العنصر All يعادل مجموع قيم جميع العناصر الموجودة في المساحة الفعلية لبعد معين.

من المفاهيم المهمة في نموذج البيانات متعدد الأبعاد الفضاء الفرعي أو المكعب الفرعي. المكعب الفرعي هو جزء من المساحة الكاملة للمكعب على شكل شكل متعدد الأبعاد داخل المكعب. بما أن الفضاء متعدد الأبعاد للمكعب منفصل ومحدود، فإن المكعب الفرعي أيضًا منفصل ومحدود.

العمليات على مكعبات OLAP

يمكن تنفيذ العمليات التالية على مكعب OLAP:

  • شريحة؛
  • دوران؛
  • الدمج؛
  • تفصيل.
شريحة(الشكل 2) هي حالة خاصة للمكعب الفرعي. هذا هو إجراء لتشكيل مجموعة فرعية من مصفوفة بيانات متعددة الأبعاد تتوافق مع قيمة واحدة لواحد أو أكثر من عناصر البعد غير المضمنة في هذه المجموعة الفرعية. على سبيل المثال، لمعرفة كيفية تقدم مبيعات المنتجات البترولية بمرور الوقت في منطقة معينة فقط، وبالتحديد في جبال الأورال، تحتاج إلى تثبيت بُعد "المنتجات" على عنصر "الأورال" واستخراج المجموعة الفرعية المقابلة (المكعب الفرعي) من العنصر "الأورال" مكعب.
  • أرز. 2.شريحة مكعب OLAP

    دوران(شكل 3) - عملية تغيير مكان القياسات المقدمة في التقرير أو في الصفحة المعروضة. على سبيل المثال، قد تتضمن عملية التدوير إعادة ترتيب صفوف وأعمدة الجدول. بالإضافة إلى ذلك، يؤدي تدوير مكعب البيانات إلى نقل الأبعاد خارج الجدول إلى مكانها مع الأبعاد الموجودة على الصفحة المعروضة، والعكس صحيح.

    تسمح لك مكعبات بيانات OLAP (المعالجة التحليلية عبر الإنترنت) باستخراج البيانات متعددة الأبعاد وتحليلها بكفاءة. على عكس الأنواع الأخرى من قواعد البيانات، تم تصميم قواعد بيانات OLAP خصيصًا للمعالجة التحليلية والاسترجاع السريع لجميع أنواع مجموعات البيانات منها. توجد في الواقع العديد من الاختلافات الرئيسية بين قواعد البيانات العلائقية القياسية، مثل Access أو SQL Server، وقواعد بيانات OLAP.

    أرز. 1. لتوصيل مكعب OLAP بمصنف Excel، استخدم الأمر من خدمات التحليلات

    قم بتنزيل المذكرة في أو

    في قواعد البيانات العلائقية، يتم تمثيل المعلومات كسجلات تتم إضافتها وحذفها وتحديثها بشكل تسلسلي. تقوم قواعد بيانات OLAP بتخزين لقطة من البيانات فقط. في قاعدة بيانات OLAP، تتم أرشفة المعلومات ككتلة واحدة من البيانات وهي مخصصة للإخراج عند الطلب فقط. على الرغم من أنه يمكن إضافة معلومات جديدة إلى قاعدة بيانات OLAP، إلا أنه نادرًا ما يتم تحرير البيانات الموجودة، ناهيك عن حذفها.

    قواعد البيانات العلائقية وقواعد بيانات OLAP مختلفة هيكليا. تتكون قواعد البيانات العلائقية عادةً من مجموعة من الجداول المرتبطة ببعضها البعض. في بعض الحالات، تحتوي قاعدة البيانات العلائقية على العديد من الجداول بحيث يكون من الصعب جدًا تحديد كيفية ارتباطها. في قواعد بيانات OLAP، يتم تحديد العلاقات بين كتل البيانات الفردية مسبقًا ويتم تخزينها في بنية تعرف باسم مكعبات OLAP. تقوم مكعبات البيانات بتخزين معلومات كاملة حول البنية الهرمية وعلاقات قاعدة البيانات، مما يبسط التنقل عبرها إلى حد كبير. بالإضافة إلى ذلك، من الأسهل بكثير إنشاء التقارير إذا كنت تعرف مسبقًا مكان وجود البيانات التي تستخرجها وما هي البيانات الأخرى المرتبطة بها.

    الفرق الرئيسي بين قواعد البيانات العلائقية وقواعد بيانات OLAP هو طريقة تخزين المعلومات. نادرًا ما يتم تقديم البيانات الموجودة في مكعب OLAP بطريقة عامة. تحتوي مكعبات بيانات OLAP عادةً على معلومات مقدمة بتنسيق مصمم مسبقًا. وبالتالي يتم إجراء عمليات تجميع وتصفية وفرز ودمج البيانات في مكعبات قبل تعبئتها بالمعلومات. وهذا يجعل عملية استرجاع وعرض البيانات المطلوبة مبسطة قدر الإمكان. على عكس قواعد البيانات العلائقية، ليست هناك حاجة لتنظيم المعلومات بشكل صحيح قبل عرضها على الشاشة.

    عادةً ما يتم إنشاء قواعد بيانات OLAP وصيانتها بواسطة مسؤولي تكنولوجيا المعلومات. إذا لم يكن لدى مؤسستك بنية مسؤولة عن إدارة قواعد بيانات OLAP، فيمكنك الاتصال بمسؤول قاعدة البيانات الارتباطية لطلب تنفيذ بعض حلول OLAP على الأقل على شبكة الشركة.

    الاتصال بمكعب بيانات OLAP

    للوصول إلى قاعدة بيانات OLAP، تحتاج أولاً إلى إنشاء اتصال بمكعب OLAP. ابدأ بالانتقال إلى علامة التبويب "الشريط". بيانات. انقر فوق الزر من مصادر أخرىوحدد الأمر من القائمة المنسدلة من خدمات التحليلات(رسم بياني 1).

    عند تحديد الأمر المحدد لمعالج اتصال البيانات (الشكل 2). وتتمثل مهمته الرئيسية في مساعدتك في إنشاء اتصال بالخادم، والذي سيستخدمه Excel عند إدارة البيانات.

    1. تحتاج أولاً إلى تزويد برنامج Excel بمعلومات التسجيل. أدخل اسم الخادم واسم تسجيل الدخول وكلمة مرور الوصول إلى البيانات في حقول مربع الحوار، كما هو موضح في الشكل. 2. انقر فوق الزر إضافي. إذا كنت تتصل باستخدام حساب Windows، فحدد المفتاح استخدم مصادقة Windows.

    2. حدد قاعدة البيانات التي ستعمل بها من القائمة المنسدلة (الشكل 3). يستخدم المثال الحالي قاعدة بيانات البرنامج التعليمي لخدمات التحليل. بمجرد تحديد قاعدة البيانات هذه، تطالبك القائمة أدناه باستيراد كافة مكعبات OLAP المتوفرة فيها. حدد مكعب البيانات المطلوب وانقر على الزر إضافي.

    أرز. 3. حدد قاعدة البيانات العاملة ومكعب OLAP الذي تخطط لاستخدامه في تحليل البيانات

    3. في مربع حوار المعالج التالي، الموضح في الشكل. 4، يطلب منك إدخال معلومات وصفية حول الاتصال الذي تقوم بإنشائه. جميع حقول مربع الحوار الموضحة في الشكل. 4 لا يشترط ملؤها. يمكنك دائمًا تجاهل مربع الحوار الحالي دون تعبئته، ولن يؤثر ذلك على اتصالك بأي شكل من الأشكال.

    أرز. 4. قم بتغيير المعلومات الوصفية للاتصال

    4. انقر فوق الزر مستعدلإكمال إنشاء الاتصال. سيظهر مربع حوار على الشاشة بيانات الاستيراد(الشكل 5). اضبط المفتاح تقرير الجدول المحوريوانقر فوق "موافق" لبدء إنشاء الجدول المحوري.

    هيكل مكعب OLAP

    أثناء قيامك بإنشاء جدول محوري من قاعدة بيانات OLAP، ستلاحظ ظهور نافذة جزء المهام حقول الجدول المحوريسيكون مختلفًا عن الجدول المحوري العادي. السبب يكمن في ترتيب PivotTable بحيث يعكس بشكل وثيق بنية مكعب OLAP المرفق به. للتنقل عبر مكعب OLAP بأسرع ما يمكن، يجب أن تصبح على دراية تامة بمكوناته وكيفية تفاعلها. في التين. يوضح الشكل 6 البنية الأساسية لمكعب OLAP النموذجي.

    كما ترون، المكونات الرئيسية لمكعب OLAP هي الأبعاد والتسلسلات الهرمية والمستويات والأعضاء والمقاييس:

    • أبعاد. الخصائص الرئيسية لعناصر البيانات التي تم تحليلها. تتضمن الأمثلة الشائعة للأبعاد المنتجات والعميل والموظف. في التين. يوضح الشكل 6 بنية بُعد المنتجات.
    • التسلسلات الهرمية. تجميع محدد مسبقًا للمستويات في بُعد محدد. يتيح لك التسلسل الهرمي إنشاء بيانات ملخصة وتحليلها على مستويات مختلفة من البنية، دون الخوض في العلاقات الموجودة بين هذه المستويات. في المثال الموضح في الشكل. 6، يشتمل بُعد المنتجات على ثلاثة مستويات، يتم تجميعها في تسلسل هرمي واحد لفئات المنتجات.
    • المستويات. المستويات هي فئات يتم تجميعها في تسلسل هرمي مشترك. فكر في الطبقات باعتبارها حقول بيانات يمكن الاستعلام عنها وتحليلها بشكل منفصل عن بعضها البعض. في التين. 6 هناك ثلاثة مستويات فقط: الفئة والفئة الفرعية واسم المنتج.
    • أعضاء. عنصر بيانات واحد ضمن البعد. يتم الوصول إلى الأعضاء عادةً من خلال بنية OLAP للأبعاد والتسلسلات الهرمية والمستويات. في المثال في الشكل. يتم تحديد 6 أعضاء لمستوى اسم المنتج. المستويات الأخرى لها أعضائها الخاصة، والتي لا تظهر في الهيكل.
    • مقاسات- هذه بيانات حقيقية في مكعبات OLAP. يتم تخزين القياسات في أبعادها الخاصة، والتي تسمى أبعاد القياس. يمكنك الاستعلام عن المقاييس باستخدام أي مجموعة من الأبعاد والتسلسلات الهرمية والمستويات والأعضاء. ويسمى هذا الإجراء تدابير "التقطيع".

    الآن بعد أن أصبحت على دراية ببنية مكعبات OLAP، فلنلقي نظرة جديدة على قائمة حقول PivotTable. يصبح تنظيم الحقول المتاحة واضحًا ولا يسبب أي شكاوى. في التين. يوضح الشكل 7 كيف تمثل قائمة الحقول عناصر الجدول المحوري OLAP.

    في قائمة الحقول الموجودة في الجدول المحوري OLAP، تظهر المقاييس أولاً ويتم الإشارة إليها بواسطة أيقونة المجموع (سيجما). هذه هي عناصر البيانات الوحيدة التي يمكن أن تكون في منطقة VALUE. بعد ذلك، يتم الإشارة إلى الأبعاد في القائمة، والتي يشار إليها برمز مع صورة الجدول. يستخدم مثالنا البعد العميل. يحتوي هذا البعد على عدد من التسلسلات الهرمية. بمجرد توسيع التسلسل الهرمي، يمكنك عرض مستويات البيانات الفردية. لعرض بنية البيانات لمكعب OLAP، ما عليك سوى التنقل عبر قائمة الحقول في الجدول المحوري.

    القيود المفروضة على الجداول المحورية OLAP

    عند العمل مع OLAP PivotTables، تذكر أنك تتفاعل مع مصدر بيانات PivotTable في بيئة Analysis Services OLAP. وهذا يعني أن كل جانب سلوكي لمكعب البيانات، بدءًا من الأبعاد وحتى المقاييس المضمنة في المكعب، يتم التحكم فيه أيضًا بواسطة خدمات تحليلات OLAP. وهذا بدوره يؤدي إلى قيود على العمليات التي يمكن إجراؤها على الجداول المحورية لـ OLAP:

    • لا يمكن وضع الحقول الأخرى غير المقاييس في منطقة القيم بالجدول المحوري؛
    • من المستحيل تغيير الدالة المستخدمة للتلخيص؛
    • لا يمكنك إنشاء حقل محسوب أو عنصر محسوب؛
    • يتم إلغاء أي تغييرات على أسماء الحقول مباشرة بعد إزالة الحقل من الجدول المحوري؛
    • تغيير معلمات حقل الصفحة غير مسموح به؛
    • الأمر غير متوفر يعرضالصفحات;
    • تم تعطيل الخيار يعرضالتوقيعاتعناصرإذا لم تكن هناك حقول في منطقة القيمة؛
    • تم تعطيل الخيار المجاميع الفرعيةحسب عناصر الصفحة المحددة بواسطة المرشح؛
    • المعلمة غير متوفرة خلفيةطلب;
    • بعد النقر المزدوج فوق حقل القيم، يتم إرجاع أول 1000 سجل فقط من ذاكرة التخزين المؤقت للجدول المحوري؛
    • تم تعطيل خانة الاختيار تحسينذاكرة.

    إنشاء مكعبات البيانات المستقلة

    في الجدول المحوري القياسي، يتم تخزين البيانات المصدر على محرك الأقراص الثابتة المحلي لديك. وبالتالي، يمكنك دائمًا إدارتها، وكذلك تغيير البنية، حتى بدون الوصول إلى الشبكة. ولكن هذا لا ينطبق بأي حال من الأحوال على الجداول المحورية OLAP. في الجداول المحورية OLAP، لا توجد ذاكرة التخزين المؤقت على محرك الأقراص الثابتة المحلي. ولذلك، فور قطع الاتصال بالشبكة المحلية، لن يعمل الجدول المحوري OLAP الخاص بك بعد الآن. لن تتمكن من نقل حقل واحد في مثل هذا الجدول.

    إذا كنت لا تزال بحاجة إلى تحليل بيانات OLAP عندما لا تكون متصلاً بشبكة، فقم بإنشاء مكعب بيانات غير متصل. هذا ملف منفصل يمثل ذاكرة التخزين المؤقت للجدول المحوري. يقوم هذا الملف بتخزين بيانات OLAP التي يتم عرضها بعد قطع الاتصال بالشبكة المحلية. لإنشاء مكعب بيانات مستقل، قم أولاً بإنشاء جدول محوري OLAP. ضع المؤشر في الجدول المحوري وانقر على الزر أدوات OLAPتحليل علامات التبويب السياقية، المضمن في مجموعة علامات التبويب السياقية العمل مع الجداول المحورية. اختر فريقا وضع OLAP دون اتصال(الشكل 8).

    سيظهر مربع حوار على الشاشة إعداد OLAP دون اتصال(الشكل 9). انقر فوق الزر إنشاء ملف بيانات دون اتصال. ستظهر النافذة الأولى لمعالج إنشاء ملف Data Cube على الشاشة. انقر فوق الزر إضافيلمواصلة الإجراء.

    في الخطوة الثانية (الشكل 10)، قم بالإشارة إلى الأبعاد والمستويات التي سيتم تضمينها في مكعب البيانات. في مربع الحوار، يجب عليك تحديد البيانات التي تريد استيرادها من قاعدة بيانات OLAP. من الضروري تحديد تلك الأبعاد التي ستكون مطلوبة فقط بعد فصل الكمبيوتر عن الشبكة المحلية. كلما زاد عدد الأبعاد التي تحددها، أصبح مكعب البيانات المستقل أكبر.

    انقر فوق الزر إضافيللانتقال إلى الخطوة الثالثة (الشكل 11). في هذه النافذة، يتعين عليك تحديد الأعضاء أو عناصر البيانات التي لن يتم تضمينها في المكعب. إذا لم يتم تحديد خانة الاختيار، فلن يتم استيراد العنصر المحدد وسيشغل مساحة غير ضرورية على محرك الأقراص الثابتة المحلي لديك.

    حدد موقع واسم مكعب البيانات (الشكل 12). ملفات مكعب البيانات لها الامتداد .cub.

    بعد مرور بعض الوقت، سيقوم Excel بحفظ مكعب البيانات غير المتصل في المجلد المحدد. لاختباره، انقر نقرًا مزدوجًا فوق الملف، مما سيؤدي تلقائيًا إلى إنشاء مصنف Excel يحتوي على جدول محوري مرتبط بمكعب البيانات المحدد. بمجرد إنشائه، يمكنك توزيع مكعب البيانات غير المتصل بالإنترنت على جميع المستخدمين المهتمين الذين يعملون في وضع الشبكة المحلية غير المتصلة (LAN).

    بمجرد الاتصال بالشبكة المحلية، يمكنك فتح ملف مكعب البيانات غير المتصل بالإنترنت وتحديثه وجدول البيانات المقابل. يرجى ملاحظة أنه على الرغم من استخدام مكعب البيانات غير المتصل بالإنترنت عندما لا يكون هناك وصول إلى الشبكة، إلا أنه يلزم تحديثه عند استعادة الاتصال بالشبكة. ستؤدي محاولة تحديث مكعب بيانات غير متصل بعد فقدان الاتصال بالشبكة إلى الفشل.

    استخدام وظائف مكعب البيانات في الجداول المحورية

    يمكن أيضًا تشغيل وظائف مكعب البيانات المستخدمة في قواعد بيانات OLAP من جدول محوري. في الإصدارات القديمة من Excel، لم يكن لديك حق الوصول إلى وظيفة مكعب البيانات إلا بعد تثبيت الوظيفة الإضافية Analysis Pack. في Excel 2013، تم تضمين هذه الوظائف في البرنامج وبالتالي فهي متاحة للاستخدام. لفهم قدراتهم بشكل كامل، دعونا نلقي نظرة على مثال محدد.

    إحدى أسهل الطرق لتعلم وظائف مكعب البيانات هي تحويل جدول OLAP المحوري إلى صيغ مكعبات البيانات. هذا الإجراء بسيط جدًا ويسمح لك بالحصول بسرعة على صيغ مكعبات البيانات دون إنشائها من البداية. المبدأ الأساسي هو استبدال كافة الخلايا الموجودة في الجدول المحوري بصيغ مرتبطة بقاعدة بيانات OLAP. في التين. يوضح الشكل 13 جدولاً محوريًا مرتبطًا بقاعدة بيانات OLAP.

    ضع المؤشر في أي مكان في الجدول المحوري، وانقر فوق الزر أدوات OLAPعلامة تبويب الشريط السياقية تحليلواختيار فريق تحويل إلى الصيغ(الشكل 14).

    إذا كان الجدول المحوري الخاص بك يحتوي على حقل مرشح تقرير، فسيظهر مربع الحوار الموضح في الشكل 1 على شاشتك. 15. في هذه النافذة، يمكنك تحديد ما إذا كنت تريد تحويل القوائم المنسدلة لمرشح البيانات إلى صيغ. إذا كانت الإجابة بنعم، فستتم إزالة القوائم المنسدلة وسيتم عرض الصيغ الثابتة بدلاً منها. إذا كنت تخطط لاستخدام القوائم المنسدلة في المستقبل لتغيير محتويات الجدول المحوري، فقم بإلغاء تحديد خانة الاختيار الوحيدة في مربع الحوار. إذا كنت تعمل على PivotTable في وضع التوافق، فسيتم تحويل عوامل تصفية البيانات إلى صيغ تلقائيًا، دون تحذير مسبق.

    بعد بضع ثوان، بدلا من الجدول المحوري، سيتم عرض الصيغ التي يتم تنفيذها في مكعبات البيانات وتوفير إخراج المعلومات الضرورية في نافذة Excel. يرجى ملاحظة أن هذا يزيل الأنماط المطبقة مسبقًا (الشكل 16).

    أرز. 16. ألقِ نظرة على شريط الصيغة: تحتوي الخلايا على صيغ مكعب البيانات

    نظرًا لأن القيم التي تعرضها لم تعد جزءًا من كائن PivotTable، فيمكنك إضافة أعمدة وصفوف وأعضاء محسوبين، ودمجهم مع مصادر خارجية أخرى، وتعديل تقريرك بعدة طرق، بما في ذلك السحب والإسقاط الصيغ.

    إضافة الحسابات إلى الجداول المحورية OLAP

    في الإصدارات السابقة من Excel، لم تكن الجداول المحورية OLAP تسمح بإجراء عمليات حسابية مخصصة. وهذا يعني أنه لم يكن من الممكن إضافة مستوى إضافي من التحليل إلى OLAP PivotTables بنفس الطريقة التي يمكن بها إضافة الحقول المحسوبة والأعضاء إلى PivotTables العادية (لمزيد من المعلومات، يرجى التأكد من أنك على دراية بهذه المادة قبل المتابعة قراءة ).

    يقدم Excel 2013 أدوات OLAP جديدة - المقاييس المحسوبة والأعضاء المحسوبين لتعبيرات MDX. لم تعد مقيدًا باستخدام المقاييس والأعضاء في مكعب OLAP الخاص بك الذي يوفره DBA الخاص بك. يمكنك الحصول على إمكانات تحليل إضافية عن طريق إنشاء حسابات مخصصة.

    مقدمة إلى MDX.عند استخدام PivotTable مع مكعب OLAP، فإنك تقوم بإصدار استعلامات MDX (تعبيرات متعددة الأبعاد) إلى قاعدة البيانات. MDX هي لغة استعلام تستخدم لاسترداد البيانات من مصادر متعددة الأبعاد (مثل مكعبات OLAP). عند تغيير OLAP PivotTable أو تحديثه، يتم إرسال استعلامات MDX المقابلة إلى قاعدة بيانات OLAP. يتم إرجاع نتائج الاستعلام مرة أخرى إلى Excel وعرضها في منطقة PivotTable. وهذا يجعل من الممكن العمل مع بيانات OLAP بدون نسخة محلية من ذاكرة التخزين المؤقت للجدول المحوري.

    عندما تقوم بإنشاء مقاييس محسوبة وأعضاء MDX، فإنك تستخدم بناء جملة لغة MDX. باستخدام بناء الجملة هذا، يسمح الجدول المحوري للحسابات بالتفاعل مع الواجهة الخلفية لقاعدة بيانات OLAP. تعتمد الأمثلة الواردة في هذا الكتاب على بنيات MDX الأساسية التي توضح الميزات الجديدة في Excel 2013. إذا كنت بحاجة إلى إنشاء مقاييس محسوبة معقدة وأعضاء MDX، فستحتاج إلى تخصيص الوقت للتعمق في إمكانيات MDX.

    إنشاء تدابير محسوبة.المقياس المحسوب هو إصدار OLAP للحقل المحسوب. تتمثل الفكرة في إنشاء حقل بيانات جديد استنادًا إلى بعض العمليات الحسابية التي يتم إجراؤها على حقول OLAP الموجودة. في المثال الموضح في الشكل. 17، يتم استخدام جدول ملخص OLAP، والذي يتضمن قائمة البضائع وكميتها، وكذلك الدخل من بيع كل منها. نحتاج إلى إضافة مقياس جديد يحسب متوسط ​​السعر لكل وحدة من السلعة.

    تحليل العمل مع الجداول المحورية. في القائمة المنسدلة أدوات OLAPحدد العنصر (الشكل 18).

    أرز. 18. حدد عنصر القائمة القياس المحسوب MDX

    سيظهر مربع حوار على الشاشة إنشاء مقياس محسوب(الشكل 19).

    اتبع الخطوات التالية:

    2. حدد مجموعة القياس التي سيتم وضع المقياس المحسوب الجديد فيها. إذا لم تقم بذلك، فسيقوم Excel تلقائيًا بوضع المقياس الجديد في أول مجموعة قياس متوفرة.

    3. في الميدان تعبير MDX(MDX) أدخل الرمز الذي يحدد المقياس الجديد. لتسريع عملية الإدخال، استخدم القائمة الموجودة على اليسار لتحديد المقاييس الموجودة لاستخدامها في الحسابات. انقر نقرًا مزدوجًا فوق المقياس المطلوب لإضافته إلى حقل MDX. يتم استخدام MDX التالي لحساب متوسط ​​سعر بيع الوحدة:

    4. انقر فوق موافق.

    انتبه إلى الزر تحقق من MDX، الموجود في الجزء السفلي الأيمن من النافذة. انقر فوق هذا الزر للتحقق من صحة بناء جملة MDX. إذا كان بناء الجملة يحتوي على أخطاء، فستظهر رسالة.

    بمجرد الانتهاء من إنشاء المقياس المحسوب الجديد، انتقل إلى القائمة حقول الجدول المحوريواختره (الشكل 20).

    ينطبق نطاق المقياس المحسوب على المصنف الحالي فقط. بمعنى آخر، لا يتم إنشاء المقاييس المحسوبة مباشرةً في مكعب خادم OLAP. وهذا يعني أنه لن يتمكن أي شخص من الوصول إلى المقياس المحسوب إلا إذا قمت بمشاركة المصنف أو نشره عبر الإنترنت.

    إنشاء أعضاء MDX محسوبين.العضو المحسوب MDX هو إصدار OLAP للعضو المحسوب العادي. تتمثل الفكرة في إنشاء عنصر بيانات جديد بناءً على بعض العمليات الرياضية التي يتم إجراؤها على عناصر OLAP الموجودة. في المثال الموضح في الشكل. 22، يتم استخدام جدول محوري OLAP يتضمن معلومات المبيعات للفترة 2005-2008 (مع توزيع ربع سنوي). لنفترض أنك تريد تجميع البيانات للربعين الأول والثاني عن طريق إنشاء عنصر جديد، النصف الأول من السنة. سنقوم أيضًا بدمج البيانات المتعلقة بالربعين الثالث والرابع لتكوين عنصر جديد في الثاني من العام.

    أرز. 22. سنقوم بإضافة أعضاء MDX الجدد المحسوبين، النصف الأول من العام والنصف الثاني من العام

    ضع المؤشر في أي مكان في PivotTable وحدد علامة التبويب السياقية تحليلمن مجموعة من علامات التبويب السياقية العمل مع الجداول المحورية. في القائمة المنسدلة أدوات OLAPحدد العنصر عضو MDX المحسوب(الشكل 23).

    سيظهر مربع حوار على الشاشة (الشكل 24).

    أرز. 24. نافذة إنشاء عنصر محسوب

    اتبع الخطوات التالية:

    1. قم بتسمية المقياس المحسوب.

    2. حدد التسلسل الهرمي الأصل الذي تقوم بإنشاء أعضاء محسوبين جدد له. في موقع البناء عنصر الوالدينتعيين قيمة الجميع. يسمح هذا الإعداد لبرنامج Excel بالوصول إلى كافة أعضاء التسلسل الهرمي الأصل عند تقييم التعبير.

    3. في النافذة تعبير MDXأدخل بناء جملة MDX. لتوفير بعض الوقت، استخدم القائمة الموجودة على اليسار لتحديد الأعضاء الحاليين لاستخدامهم في MDX. انقر نقرًا مزدوجًا فوق العنصر المحدد وسيقوم Excel بإضافته إلى النافذة تعبير MDX. في المثال الموضح في الشكل. 24 يتم حساب مجموع الربعين الأول والثاني:

    ..&& +

    .. && +

    .. && + …

    4. انقر فوق موافق. يعرض Excel العضو المحسوب MDX الذي تم إنشاؤه حديثًا في PivotTable. كما يظهر في الشكل. 25. سيتم عرض العنصر المحسوب الجديد مع العناصر المحسوبة الأخرى في PivotTable.

    في التين. يوضح الشكل 26 عملية مشابهة تُستخدم لإنشاء العنصر المحسوب للنصف الثاني من السنة.

    لاحظ أن Excel لا يحاول حتى إزالة أعضاء MDX الأصليين (الشكل 27). يستمر PivotTable في عرض السجلات المقابلة للأعوام 2005-2008، مقسمة حسب الربع. في هذه الحالة، هذه ليست مشكلة كبيرة، ولكن في معظم السيناريوهات، يجب عليك إخفاء العناصر "الإضافية" لتجنب الصراعات.

    أرز. 27. يعرض Excel عضو MDX المحسوب الذي تم إنشاؤه كأعضاء أصليين. ولكن لا يزال من الأفضل حذف العناصر الأصلية لتجنب التعارضات

    تذكر: يتم العثور على الأعضاء المحسوبين في المصنف الحالي فقط. بمعنى آخر، لا يتم إنشاء المقاييس المحسوبة مباشرةً في مكعب خادم OLAP. وهذا يعني أنه لن يتمكن أي شخص من الوصول إلى المقياس المحسوب أو العضو المحسوب إلا إذا قمت بمشاركة المصنف أو نشره عبر الإنترنت.

    لاحظ أنه إذا تغير التسلسل الهرمي الأصلي أو العنصر الأصلي في مكعب OLAP، فلن يعمل العنصر المحسوب MDX. سوف تحتاج إلى إعادة إنشاء هذا العنصر.

    إدارة حسابات OLAP.يوفر Excel واجهة تسمح لك بإدارة المقاييس المحسوبة وأعضاء MDX في جداول OLAP المحورية. ضع المؤشر في أي مكان في PivotTable وحدد علامة التبويب السياقية تحليلمن مجموعة من علامات التبويب السياقية العمل مع الجداول المحورية. في القائمة المنسدلة أدوات OLAPحدد العنصر إدارة الحساب. فى الشباك إدارة الحسابتتوفر ثلاثة أزرار (الشكل 28):

    • يخلق.قم بإنشاء مقياس محسوب جديد أو عضو MDX محسوب.
    • يتغير.تغيير الحساب المحدد.
    • يمسح.حذف العملية الحسابية المحددة.

    أرز. 28. مربع الحوار إدارة الحساب

    قم بإجراء تحليل ماذا لو على بيانات OLAP.في Excel 2013، يمكنك إجراء تحليل ماذا لو على البيانات الموجودة في جداول OLAP المحورية. باستخدام هذه الميزة الجديدة، يمكنك تغيير القيم في PivotTable وإعادة حساب المقاييس والأعضاء بناءً على تغييراتك. يمكنك أيضًا نشر التغييرات مرة أخرى إلى مكعب OLAP. للاستفادة من إمكانات تحليل ماذا لو، قم بإنشاء OLAP PivotTable وحدد علامة التبويب السياقية تحليل العمل مع الجداول المحورية. في القائمة المنسدلة أدوات OLAPاختر فريق ماذا في التحليل –> تمكين تحليل ماذا لو(الشكل 29).

    من الآن فصاعدا، يمكنك تغيير قيم الجدول المحوري. لتغيير القيمة المحددة في PivotTable، انقر بزر الماوس الأيمن عليها وحدد العنصر من قائمة السياق (الشكل 30). سيقوم Excel بإعادة تشغيل كافة العمليات الحسابية في PivotTable مع التغييرات التي أجريتها، بما في ذلك المقاييس المحسوبة وأعضاء MDX المحسوبين.

    أرز. 30. حدد عنصرا خذ التغيير في الاعتبار عند حساب الجدول المحوريلإجراء تغييرات على الجدول المحوري

    بشكل افتراضي، تكون عمليات التحرير التي يتم إجراؤها على PivotTable في وضع تحليل "ماذا لو" محلية. إذا كنت تريد نشر التغييرات على خادم OLAP، فحدد الأمر لنشر التغييرات. حدد علامة تبويب سياقية تحليل، الموجود في مجموعة من علامات التبويب السياقية العمل مع الجداول المحورية. في القائمة المنسدلة أدوات OLAPاختيار العناصر ماذا في التحليل – > نشر التغييرات(الشكل 31). سيؤدي تشغيل هذا الأمر إلى تمكين إعادة الكتابة على خادم OLAP، مما يعني أنه يمكن نشر التغييرات إلى مكعب OLAP المصدر. (لنشر التغييرات على خادم OLAP، يجب أن يكون لديك الأذونات المناسبة للوصول إلى الخادم. اتصل بمسؤول قاعدة البيانات لديك لمساعدتك في الحصول على أذونات الوصول للكتابة إلى قاعدة بيانات OLAP.)

    تمت كتابة المذكرة بناءً على كتاب جيلين ألكسندر. . الفصل 9.

    بشكل عام، يعرف كل متخصص ما هو OLAP اليوم. على الأقل، يرتبط مفهوما "OLAP" و"البيانات متعددة الأبعاد" ارتباطًا وثيقًا في أذهاننا. ومع ذلك، فإن حقيقة إثارة هذا الموضوع مرة أخرى، آمل أن تحظى بموافقة غالبية القراء، لأنه لكي لا تصبح فكرة شيء ما قديمة بمرور الوقت، تحتاج إلى التواصل بشكل دوري مع الأشخاص الأذكياء أو قراءة المقالات في منشور جيد ...

    مستودعات البيانات (مكان OLAP في بنية معلومات المؤسسة)

    يرتبط مصطلح "OLAP" ارتباطًا وثيقًا بمصطلح "مستودع البيانات" (مستودع البيانات).

    إليكم التعريف الذي صاغه "الأب المؤسس" لتخزين البيانات، بيل إنمون: "مستودع البيانات عبارة عن مجموعة بيانات محددة النطاق ومحددة زمنياً وغير قابلة للتغيير لدعم اتخاذ القرارات الإدارية".

    تأتي البيانات الموجودة في المستودع من أنظمة التشغيل (أنظمة OLTP)، والتي تم تصميمها لأتمتة العمليات التجارية. بالإضافة إلى ذلك، يمكن تجديد المستودع من مصادر خارجية، مثل التقارير الإحصائية.

    لماذا نبني مستودعات البيانات - فهي تحتوي على معلومات زائدة عن الحاجة بشكل واضح والتي "تعيش" بالفعل في قواعد البيانات أو ملفات نظام التشغيل؟ يمكن أن تكون الإجابة مختصرة: من المستحيل أو من الصعب جدًا تحليل البيانات مباشرة من أنظمة التشغيل. ويرجع ذلك إلى أسباب مختلفة، بما في ذلك تجزئة البيانات وتخزينها بتنسيقات مختلفة لنظام إدارة قواعد البيانات (DBMS) وفي "زوايا" مختلفة لشبكة الشركة. ولكن حتى لو قامت إحدى المؤسسات بتخزين جميع بياناتها على خادم قاعدة بيانات مركزية (وهو أمر نادر للغاية)، فمن المؤكد تقريبًا أن المحلل لن يفهم هياكلها المعقدة والمربكة في بعض الأحيان. يتمتع المؤلف بتجربة حزينة للغاية في محاولة "إطعام" المحللين الجائعين ببيانات "خام" من أنظمة التشغيل - وقد تبين أن ذلك "أكثر من اللازم بالنسبة لهم".

    وبالتالي، فإن الغرض من المستودع هو توفير "المواد الخام" للتحليل في مكان واحد وبهيكل بسيط ومفهوم. كتب رالف كيمبال في مقدمة كتابه "مجموعة أدوات مستودع البيانات" أنه إذا فهم القارئ شيئًا واحدًا فقط، بعد قراءة الكتاب بأكمله - وهو أن هيكل المستودع يجب أن يكون بسيطًا - فسوف يأخذ المؤلف في الاعتبار كتابه تمت المهمة.

    هناك سبب آخر يبرر ظهور منشأة تخزين منفصلة - الاستعلامات التحليلية المعقدة للمعلومات التشغيلية تؤدي إلى إبطاء العمل الحالي للشركة، وحظر الجداول لفترة طويلة والاستيلاء على موارد الخادم.

    في رأيي، لا يعني المستودع بالضرورة تراكما هائلا للبيانات - الشيء الرئيسي هو أنه مناسب للتحليل. بشكل عام، هناك مصطلح منفصل لمرافق التخزين الصغيرة - Data Marts (أكشاك البيانات)، ولكن في ممارساتنا الروسية لا تسمعه كثيرًا.

    OLAP - أداة تحليل مريحة

    المركزية والهيكلة المريحة ليست كل ما يحتاجه المحلل. لا يزال يحتاج إلى أداة لعرض المعلومات وتصورها. التقارير التقليدية، حتى تلك المبنية على مستودع واحد، تفتقر إلى شيء واحد - المرونة. ولا يمكن "تحريفها" أو "توسيعها" أو "طيها" للحصول على العرض المطلوب للبيانات. بالطبع، يمكنك الاتصال بمبرمج (إذا كان يريد أن يأتي)، وهو (إذا لم يكن مشغولا) سيقدم تقريرا جديدا بسرعة كافية - على سبيل المثال، في غضون ساعة (أنا أكتب هذا ولا أصدق) هذا بنفسي - لا يحدث الأمر بهذه السرعة في الحياة، فلنمنحه ثلاث ساعات) . اتضح أن المحلل لا يمكنه اختبار أكثر من فكرتين في اليوم. ويمكنه (إذا كان محللاً جيدًا) أن يأتي بالعديد من هذه الأفكار في الساعة. وكلما زاد عدد "شرائح" و"أقسام" البيانات التي يراها المحلل، زادت الأفكار التي لديه، والتي بدورها تتطلب المزيد والمزيد من "الشرائح" للتحقق منها. لو كان لديه أداة تسمح له بتوسيع البيانات وطيها ببساطة وسهولة! يعمل OLAP كأداة من هذا القبيل.

    على الرغم من أن OLAP ليس سمة ضرورية لمستودع البيانات، إلا أنه يتم استخدامه بشكل متزايد لتحليل المعلومات المتراكمة في المستودع.

    تظهر المكونات المضمنة في المستودع النموذجي في الشكل. 1.

    أرز. 1. هيكل مستودع البيانات

    يتم جمع البيانات التشغيلية من مصادر مختلفة، وتنقيتها، ودمجها، وتخزينها في مخزن ارتباطي. علاوة على ذلك، فهي متاحة بالفعل للتحليل باستخدام أدوات إعداد التقارير المختلفة. ثم يتم إعداد البيانات (كليًا أو جزئيًا) لتحليل OLAP. يمكن تحميلها في قاعدة بيانات OLAP خاصة أو تخزينها في وحدة تخزين علائقية. العنصر الأكثر أهمية هو البيانات الوصفية، أي معلومات حول هيكل البيانات وموضعها وتحويلها. بفضلهم، يتم ضمان التفاعل الفعال بين مكونات التخزين المختلفة.

    لتلخيص ذلك، يمكننا تعريف OLAP كمجموعة من الأدوات للتحليل متعدد الأبعاد للبيانات المتراكمة في المستودع. من الناحية النظرية، يمكن تطبيق أدوات OLAP مباشرة على البيانات التشغيلية أو نسخها الدقيقة (حتى لا تتداخل مع المستخدمين التشغيليين). لكننا بذلك نجازف بالدوس على أشعل النار الموصوف أعلاه، أي البدء في تحليل البيانات التشغيلية غير المناسبة للتحليل بشكل مباشر.

    التعريف والمفاهيم الأساسية لـ OLAP

    أولاً، دعونا نفك التشفير: OLAP هو معالجة تحليلية عبر الإنترنت، أي تحليل البيانات التشغيلية. تمت صياغة المبادئ الـ 12 المحددة لـ OLAP في عام 1993 على يد إي إف كود، "مخترع" قواعد البيانات العلائقية. لاحقًا، تمت إعادة صياغة تعريفه ليصبح ما يسمى باختبار FASMI، والذي يتطلب أن يوفر تطبيق OLAP القدرة على تحليل المعلومات المشتركة متعددة الأبعاد بسرعة ().

    اختبار فسمي

    سريع(سريع) - يجب إجراء التحليل بنفس السرعة على جميع جوانب المعلومات. وقت الاستجابة المقبول هو 5 ثواني أو أقل.

    تحليل(التحليل) - يجب أن يكون من الممكن تنفيذ الأنواع الأساسية من التحليل العددي والإحصائي، المحددة مسبقًا من قبل مطور التطبيق أو المحددة بحرية من قبل المستخدم.

    مشترك(مشترك) - يجب أن يكون لدى العديد من المستخدمين حق الوصول إلى البيانات، في حين أنه من الضروري التحكم في الوصول إلى المعلومات السرية.

    متعدد الأبعاد(متعدد الأبعاد) هي السمة الرئيسية والأكثر أهمية لـ OLAP.

    معلومة(المعلومات) - يجب أن يكون التطبيق قادرًا على الوصول إلى أي معلومات ضرورية، بغض النظر عن حجمها وموقع تخزينها.

    OLAP = عرض متعدد الأبعاد = مكعب

    يوفر OLAP وسيلة مريحة وسريعة للوصول إلى معلومات الأعمال وعرضها وتحليلها. يتلقى المستخدم نموذج بيانات طبيعيًا وبديهيًا، وينظمها على شكل مكعبات متعددة الأبعاد (مكعبات). محاور نظام الإحداثيات متعدد الأبعاد هي السمات الرئيسية لعملية الأعمال التي تم تحليلها. على سبيل المثال، بالنسبة للمبيعات، يمكن أن يكون المنتج أو المنطقة أو نوع المشتري. يتم استخدام الوقت كأحد القياسات. عند تقاطعات المحاور - الأبعاد (الأبعاد) - توجد بيانات تميز العملية كميا - المقاييس (القياسات). يمكن أن يكون هذا حجم المبيعات بالقطع أو من الناحية النقدية، وأرصدة المخزون، والتكاليف، وما إلى ذلك. يمكن للمستخدم الذي يقوم بتحليل المعلومات "قطع" المكعب في اتجاهات مختلفة، أو الحصول على ملخص (على سبيل المثال، حسب السنة) أو على العكس من ذلك، مفصل ( حسب الأسبوع ) المعلومات ويقوم بالتلاعبات الأخرى التي تتبادر إلى ذهنه أثناء عملية التحليل.

    كما هو مقيس في المكعب ثلاثي الأبعاد الموضح في الشكل. 2، يتم استخدام مبالغ المبيعات، ويتم استخدام الوقت والمنتج والمتجر كأبعاد. يتم عرض القياسات على مستويات محددة من التجميع: يتم تجميع المنتجات حسب الفئة، ويتم تجميع المتاجر حسب البلد، ويتم تجميع بيانات توقيت المعاملة حسب الشهر. وبعد ذلك بقليل سوف ننظر إلى مستويات التجميع (التسلسل الهرمي) بمزيد من التفصيل.


    أرز. 2. مثال المكعب

    "قطع" مكعب

    حتى المكعب ثلاثي الأبعاد يصعب عرضه على شاشة الكمبيوتر بحيث تكون قيم المقاييس محل الاهتمام مرئية. ماذا يمكننا أن نقول عن المكعبات التي لها أكثر من ثلاثة أبعاد؟ لتصور البيانات المخزنة في المكعب، كقاعدة عامة، يتم استخدام طرق عرض مألوفة ثنائية الأبعاد، أي جدولية، مع عناوين الصفوف والأعمدة الهرمية المعقدة.

    يمكن الحصول على تمثيل ثنائي الأبعاد للمكعب عن طريق “قطعه” عبر محور واحد أو أكثر (الأبعاد): نثبت قيم جميع الأبعاد ما عدا اثنين، ونحصل على جدول منتظم ثنائي الأبعاد. يمثل المحور الأفقي للجدول (رؤوس الأعمدة) بُعدًا واحدًا، ويمثل المحور الرأسي (رؤوس الصفوف) بُعدًا آخر، وتمثل خلايا الجدول قيم المقاييس. في هذه الحالة، تعتبر مجموعة المقاييس في الواقع أحد الأبعاد - فإما أن نختار مقياسًا واحدًا لعرضه (ومن ثم يمكننا وضع بعدين في عناوين الصفوف والأعمدة)، أو نعرض عدة مقاييس (ثم أحد الأبعاد) محاور الجدول ستشغلها أسماء المقاييس، والأخرى - قيم البعد الوحيد "غير المقطوع").

    نلقي نظرة على الشكل. 3 - هنا شريحة ثنائية الأبعاد من المكعب لقياس واحد - مبيعات الوحدة (القطع المباعة) وبعدين "غير مقطوعين" - المتجر (المتجر) والوقت (الوقت).


    أرز. 3. شريحة مكعبة ثنائية الأبعاد لقياس واحد

    في التين. يعرض الشكل 4 بُعدًا واحدًا فقط "غير مقطوع" - المتجر، ولكنه يعرض قيم عدة مقاييس - مبيعات الوحدات (الوحدات المباعة)، ومبيعات المتجر (مبلغ البيع) وتكلفة المتجر (نفقات المتجر).


    أرز. 4. شريحة مكعبة ثنائية الأبعاد لقياسات متعددة

    من الممكن أيضًا تمثيل المكعب ثنائي الأبعاد عندما يظل أكثر من بعدين "غير مقطوعين". في هذه الحالة، سيتم وضع بعدين أو أكثر من المكعب "المقطع" على محاور الشريحة (الصفوف والأعمدة) - انظر الشكل 1. 5.


    أرز. 5. شريحة مكعبة ثنائية الأبعاد ذات أبعاد متعددة على محور واحد

    العلامات

    تسمى القيم "الموضعة" على طول الأبعاد أعضاء أو تسميات. يتم استخدام التسميات "لقص" المكعب ولتحديد (تصفية) البيانات المحددة - عندما لا نهتم بجميع القيم في أحد الأبعاد التي تظل "غير مقطوعة"، بل نهتم بمجموعة فرعية منها، على سبيل المثال، ثلاث مدن من بين عدة عشرات. تظهر قيم التسمية في عرض المكعب ثنائي الأبعاد كعناوين للصفوف والأعمدة.

    التسلسلات الهرمية والمستويات

    يمكن دمج التسميات في تسلسلات هرمية تتكون من مستوى واحد أو أكثر. على سبيل المثال، يتم تجميع تسميات بُعد المتجر بشكل طبيعي في تسلسل هرمي بمستويات:

    دولة

    ولاية

    مدينة

    محل.

    يتم حساب القيم الإجمالية وفقًا لمستويات التسلسل الهرمي، على سبيل المثال حجم المبيعات للولايات المتحدة الأمريكية (مستوى الدولة) أو كاليفورنيا (مستوى الولاية). من الممكن تنفيذ أكثر من تسلسل هرمي في بعد واحد - مثلاً للزمن: (سنة، ربع، شهر، يوم) و (سنة، أسبوع، يوم).

    هندسة تطبيقات OLAP

    كل ما قيل أعلاه حول OLAP يتعلق بشكل أساسي بالعرض متعدد الأبعاد للبيانات. إن كيفية تخزين البيانات، بشكل تقريبي، لا تهم المستخدم النهائي أو مطوري الأداة التي يستخدمها العميل.

    يمكن تقسيم تعدد الأبعاد في تطبيقات OLAP إلى ثلاثة مستويات:

    • تمثيل البيانات متعدد الأبعاد - أدوات المستخدم النهائي التي توفر تصورًا متعدد الأبعاد ومعالجة البيانات؛ تستخلص طبقة التمثيل متعدد الأبعاد من البنية المادية للبيانات وتعامل البيانات على أنها متعددة الأبعاد.
    • المعالجة متعددة الأبعاد هي وسيلة (لغة) لصياغة استعلامات متعددة الأبعاد (اللغة العلائقية التقليدية SQL غير مناسبة هنا) ومعالج يمكنه معالجة مثل هذا الاستعلام وتنفيذه.
    • التخزين متعدد الأبعاد هو وسيلة لتنظيم البيانات فعليًا مما يضمن التنفيذ الفعال للاستعلامات متعددة الأبعاد.

    المستويان الأولان إلزاميان في كافة أدوات OLAP. المستوى الثالث، على الرغم من انتشاره، ليس ضروريا، حيث يمكن استخلاص بيانات التمثيل متعدد الأبعاد من الهياكل العلائقية العادية؛ يقوم معالج الاستعلام متعدد الأبعاد في هذه الحالة بترجمة الاستعلامات متعددة الأبعاد إلى استعلامات SQL التي يتم تنفيذها بواسطة نظام إدارة قواعد البيانات العلائقية.

    منتجات OLAP المحددة، كقاعدة عامة، هي إما أداة تمثيل بيانات متعددة الأبعاد، أو عميل OLAP (على سبيل المثال، Pivot Tables في Excel 2000 من Microsoft أو ProClarity من Knosys)، أو خادم متعدد الأبعاد DBMS، أو خادم OLAP (على سبيل المثال، Oracle Express Server أو خدمات Microsoft OLAP).

    عادة ما تكون طبقة المعالجة متعددة الأبعاد مدمجة في عميل OLAP و/أو خادم OLAP، ولكن يمكن عزلها في شكلها النقي، مثل مكون خدمة Pivot Table من Microsoft.

    الجوانب التقنية لتخزين البيانات متعددة الأبعاد

    كما ذكر أعلاه، يمكن لأدوات تحليل OLAP أيضًا استخراج البيانات مباشرةً من الأنظمة العلائقية. كان هذا النهج أكثر جاذبية في تلك الأيام عندما لم يتم تضمين خوادم OLAP في قوائم الأسعار الخاصة بالمصنعين الرائدين لنظام إدارة قواعد البيانات (DBMS). لكن اليوم، تقدم Oracle وInformix وMicrosoft خوادم OLAP كاملة، وحتى مديري تكنولوجيا المعلومات الذين لا يرغبون في إنشاء "حديقة حيوانات" من البرامج من شركات مصنعة مختلفة في شبكاتهم يمكنهم الشراء (أو بالأحرى، تقديم طلب مقابل إلى إدارة الشركة) خادم OLAP من نفس العلامة التجارية لخادم قاعدة البيانات الرئيسية.

    يمكن لخوادم OLAP، أو خوادم قواعد البيانات متعددة الأبعاد، تخزين بياناتها متعددة الأبعاد بطرق مختلفة. قبل النظر في هذه الأساليب، علينا أن نتحدث عن جانب مهم مثل وحدات التخزين. والحقيقة هي أنه في أي مستودع بيانات - عادي ومتعدد الأبعاد - إلى جانب البيانات التفصيلية المستخرجة من أنظمة التشغيل، يتم أيضًا تخزين المؤشرات الموجزة (المؤشرات المجمعة، والتجميعات)، مثل مجموع أحجام المبيعات حسب الشهر، حسب فئة البضائع، وما إلى ذلك. يتم تخزين المجاميع بشكل صريح لغرض وحيد هو تسريع تنفيذ الاستعلامات. بعد كل شيء، من ناحية، كقاعدة عامة، يتم تجميع كمية كبيرة جدًا من البيانات في المستودع، ومن ناحية أخرى، لا يهتم المحللون في معظم الحالات بالمؤشرات التفصيلية، ولكن بالمؤشرات المعممة. وإذا كان لا بد من إضافة ملايين المبيعات الفردية في كل مرة لحساب إجمالي المبيعات لهذا العام، فمن المرجح أن تكون السرعة غير مقبولة. لذلك، عند تحميل البيانات في قاعدة بيانات متعددة الأبعاد، يتم حساب وتخزين جميع المؤشرات الإجمالية أو جزء منها.

    ولكن، كما تعلمون، عليك أن تدفع ثمن كل شيء. وبالنسبة لسرعة معالجة طلبات البيانات الموجزة، عليك أن تدفع مقابل زيادة في حجم البيانات ووقت تحميلها. علاوة على ذلك، يمكن أن تكون الزيادة في الحجم كارثية حرفيًا - في أحد الاختبارات القياسية المنشورة، يتطلب الحساب الكامل للتجميعات لـ 10 ميغابايت من البيانات المصدر 2.4 جيجابايت، أي نمت البيانات 240 مرة! وتعتمد درجة "تضخم" البيانات عند حساب المجاميع على عدد أبعاد المكعب وبنية هذه الأبعاد، أي نسبة عدد "الآباء" و"الأبناء" عند مستويات قياس مختلفة. لحل مشكلة تخزين المجاميع، يتم في بعض الأحيان استخدام مخططات معقدة، مما يجعل من الممكن تحقيق زيادة كبيرة في أداء الاستعلام عند حساب ليس كل المجاميع الممكنة.

    الآن عن الخيارات المختلفة لتخزين المعلومات. يمكن تخزين كل من البيانات الدقيقة والمجاميع في هياكل علائقية أو متعددة الأبعاد. يتيح لك التخزين متعدد الأبعاد التعامل مع البيانات كمصفوفة متعددة الأبعاد، مما يضمن إجراء حسابات سريعة بنفس القدر للمؤشرات الإجمالية والتحويلات المتعددة الأبعاد المتنوعة على طول أي من الأبعاد. منذ بعض الوقت، دعمت منتجات OLAP إما التخزين العلائقي أو متعدد الأبعاد. اليوم، كقاعدة عامة، يوفر نفس المنتج كلا النوعين من التخزين، بالإضافة إلى نوع ثالث - مختلط. تنطبق الشروط التالية:

    • مولاب(OLAP متعدد الأبعاد) - يتم تخزين كل من البيانات التفصيلية والمجاميع في قاعدة بيانات متعددة الأبعاد. في هذه الحالة، يتم الحصول على أكبر قدر من التكرار، حيث أن البيانات متعددة الأبعاد تحتوي بالكامل على بيانات علائقية.
    • رولاب(OLAP العلائقية) - تظل البيانات التفصيلية حيث "عاشت" في الأصل - في قاعدة البيانات العلائقية؛ يتم تخزين المجاميع في نفس قاعدة البيانات في جداول الخدمة المنشأة خصيصًا.
    • هولاب(Hybrid OLAP) - تظل البيانات التفصيلية في مكانها (في قاعدة بيانات علائقية)، ويتم تخزين المجاميع في قاعدة بيانات متعددة الأبعاد.

    كل من هذه الطرق لها مزاياها وعيوبها ويجب استخدامها وفقًا للظروف - حجم البيانات، وقوة نظام إدارة قواعد البيانات العلائقية، وما إلى ذلك.

    عند تخزين البيانات في هياكل متعددة الأبعاد، هناك مشكلة محتملة تتمثل في "الانتفاخ" بسبب تخزين القيم الفارغة. بعد كل شيء، إذا تم حجز مساحة في مصفوفة متعددة الأبعاد لجميع المجموعات الممكنة من تسميات الأبعاد، ولكن تم ملء جزء صغير فقط بالفعل (على سبيل المثال، يتم بيع عدد من المنتجات فقط في عدد صغير من المناطق)، فإن معظم سيكون المكعب فارغًا، على الرغم من أن المساحة ستكون مشغولة. يمكن لمنتجات OLAP الحديثة التعامل مع هذه المشكلة.

    يتبع. في المستقبل، سنتحدث عن منتجات OLAP المحددة التي تنتجها الشركات المصنعة الرائدة.

    في المقالة السابقة في هذه السلسلة (راجع رقم 2'2005)، تحدثنا عن الابتكارات الرئيسية للخدمات التحليلية في SQL Server 2005. واليوم سنلقي نظرة فاحصة على الأدوات اللازمة لإنشاء حلول OLAP المضمنة في هذا المنتج.

    باختصار حول أساسيات OLAP

    قبل أن نبدأ الحديث عن أدوات إنشاء حلول OLAP، دعونا نتذكر أن OLAP (المعالجة التحليلية عبر الإنترنت) هي تقنية لتحليل البيانات المعقدة متعددة الأبعاد، والتي تم وصف مفهومها في عام 1993 من قبل إي إف كود، المؤلف الشهير للكتاب العلائقي نموذج البيانات. حاليًا، يتم تنفيذ دعم OLAP في العديد من أنظمة إدارة قواعد البيانات والأدوات الأخرى.

    مكعبات OLAP

    ما هي بيانات OLAP؟ للإجابة على هذا السؤال، خذ مثالا بسيطا. لنفترض أنه يوجد في قاعدة بيانات الشركة الخاصة بمؤسسة معينة مجموعة من الجداول التي تحتوي على معلومات حول مبيعات السلع أو الخدمات، وعلى أساسها تم إنشاء طريقة عرض الفواتير باستخدام الحقول البلد (البلد)، المدينة (المدينة)، اسم العميل (اسم الشركة العميلة)، ومندوب المبيعات (مدير المبيعات)، وتاريخ الطلب (تاريخ تقديم الطلب)، واسم الفئة (فئة المنتج)، واسم المنتج (اسم المنتج)، واسم الشاحن (شركة النقل)، والسعر الممتد (الدفع مقابل البضائع)، بينما آخر هذه المجالات هو في الواقع موضوع التحليل.

    يمكن تحديد البيانات من طريقة العرض هذه باستخدام الاستعلام التالي:

    حدد البلد، المدينة، اسم العميل، مندوب المبيعات،

    تاريخ الطلب، اسم الفئة، اسم المنتج، اسم الشاحن، السعر الممتد

    من الفواتير

    لنفترض أننا مهتمون بالقيمة الإجمالية للطلبات المقدمة من العملاء من مختلف البلدان. للحصول على إجابة لهذا السؤال عليك تقديم الطلب التالي:

    حدد البلد، SUM (السعر الممتد) من الفواتير

    المجموعة حسب البلد

    ستكون نتيجة هذا الاستعلام مجموعة أحادية البعد من البيانات المجمعة (في هذه الحالة، المبالغ):

    دولة SUM (السعر الموسع)
    الأرجنتين 7327.3
    النمسا 110788.4
    بلجيكا 28491.65
    البرازيل 97407.74
    كندا 46190.1
    الدنمارك 28392.32
    فنلندا 15296.35
    فرنسا 69185.48
    209373.6
    ...

    إذا أردنا معرفة التكلفة الإجمالية للطلبات التي يقدمها العملاء من بلدان مختلفة ويتم تسليمها بواسطة خدمات توصيل مختلفة، فيجب علينا تشغيل استعلام يحتوي على معلمتين في جملة GROUP BY:

    حدد البلد، واسم الشاحن، والمجموع (السعر الممتد) من الفواتير

    المجموعة حسب البلد، اسم الشاحن

    استنادا إلى نتائج هذا الاستعلام، يمكنك إنشاء جدول يبدو كالتالي:

    تسمى هذه المجموعة من البيانات بالجدول المحوري.

    حدد البلد، واسم الشاحن، ومجموع مندوبي المبيعات (السعر الممتد) من الفواتير

    المجموعة حسب البلد، اسم الشاحن، السنة

    وبناء على نتائج هذا الاستعلام، يمكن بناء مكعب ثلاثي الأبعاد (الشكل 1).

    من خلال إضافة معلمات إضافية للتحليل، يمكنك إنشاء مكعب بأي عدد من الأبعاد نظريًا، بالإضافة إلى المجاميع، يمكن أن تحتوي خلايا مكعب OLAP على نتائج حساب الوظائف التجميعية الأخرى (على سبيل المثال، القيم المتوسطة والحد الأقصى والحد الأدنى ، عدد سجلات العرض الأصلي المطابق لمعلمات محددة). تسمى الحقول التي يتم حساب النتائج منها بمقاييس المكعب.

    التسلسلات الهرمية في الأبعاد

    لنفترض أننا مهتمون ليس فقط بالقيمة الإجمالية للطلبات المقدمة من العملاء في بلدان مختلفة، ولكن أيضًا بالقيمة الإجمالية للطلبات المقدمة من العملاء في مدن مختلفة من نفس البلد. في هذه الحالة، يمكنك الاستفادة من حقيقة أن القيم المرسومة على المحاور لها مستويات مختلفة من التفاصيل - وهذا موصوف ضمن مفهوم التسلسل الهرمي للتغييرات. لنفترض أن البلدان تقع في المستوى الأول من التسلسل الهرمي، وتقع المدن في المستوى الثاني. لاحظ أنه بدءًا من SQL Server 2000، تدعم خدمات التحليل ما يسمى بالتسلسلات الهرمية غير المتوازنة، والتي تحتوي، على سبيل المثال، على أعضاء لا يتم تضمين "توابعهم" في المستويات المجاورة من التسلسل الهرمي أو تكون مفقودة بالنسبة لبعض أعضاء التغيير. أحد الأمثلة النموذجية لهذا التسلسل الهرمي هو الأخذ في الاعتبار حقيقة أنه في بلدان مختلفة قد تكون أو لا توجد وحدات إدارية إقليمية مثل دولة أو منطقة، تقع في التسلسل الهرمي الجغرافي بين البلدان والمدن (الشكل 2).

    لاحظ أنه أصبح من الشائع في الآونة الأخيرة التمييز بين التسلسلات الهرمية النموذجية، على سبيل المثال تلك التي تحتوي على بيانات جغرافية أو زمنية، وكذلك دعم وجود عدة تسلسلات هرمية في بُعد واحد (على وجه الخصوص، للتقويم والسنة المالية).

    إنشاء مكعبات OLAP في SQL Server 2005

    يتم إنشاء مكعبات SQL Server 2005 باستخدام SQL Server Business Intelligence Development Studio. هذه الأداة عبارة عن إصدار خاص من Visual Studio 2005 مصمم لحل هذه الفئة من المشكلات (وإذا كانت لديك بيئة تطوير مثبتة بالفعل، فسيتم استكمال قائمة قوالب المشاريع بمشاريع مصممة لإنشاء حلول تعتمد على SQL Sever وخدماتها التحليلية) . على وجه الخصوص، تم تصميم قالب مشروع خدمات التحليل لإنشاء حلول تعتمد على الخدمات التحليلية (الشكل 3).

    لإنشاء مكعب OLAP، عليك أولاً أن تقرر البيانات التي ستشكله. في أغلب الأحيان، يتم بناء مكعبات OLAP على أساس مستودعات البيانات العلائقية ذات مخططات النجوم أو ندفة الثلج (تحدثنا عنها في الجزء السابق من المقالة). تتضمن حزمة SQL مثالاً لمثل هذا التخزين - قاعدة بيانات AdventureWorksDW، لاستخدامها كمصدر يجب أن تجد مجلد مصادر البيانات في Solution Explorer، وحدد عنصر قائمة سياق مصدر البيانات الجديد وأجب بالتتابع عن أسئلة المعالج المقابل ( الشكل 4).

    ومن المستحسن بعد ذلك إنشاء طريقة عرض مصدر البيانات التي سيتم إنشاء المكعب عليها. للقيام بذلك، تحتاج إلى تحديد عنصر قائمة السياق المناسب في مجلد طرق عرض مصدر البيانات والإجابة باستمرار على أسئلة المعالج. ستكون نتيجة هذه الإجراءات عبارة عن مخطط بيانات، والذي سيتم من خلاله إنشاء تمثيل لمصادر البيانات، وفي المخطط الناتج، بدلاً من الأسماء الأصلية، يمكنك تحديد أسماء الجداول "المألوفة" (الشكل 5) .

    يمكن نقل المكعب الموصوف بهذه الطريقة إلى خادم الخدمات التحليلية عن طريق تحديد خيار النشر من قائمة سياق المشروع وعرض بياناته (الشكل 7).

    يستفيد إنشاء المكعب الآن من العديد من ميزات الإصدار الجديد من SQL Server، مثل عرض مصدر البيانات. يتم الآن وصف البيانات المصدر لإنشاء المكعب، بالإضافة إلى وصف بنية المكعب، باستخدام أداة Visual Studio المألوفة لدى العديد من المطورين، وهي ميزة كبيرة للإصدار الجديد من هذا المنتج - يتم تقليل دراسة الأدوات الجديدة من قبل مطوري الحلول التحليلية في هذه الحالة.

    لاحظ أنه في المكعب الذي تم إنشاؤه، يمكنك تغيير تكوين المقاييس، وحذف سمات البعد وإضافتها، وإضافة السمات المحسوبة لأعضاء البعد بناءً على السمات الموجودة (الشكل 8).

    أرز. 8. أضف سمة محسوبة

    بالإضافة إلى ذلك، يمكن لمكعبات SQL Server 2005 تجميع أعضاء البعد أو فرزهم تلقائيًا حسب قيمة السمة، وتحديد العلاقات بين السمات، وتنفيذ علاقات متعدد إلى متعدد، وتحديد مقاييس الأعمال الرئيسية، وغير ذلك الكثير (تعرف على كيفية العثور على كل هذه الخطوات في البرنامج التعليمي لخدمات تحليل SQL Server في تعليمات هذا المنتج).

    في الأجزاء اللاحقة من هذا المنشور، سنستمر في استكشاف الخدمات التحليلية لـ SQL Server 2005 ومعرفة ما هو جديد في مجال دعم استخراج البيانات.

    لقد كنت مقيمًا في حبر منذ فترة طويلة، لكنني لم أقرأ أبدًا مقالات حول موضوع المكعبات متعددة الأبعاد، OLAP وMDX، على الرغم من أن الموضوع مثير للاهتمام للغاية ويصبح أكثر أهمية كل يوم.
    ليس سراً أنه خلال تلك الفترة القصيرة من تطوير قواعد البيانات والمحاسبة الإلكترونية والأنظمة عبر الإنترنت، تراكمت الكثير من البيانات نفسها. والآن، يعد التحليل الكامل للأرشيف، وربما محاولة التنبؤ بمواقف نماذج مماثلة في المستقبل، أمرًا مثيرًا للاهتمام أيضًا.
    من ناحية أخرى، يمكن للشركات الكبيرة، حتى على مدار عدة سنوات أو أشهر أو حتى أسابيع، تجميع كميات كبيرة من البيانات حتى أن تحليلها الأساسي يتطلب أساليب غير عادية ومتطلبات أجهزة صارمة. يمكن أن تكون هذه أنظمة معالجة المعاملات المصرفية، ووكلاء الأوراق المالية، ومشغلي الهاتف، وما إلى ذلك.
    أعتقد أن الجميع يدرك جيدًا طريقتين مختلفتين لتصميم قاعدة البيانات: OLTP وOLAP. تم تصميم النهج الأول (معالجة المعاملات عبر الإنترنت - معالجة المعاملات في الوقت الحقيقي) لجمع البيانات بكفاءة في الوقت الحقيقي، في حين أن النهج الثاني (المعالجة التحليلية عبر الإنترنت - المعالجة التحليلية في الوقت الحقيقي) يهدف على وجه التحديد إلى أخذ عينات ومعالجة البيانات بأكثر الطرق كفاءة. طريق.

    دعونا نلقي نظرة على القدرات الرئيسية لمكعبات OLAP الحديثة والمشكلات التي تحلها (يتم أخذ خدمات التحليل 2005/2008 كأساس):

    • الوصول السريع إلى البيانات
    • التجميع المسبق
    • تَسَلسُل
    • العمل مع الوقت
    • لغة الوصول إلى البيانات متعددة الأبعاد
    • KPI (مؤشرات الأداء الرئيسية)
    • التعدين التاريخ
    • التخزين المؤقت متعدد المستويات
    • دعم متعدد اللغات
    لذلك، دعونا نلقي نظرة على قدرات مكعبات OLAP بمزيد من التفاصيل.

    المزيد عن الاحتمالات

    الوصول السريع إلى البيانات
    في الواقع، الوصول السريع إلى البيانات، بغض النظر عن حجم المصفوفة، هو أساس أنظمة OLAP. وبما أن هذا هو محور التركيز الرئيسي، فعادةً ما يتم بناء مستودع البيانات على مبادئ مختلفة عن مبادئ قواعد البيانات العلائقية.
    هنا، يتم قياس الوقت اللازم لجلب البيانات البسيطة بأجزاء من الثانية، والاستعلام الذي يتجاوز بضع ثوانٍ على الأرجح يتطلب التحسين.

    التجميع المسبق
    بالإضافة إلى استرداد البيانات الموجودة بسرعة، فإنه يوفر أيضًا القدرة على التجميع المسبق للقيم "الأكثر احتمالاً للاستخدام". على سبيل المثال، إذا كان لدينا سجلات يومية لمبيعات منتج معين، فإن النظام ربمايمكننا أيضًا تجميع مبالغ المبيعات الشهرية والربع سنوية مسبقًا، مما يعني أنه إذا طلبنا بيانات شهرية أو ربع سنوية، فسيقدم لنا النظام النتيجة على الفور. لماذا لا يحدث التجميع المسبق دائمًا نظرًا لوجود مجموعات محتملة من السلع/الوقت/وما إلى ذلك؟ يمكن أن يكون هناك عدد كبير، مما يعني أنك بحاجة إلى قواعد واضحة بشأن العناصر التي سيتم بناء التجميع عليها وتلك التي لن يتم بناؤها. بشكل عام، موضوع مراعاة هذه القواعد والتصميم الفعلي للتجمعات واسع النطاق ويستحق مقالة منفصلة في حد ذاته.

    التسلسلات الهرمية
    ومن الطبيعي أنه عند تحليل البيانات وبناء التقارير النهائية، لا بد من الأخذ في الاعتبار أن الأشهر تتكون من أيام، وهي في حد ذاتها تشكل أرباعًا، ويتم تضمين المدن في المناطق التي بدورها جزء من مناطق أو دول . والخبر السار هو أن مكعبات OLAP تعرض في البداية البيانات من حيث التسلسلات الهرمية والعلاقات مع المعلمات الأخرى لنفس الكيان، لذا فإن بناء واستخدام التسلسلات الهرمية في المكعبات أمر بسيط للغاية.

    العمل مع الوقت
    نظرًا لأن تحليل البيانات يتم بشكل أساسي في المناطق الزمنية، فإن الوقت يحظى بأهمية خاصة في أنظمة OLAP، مما يعني أنه بمجرد تحديد النظام حيث لدينا وقت هنا، يمكنك في المستقبل استخدام وظائف مثل Year To Date وMonth To Date بسهولة. (الفترة من بداية العام/الشهر إلى التاريخ الحالي)، الفترة الموازية (في نفس اليوم أو الشهر، لكن العام الماضي)، إلخ.

    لغة الوصول إلى البيانات متعددة الأبعاد
    MDX(التعبيرات متعددة الأبعاد) - لغة استعلام للوصول البسيط والفعال إلى هياكل البيانات متعددة الأبعاد. وهذا يوضح كل شيء – سيكون هناك بعض الأمثلة أدناه.

    مؤشرات الأداء الرئيسية (KPI)
    مؤشرات الأداء الرئيسيةهو نظام قياس مالي وغير مالي يساعد المنظمة على تحديد مدى تحقيق الأهداف الإستراتيجية. يمكن تعريف مؤشرات الأداء الرئيسية بكل بساطة في أنظمة OLAP واستخدامها في التقارير.

    تاريخ التعدين
    بيانات التعدين(Data Mining) – في الأساس، تحديد الأنماط أو العلاقات المخفية بين المتغيرات في كميات كبيرة من البيانات.
    لا يحتوي المصطلح الإنجليزي "Data Mining" على ترجمة لا لبس فيها إلى اللغة الروسية (استخراج البيانات، واستخراج البيانات، واستخراج المعلومات، واستخراج البيانات/المعلومات) لذلك يتم استخدامه في معظم الحالات في الأصل. أنجح ترجمة غير مباشرة هي مصطلح "استخراج البيانات" (DMA). ومع ذلك، هذا موضوع منفصل لا يقل إثارة للاهتمام للنظر فيه.

    التخزين المؤقت متعدد المستويات
    في الواقع، لضمان أعلى سرعة للوصول إلى البيانات، بالإضافة إلى هياكل البيانات الصعبة والتجميعات المسبقة، تدعم أنظمة OLAP التخزين المؤقت متعدد المستويات. بالإضافة إلى التخزين المؤقت للاستعلامات البسيطة، يتم أيضًا تخزين أجزاء من البيانات المقروءة من المتجر والقيم المجمعة والقيم المحسوبة مؤقتًا أيضًا. وبالتالي، كلما طالت فترة العمل مع مكعب OLAP، كلما بدأ العمل بشكل أسرع. هناك أيضًا مفهوم "تسخين ذاكرة التخزين المؤقت" - وهي عملية تقوم بإعداد نظام OLAP للعمل مع تقارير أو استعلامات محددة أو جميعها مجتمعة.

    دعم متعدد اللغات
    نعم نعم نعم. كحد أدنى، تدعم Analysis Services 2005/2008 (على الرغم من إصدار Enterprise Edition) تعدد اللغات في الأصل. يكفي توفير ترجمة لمعلمات السلسلة الخاصة ببياناتك، وسيتلقى العميل الذي حدد لغته بيانات محلية.

    مكعبات متعددة الأبعاد

    فما هي بالضبط هذه المكعبات متعددة الأبعاد؟
    دعونا نتخيل مساحة ثلاثية الأبعاد محاورها هي الوقت والمنتجات والعملاء.
    ستشير نقطة في مثل هذه المساحة إلى حقيقة أن أحد المشترين اشترى منتجًا معينًا في شهر معين.

    في الواقع، سيكون المستوى (أو مجموعة كل هذه النقاط) هو المكعب، وبالتالي، سيكون الوقت والمنتجات والعملاء هي أبعاده.
    من الأصعب قليلاً تخيل (ورسم) مكعب رباعي الأبعاد أو أكثر، لكن الجوهر لا يتغير، والأهم من ذلك، بالنسبة لأنظمة OLAP، لا يهم على الإطلاق عدد الأبعاد التي ستعمل بها (في حدود المعقول الحدود طبعا).

    القليل من MDX

    إذًا، ما هو جمال MDX؟ على الأرجح أننا لا نحتاج إلى وصف الطريقة التي نريد بها تحديد البيانات، بل؟ ماذا بالضبطنحن نريد.
    على سبيل المثال،
    يختار
    ( . ) على الأعمدة،
    ( .، . ) على الصفوف
    من
    أين (.، .)

    مما يعني أنني أريد معرفة عدد أجهزة iPhone المباعة في شهري يونيو ويوليو في موزمبيق.
    وفي نفس الوقت أصف أيّهذه هي البيانات التي أريدها و كيفأريد رؤيتهم في التقرير.
    جميلة، أليس كذلك؟

    إليك الأمر الأكثر تعقيدًا بعض الشيء:

    مع الأعضاء متوسط ​​الإنفاق AS
    . / .
    يختار
    (متوسط ​​الإنفاق) على الأعمدة،
    ( ..، .. ) على الصفوف
    من
    أين (.)

    * تم تمييز كود المصدر هذا باستخدام Source Code Highlighter.

    في الواقع، نقوم أولاً بتحديد صيغة حساب "متوسط ​​حجم الشراء" ونحاول مقارنة من (أي جنس) ينفق المزيد من المال في زيارة واحدة لمتجر Apple.

    اللغة نفسها مثيرة للاهتمام للغاية للدراسة والاستخدام، وربما تستحق الكثير من المناقشة.

    خاتمة

    في الواقع، لا تغطي هذه المقالة سوى القليل جدًا من المفاهيم الأساسية؛ أود أن أسميها "مقبلات" - وهي فرصة لإثارة اهتمام مجتمع هبرة بهذا الموضوع وتطويره بشكل أكبر. أما بالنسبة للتنمية، فهناك مجال كبير غير محراث هنا، وسأكون سعيدًا بالإجابة على جميع أسئلتك.

    ملاحظة.هذه هي مشاركتي الأولى حول OLAP وأول منشور على حبري - وسأكون ممتنًا جدًا للتعليقات البناءة.
    تحديث:لقد قمت بنقله إلى SQL، وسوف أقوم بنقله إلى OLAP بمجرد أن يسمحوا لي بإنشاء مدونات جديدة.

    العلامات: إضافة العلامات