تقنيات OLTP وOLAP. تمثيل البيانات متعدد الأبعاد

07.08.2019

أنظمة OLTP وOLAP

في القسم الفرعي السابق، لوحظ أنه من أجل التمثيل المناسب لمجال الموضوع، وسهولة تطوير وصيانة قاعدة البيانات، يجب تخفيض العلاقات إلى الشكل العادي الثالث (هناك أشكال من التطبيع للأوامر العليا، ولكن في الممارسة العملية يتم استخدامها نادرًا جدًا)، أي أنه يجب تطبيعها بدرجة كبيرة. ومع ذلك، فإن العلاقات ذات التطبيع الضعيف لها أيضًا مزاياها، وأهمها أنه إذا تم الوصول إلى قاعدة البيانات بشكل أساسي من خلال الاستعلامات فقط، ونادرًا ما يتم إجراء تعديلات وإضافة البيانات، فإن أخذ العينات الخاصة بها يكون أسرع بكثير. يتم تفسير ذلك من خلال حقيقة أنه في العلاقات الضعيفة، تم بالفعل إجراء اتصالهم ولا يضيع وقت المعالج في هذا. هناك فئتان من الأنظمة التي تكون العلاقات الطبيعية القوية والضعيفة أكثر ملاءمة لها.

تعد نماذج البيانات عالية التطبيع مناسبة تمامًا لتطبيقات OLTP - على - خط عملية يعالج (OLTP) - تطبيقات معالجة المعاملات عبر الإنترنت. من الأمثلة النموذجية لتطبيقات OLTP أنظمة محاسبة المستودعات وأنظمة طلب التذاكر والأنظمة المصرفية التشغيلية وغيرها. وتتمثل المهمة الرئيسية لهذه الأنظمة في تنفيذ عدد كبير من المعاملات القصيرة. المعاملات نفسها بسيطة للغاية، لكن المشكلة تكمن في وجود الكثير من هذه المعاملات، ويتم تنفيذها في وقت واحد، وفي حالة حدوث أخطاء، يجب التراجع عن المعاملة وإعادة النظام إلى الحالة التي كانت عليها قبل بدء المعاملة . تتكون جميع استعلامات قاعدة البيانات تقريبًا في تطبيقات OLTP من أوامر الإدراج والتحديث والحذف. تهدف استعلامات التحديد بشكل أساسي إلى تزويد المستخدمين بمجموعة مختارة من البيانات من أنواع مختلفة من الدلائل. وبالتالي، فإن معظم الطلبات تكون معروفة مسبقًا في مرحلة تصميم النظام. من الأمور الحاسمة لتطبيقات OLTP سرعة وموثوقية عمليات تحديث البيانات القصيرة. كلما ارتفع مستوى تسوية البيانات في تطبيقات OLTP، كلما كانت أسرع وأكثر موثوقية. يمكن أن تحدث الانحرافات عن هذه القاعدة عندما تكون بعض الطلبات المتكررة معروفة، في مرحلة التطوير بالفعل، والتي تتطلب علاقات ربط وتؤثر سرعة تنفيذها بشكل كبير على تشغيل التطبيقات.

نوع آخر من التطبيقات هو تطبيق OLAP – على - خط تحليلية يعالج (OLAP) – تطبيقات لمعالجة البيانات التحليلية عبر الإنترنت. هذا مصطلح عام يصف مبادئ بناء أنظمة دعم القرار - نظام دعم القرار (DSS)، مستودعات البيانات - مستودع البيانات، أنظمة استخراج البيانات - التنقيب في البيانات. تم تصميم هذه الأنظمة للعثور على التبعيات بين البيانات، لإجراء تحليل ديناميكي يعتمد على مبدأ "ماذا لو..." والمهام المماثلة. تعمل تطبيقات OLAP بكميات كبيرة من البيانات المتراكمة في المؤسسة أو المأخوذة من مصادر أخرى. وتتميز هذه الأنظمة بالميزات التالية:

    نادرًا ما تتم إضافة بيانات جديدة إلى النظام في كتل كبيرة، على سبيل المثال، مرة واحدة في الشهر أو ربع السنة؛ كقاعدة عامة، لا يتم حذف البيانات المضافة إلى النظام أبدًا؛
    قبل التحميل، تخضع البيانات لإجراءات تحضيرية مختلفة تتعلق بإحضارها إلى تنسيقات معينة وما شابه ذلك؛ الطلبات المقدمة إلى النظام غير منظمة ومعقدة للغاية؛ تعد سرعة تنفيذ الاستعلام أمرًا مهمًا، ولكنها ليست حاسمة.

عادةً ما يتم تقديم قواعد بيانات تطبيق OLAP على شكل مكعب فائق واحد أو أكثر، تمثل أبعادها البيانات المرجعية، وتقوم خلايا المكعب الفائق نفسه بتخزين قيم هذه البيانات. ماديًا، يمكن بناء المكعب الفائق على أساس نموذج بيانات خاص متعدد الأبعاد - متعدد الأبعاد OLAP (MOLAP) أو ممثلة بنموذج البيانات العلائقية - العلائقية OLAP (رولاب).

في أنظمة OLAP التي تستخدم نموذج البيانات العلائقية، يُنصح بتخزين البيانات في شكل علاقات ضعيفة التطبيع تحتوي على إجماليات أساسية محسوبة مسبقًا. لا يمثل تكرار البيانات والمشكلات ذات الصلة مشكلة هنا، نظرًا لأنه نادرًا ما يتم تحديثها، ويتم إعادة حساب النتائج جنبًا إلى جنب مع تحديث البيانات.

يتم توضيح خصائص ونطاق المهام التي يتم حلها بشكل فعال بواسطة كل تقنية في الجدول المقارن التالي:

صفة مميزة

OLTP

OLAP

الغرض من النظام

التسجيل والبحث التشغيلي ومعالجة المعاملات والتحليل المنظم

العمل مع البيانات التاريخية والمعالجة التحليلية والتنبؤ والنمذجة

بيانات مخزنه

التشغيلية، مفصلة

تغطي فترة زمنية كبيرة، مجمعة

نوع البيانات

منظم

أنواع مختلفة

"عمر" البيانات

الحالي (عدة أشهر)

التاريخية (على مر السنين) والمتوقعة

معدل تحديث البيانات

عالية، في أجزاء صغيرة

صغيرة، في أجزاء كبيرة

مستوى تجميع البيانات

بيانات تفصيلية

البيانات المجمعة بشكل رئيسي

العمليات السائدة

إدخال البيانات، البحث، التحديث

تحليل البيانات

كيفية استخدام البيانات

قابل للتنبؤ

لا يمكن التنبؤ به

مستوى المعاملات

على مستوى قاعدة البيانات

نوع النشاط

العملياتية والتكتيكية

تحليلية، استراتيجية

الأولويات

المرونة
استقلالية المستخدم

عدد كبير من الموظفين التنفيذيين

عدد قليل نسبيا من موظفي الإدارة

مقارنة بين OLTP وOLAP

صفة مميزة

OLTP

OLAP

طبيعة الطلبات

الكثير من المعاملات البسيطة

المعاملات المعقدة

بيانات مخزنه

التشغيلية، مفصلة

تغطي فترة زمنية كبيرة، مجمعة

نوع النشاط

العملياتية والتكتيكية

تحليلية، استراتيجية

نوع البيانات

منظم

أنواع مختلفة

خاصية النظام

النظام المحاسبي (OLTP)

OLAP

تفاعل المستخدم

مستوى المعاملات

على مستوى قاعدة البيانات

البيانات المستخدمة عندما يصل المستخدم إلى النظام

الإدخالات الفردية

مجموعات السجلات

وقت الاستجابة

ثواني

من بضع ثوان إلى بضع دقائق

استخدام موارد الأجهزة

مستقر

متحرك

طبيعة البيانات

أساسي بشكل رئيسي (أدنى مستوى من التفاصيل)

في الغالب المشتقات (القيم الإجمالية)

طبيعة الوصول إلى قاعدة البيانات

مسارات الوصول وعلاقات البيانات المحددة مسبقًا أو الثابتة

مسارات الوصول وعلاقات البيانات غير المحددة أو الديناميكية

تقلب البيانات

عالية (يتم تحديث البيانات مع كل معاملة)

منخفض (نادرًا ما يتم تحديث البيانات أثناء الطلب)

الأولويات

أداء عالي توافر عالي

المرونة
استقلالية المستخدم

مقارنة النماذج المقيسة وغير المقيسة

تحليل معايير نماذج البيانات المقيسة وغير المقيسة

دعونا نجمع نتائج تحليل المعايير التي أردنا من خلالها تقييم تأثير نمذجة البيانات المنطقية على جودة نماذج البيانات المادية وأداء قاعدة البيانات:

وكما يتبين من الجدول، فإن العلاقات الطبيعية الأكثر قوة يتم تصميمها بشكل أفضل (ثلاثة إيجابيات، وواحد ناقص). فهي أكثر صلة بمجال الموضوع، وأسهل في التطوير، ويتم تنفيذ عمليات تعديل قاعدة البيانات بشكل أسرع بالنسبة لها. صحيح أن هذا يتم تحقيقه على حساب بعض التباطؤ في تنفيذ عمليات استرجاع البيانات.

الميزة الوحيدة للعلاقات ضعيفة التطبيع هي أنه إذا تم الوصول إلى قاعدة البيانات فقط من خلال استعلامات لاسترداد البيانات، فسيتم تنفيذ هذه الاستعلامات بشكل أسرع بالنسبة للعلاقات ضعيفة التطبيع. ويرجع ذلك إلى حقيقة أنه في مثل هذه العلاقات تم بالفعل ربط العلاقات ولا يضيع الوقت في ذلك عند استرجاع البيانات.

وبالتالي، فإن اختيار درجة تطبيع العلاقات يعتمد على طبيعة الاستعلامات التي يتم من خلالها الوصول إلى قاعدة البيانات في أغلب الأحيان.

من الممكن تحديد فئات معينة من الأنظمة التي تكون نماذج البيانات المقيسة بقوة أو ضعيفة أكثر ملاءمة لها.

تعد نماذج البيانات عالية التطبيع مناسبة تمامًا لما يسمى تطبيقات OLTP (معالجة المعاملات عبر الإنترنت (OLTP )- معالجة المعاملات السريعة ). الأمثلة النموذجية لتطبيقات OLTP هي أنظمة محاسبة المستودعات، وأنظمة طلب التذاكر، والأنظمة المصرفية التي تقوم بعمليات تحويل الأموال، وما إلى ذلك. وتتمثل المهمة الرئيسية لهذه الأنظمة في تنفيذ عدد كبير من المعاملات القصيرة. تبدو المعاملات نفسها بسيطة نسبيًا، على سبيل المثال، "سحب مبلغ من المال من الحساب أ، وإضافة هذا المبلغ إلى الحساب ب". تكمن المشكلة في أنه أولاً، هناك الكثير من المعاملات، وثانيًا، يتم تنفيذها في وقت واحد (يمكن توصيل عدة آلاف من المستخدمين المتزامنين بالنظام)، وثالثًا، في حالة حدوث خطأ، يجب التراجع عن المعاملة بالكامل وإرجاع النظام إلى الحالة التي كانت قبل بدء المعاملة (لا ينبغي أن يكون هناك موقف يتم فيه سحب الأموال من الحساب أ، ولكن لم تصل إلى الحساب ب). تتكون جميع استعلامات قاعدة البيانات تقريبًا في تطبيقات OLTP من أوامر الإدراج والتحديث والحذف. تم تصميم استعلامات التحديد في المقام الأول للسماح للمستخدمين بالاختيار من بين الدلائل المختلفة. وبالتالي فإن معظم الطلبات تكون معروفة مسبقًا في مرحلة تصميم النظام. لذلك، تعد سرعة وموثوقية عمليات تحديث البيانات القصيرة أمرًا بالغ الأهمية لتطبيقات OLTP. كلما ارتفع مستوى تسوية البيانات في تطبيق OLTP، أصبح أسرع وأكثر موثوقية. يمكن أن تحدث الانحرافات عن هذه القاعدة عندما تكون بعض الاستعلامات التي تحدث بشكل متكرر معروفة، في مرحلة التطوير بالفعل، والتي تتطلب علاقات متصلة وتؤثر سرعة تنفيذها بشكل كبير على تشغيل التطبيقات. في هذه الحالة، يمكنك التضحية بالتطبيع لتسريع تنفيذ مثل هذه الاستعلامات.



نوع آخر من التطبيقات هو ما يسمى تطبيقات أولاب (المعالجة التحليلية عبر الإنترنت (OLAP ) - معالجة البيانات التحليلية التشغيلية ). هذا مصطلح عام يميز مبادئ البناء أنظمة دعم القرار (نظام دعم القرار - مفاجآت صيف دبي ), مستودعات البيانات (مستودع البيانات ), أنظمة استخراج البيانات (بيانات التعدين ). تم تصميم هذه الأنظمة للعثور على التبعيات بين البيانات (على سبيل المثال، يمكنك محاولة تحديد مدى ارتباط حجم مبيعات البضائع بخصائص المشترين المحتملين)، لإجراء تحليل "ماذا لو ...". تعمل تطبيقات OLAP على كميات كبيرة من البيانات المتراكمة بالفعل في تطبيقات OLTP، المأخوذة من جداول البيانات أو مصادر البيانات الأخرى. وتتميز هذه الأنظمة بالميزات التالية:

  • نادرًا ما تتم إضافة بيانات جديدة إلى النظام في كتل كبيرة (على سبيل المثال، بمجرد تنزيل بيانات ربع سنوية بناءً على نتائج المبيعات ربع السنوية من تطبيق OLTP).
  • عادةً لا يتم حذف البيانات المضافة إلى النظام أبدًا.
  • قبل التحميل، تخضع البيانات لإجراءات "تنظيف" مختلفة، وذلك نظرًا لحقيقة أن نظامًا واحدًا يمكنه تلقي البيانات من العديد من المصادر التي لها تنسيقات عرض مختلفة لنفس المفاهيم، وقد تكون البيانات غير صحيحة أو خاطئة.
  • الاستعلامات الموجهة إلى النظام غير منظمة، وعادة ما تكون معقدة للغاية. في كثير من الأحيان، يقوم المحلل بصياغة استعلام جديد لتوضيح النتيجة التي تم الحصول عليها من استعلام سابق.
  • تعد سرعة تنفيذ الاستعلام أمرًا مهمًا، ولكنها ليست حاسمة.

عادةً ما يتم تمثيل البيانات من تطبيقات OLAP كمكعب واحد أو أكثر، تكون أبعادها بيانات مرجعية، وتقوم خلايا المكعب الفائق نفسه بتخزين البيانات الفعلية. على سبيل المثال، يمكنك بناء مكعب فائق، أبعاده هي: الوقت (بالأرباع، السنوات)، نوع المنتج وفروع الشركة، وحجم مبيعات متجر الخلايا. سيحتوي هذا المكعب الفائق على بيانات عن مبيعات أنواع مختلفة من البضائع حسب الربع والقسمة. بناءً على هذه البيانات، يمكنك الإجابة على أسئلة مثل "ما هو القسم الذي حقق أفضل حجم مبيعات هذا العام؟"، أو "كيف هي اتجاهات مبيعات أقسام المنطقة الجنوبية الغربية هذا العام مقارنة بالعام السابق؟"

ماديًا، يمكن بناء المكعب الفائق بناءً على خاص نموذج بيانات متعدد الأبعاد (مولاب - OLAP متعدد الأبعاد ) أو تم إنشاؤها باستخدام نموذج البيانات العلائقية ( رولاب - OLAP العلائقية ).

وبالعودة إلى مشكلة تطبيع البيانات، يمكننا القول أنه في أنظمة OLAP التي تستخدم نموذج البيانات العلائقية (ROLAP)، يُنصح بتخزين البيانات في شكل علاقات طبيعية ضعيفة تحتوي على إجماليات أساسية محسوبة مسبقًا. التكرار الكبير والمشاكل المرتبطة به ليست مخيفة هنا، لأنه يحدث التحديث فقط عند تحميل جزء جديد من البيانات. وفي هذه الحالة، تتم إضافة كل من البيانات الجديدة وإعادة حساب النتائج.

في القسم الفرعي السابق، لوحظ أنه من أجل التمثيل المناسب لمجال الموضوع، وسهولة تطوير وصيانة قاعدة البيانات، يجب تخفيض العلاقات إلى الشكل العادي الثالث (هناك أشكال من التطبيع للأوامر العليا، ولكن في الممارسة العملية يتم استخدامها نادرًا جدًا)، أي يتم تطبيعها بقوة. في الوقت نفسه، تتمتع العلاقات التطبيعية الضعيفة أيضًا بمزاياها، وأهمها أنه إذا تم الوصول إلى قاعدة البيانات بشكل أساسي فقط من خلال الاستعلامات، ونادرًا ما يتم إجراء تعديلات وإضافة البيانات، فإن أخذ العينات الخاصة بها يكون أسرع بكثير. يتم تفسير ذلك من خلال حقيقة أنه في العلاقات الضعيفة، تم بالفعل إجراء اتصالهم ولا يضيع وقت المعالج في هذا. هناك فئتان من الأنظمة التي تكون العلاقات الطبيعية القوية والضعيفة أكثر ملاءمة لها.

تعد نماذج البيانات عالية التطبيع مناسبة تمامًا لتطبيقات OLTP - معالجة المعاملات عبر الإنترنت (OLTP) - تطبيقات معالجة المعاملات عبر الإنترنت. الأمثلة النموذجية لتطبيقات OLTP هي أنظمة محاسبة المستودعات، وأنظمة طلب التذاكر، والأنظمة المصرفية التشغيلية، وغيرها. وتتمثل المهمة الرئيسية لهذه الأنظمة في تنفيذ عدد كبير من المعاملات القصيرة. المعاملات نفسها بسيطة للغاية، ولكن المشكلة تكمن في وجود الكثير من هذه المعاملات، ويتم تنفيذها في وقت واحد، وفي حالة حدوث أخطاء، يجب التراجع عن المعاملة وإعادة النظام إلى الحالة التي كانت عليها قبل بدء المعاملة . تتكون جميع استعلامات قاعدة البيانات تقريبًا في تطبيقات OLTP من أوامر الإدراج والتحديث والحذف. تهدف استعلامات التحديد بشكل أساسي إلى تزويد المستخدمين بمجموعة مختارة من البيانات من أنواع مختلفة من الدلائل. ومع ذلك، فإن معظم الطلبات تكون معروفة مسبقًا في مرحلة تصميم النظام. من الأمور الحاسمة لتطبيقات OLTP سرعة وموثوقية عمليات تحديث البيانات القصيرة. كلما ارتفع مستوى تسوية البيانات في تطبيقات OLTP، كلما كانت أسرع وأكثر موثوقية. يمكن أن تحدث الانحرافات عن هذه القاعدة عندما تكون بعض الطلبات المتكررة معروفة، في مرحلة التطوير بالفعل، والتي تتطلب علاقات متصلة ويعتمد تشغيل التطبيقات بشكل كبير على سرعة تنفيذها.

نوع آخر من التطبيقات هو تطبيقات OLAP - المعالجة التحليلية عبر الإنترنت (OLAP) – تطبيقات لمعالجة البيانات التحليلية عبر الإنترنت. هذا مصطلح عام يصف مبادئ بناء أنظمة دعم القرار - نظام دعم القرار (DSS)، مستودعات البيانات - مستودع البيانات، أنظمة استخراج البيانات - التنقيب في البيانات. تم تصميم هذه الأنظمة للعثور على التبعيات بين البيانات، لإجراء تحليل ديناميكي يعتمد على مبدأ "ماذا لو..." والمهام المماثلة. تعمل تطبيقات OLAP بكميات كبيرة من البيانات المتراكمة في المؤسسة أو المأخوذة من مصادر أخرى. وتتميز هذه الأنظمة بالميزات التالية:

نادرًا ما تتم إضافة بيانات جديدة إلى النظام في كتل كبيرة، على سبيل المثال، مرة واحدة في الشهر أو ربع السنة؛

عادةً لا يتم حذف البيانات المضافة إلى النظام أبدًا؛

قبل التحميل، تخضع البيانات لإجراءات تحضيرية مختلفة تتعلق بإحضارها إلى تنسيقات معينة؛

الاستعلامات الموجهة إلى النظام غير منظمة ومعقدة للغاية؛

تعد سرعة تنفيذ الاستعلام أمرًا مهمًا، ولكنها ليست حاسمة.

عادةً ما يتم تمثيل قواعد بيانات تطبيق OLAP كمكعب واحد أو أكثر، حيث تمثل أبعادها البيانات المرجعية، وتقوم خلايا المكعب الفائق نفسه بتخزين قيم هذه البيانات. ماديًا، يمكن بناء المكعب الفائق بناءً على نموذج بيانات خاص متعدد الأبعاد - OLAP متعدد الأبعاد (MOLAP) أو ممثلة بنموذج البيانات العلائقية - OLAP العلائقية (رولاب).

في أنظمة OLAP التي تستخدم نموذج البيانات العلائقية، من المفيد تخزين البيانات في شكل علاقات غير طبيعية تحتوي على إجماليات أساسية محسوبة مسبقًا. لا يمثل تكرار البيانات والمشكلات ذات الصلة مشكلة هنا، نظرًا لأنه نادرًا ما يتم تحديثها، ويتم إعادة حساب النتائج جنبًا إلى جنب مع تحديث البيانات.


  • - طرق التأكد من موثوقية نظام إمدادات المياه

    يعد ضمان موثوقية نظام إمدادات المياه، بالإضافة إلى أنظمة الخدمة الجماعية الأخرى، أحد المهام الرئيسية في تصميمها. يجب تصميم وبناء النظام بحيث يؤدي وظائفه أثناء التشغيل بطريقة معينة... [اقرأ المزيد]


  • - I. المفهوم الأمني ​​لنظام الحماية

    إن مفهوم الأمان للنظام الجاري تطويره هو "مجموعة من القوانين والقواعد وقواعد السلوك التي تحدد كيفية قيام المنظمة بمعالجة المعلومات وحمايتها ونشرها. على وجه الخصوص، تحدد القواعد الحالات التي يحق للمستخدم التعامل معها... [اقرأ المزيد]


  • - بعد اتخاذ القرارات الرئيسية بشأن تصميم نظام التدفئة

    تصميم نظام تسخين المياه للمبنى ارسم مخططات الوحدات الحرارية عند توصيل نظام التدفئة باستخدام الدوائر المفتوحة والمغلقة. أسئلة للاختبار الذاتي عند توفير الحرارة لعدة مباني. تم تركيب المضخات والمعدات الأخرى... [اقرأ المزيد]


  • - متطلبات ضمان السلامة من الحرائق لنظام الوقاية من الحرائق.

    أساسيات ضمان السلامة من الحرائق للعمليات التكنولوجية. السؤال 2. الوقاية من الحرائق في المنشأة (25 دقيقة) تتضمن الوقاية من الحرائق مجموعة من التدابير التنظيمية والفنية التي تهدف إلى ضمان سلامة الناس... [اقرأ المزيد]


  • - الأنسجة الحيوانية وأنظمة الأعضاء

    الأنسجة الحيوانية. لدى الحيوانات أيضًا عدة أنواع من الأنسجة. وأهمها ما يلي. الأنسجة الظهارية هي أنسجة حدودية تغطي الجسم من الخارج، وتبطن التجاويف الداخلية والأعضاء التي يتكون منها الكبد والرئتين والغدد... [اقرأ المزيد]

    تحتوي جينومات حقيقيات النوى الأعلى على العديد من تسلسلات الحمض النووي المتكررة. ففي البشر، على سبيل المثال، تشغل مثل هذه التكرارات أكثر من 40% من الجينوم بأكمله. ويترتب على ذلك أنه عندما تتشكل DSBs، فإن احتمال التكوين المتزامن لعدة فواصل على طول... [اقرأ المزيد]


  • - تحديد فصائل الدم لنظام ABO باستخدام الأعاصير المضادة لـ A و Anti-B و Anti-AB

    تحديد فصائل الدم وفقًا لهذه القاعدة، يمكن نقل دم جميع المرضى من فصيلة الدم O(1)، نظرًا لأنه لا يحتوي على الراصات، ويمكن نقل متلقي فصيلة الدم AB(1U) بدم من فصائل أخرى، لأنه لا يحتوي على لا تحتوي على مواد راصة. وهنا يتم تقديم المفاهيم..

  •  أنظمة OLTP وOLAP في القسم الفرعي السابق، تمت الإشارة إلى أنه للحصول على تمثيل مناسب لمجال الموضوع، وسهولة تطوير قاعدة البيانات وصيانتها، يجب تقليل العلاقات إلى النموذج العادي الثالث (هناك أشكال لتطبيع الطلبات العليا، ولكن من الناحية العملية يتم استخدامها نادرًا جدًا)، فلا بد من تطبيعها بدرجة كبيرة. ومع ذلك، فإن العلاقات ذات التطبيع الضعيف لها أيضًا مزاياها، وأهمها أنه إذا تم الوصول إلى قاعدة البيانات بشكل أساسي من خلال الاستعلامات فقط، ونادرًا ما يتم إجراء تعديلات وإضافة البيانات، فإن أخذ العينات الخاصة بها يكون أسرع بكثير. يتم تفسير ذلك من خلال حقيقة أنه في العلاقات الضعيفة، تم بالفعل إجراء اتصالهم ولا يضيع وقت المعالج في هذا. هناك فئتان من الأنظمة التي تكون العلاقات الطبيعية القوية والضعيفة أكثر ملاءمة لها. تعد نماذج البيانات عالية التطبيع مناسبة تمامًا لتطبيقات OLTP - معالجة المعاملات عبر الإنترنت (OLTP) - تطبيقات معالجة المعاملات عبر الإنترنت. الأمثلة النموذجية لتطبيقات OLTP هي أنظمة محاسبة المستودعات، وأنظمة طلب التذاكر، والأنظمة المصرفية التشغيلية، وغيرها. وتتمثل المهمة الرئيسية لهذه الأنظمة في تنفيذ عدد كبير من المعاملات القصيرة. المعاملات نفسها بسيطة للغاية، ولكن المشكلة تكمن في وجود الكثير من هذه المعاملات، ويتم تنفيذها في وقت واحد، وفي حالة حدوث أخطاء، يجب التراجع عن المعاملة وإعادة النظام إلى الحالة التي كانت عليها قبل بدء المعاملة . تتكون جميع استعلامات قاعدة البيانات تقريبًا في تطبيقات OLTP من أوامر الإدراج والتحديث والحذف. تهدف استعلامات التحديد بشكل أساسي إلى تزويد المستخدمين بمجموعة مختارة من البيانات من أنواع مختلفة من الدلائل. وبالتالي، فإن معظم الطلبات تكون معروفة مسبقًا في مرحلة تصميم النظام. من الأمور الحاسمة لتطبيقات OLTP سرعة وموثوقية عمليات تحديث البيانات القصيرة. كلما ارتفع مستوى تسوية البيانات في تطبيقات OLTP، كلما كانت أسرع وأكثر موثوقية. يمكن أن تحدث الانحرافات عن هذه القاعدة عندما تكون بعض الطلبات المتكررة معروفة، في مرحلة التطوير بالفعل، والتي تتطلب علاقات ربط وتؤثر سرعة تنفيذها بشكل كبير على تشغيل التطبيقات. نوع آخر من التطبيقات هو تطبيقات OLAP - المعالجة التحليلية عبر الإنترنت (OLAP) - تطبيقات لمعالجة البيانات التحليلية التشغيلية. هذا مصطلح عام يصف مبادئ بناء أنظمة دعم القرار - نظام دعم القرار (DSS)، مستودعات البيانات - مستودع البيانات، أنظمة استخراج البيانات - التنقيب في البيانات. تم تصميم هذه الأنظمة للعثور على التبعيات بين البيانات، لإجراء تحليل ديناميكي يعتمد على مبدأ "ماذا لو..." والمهام المماثلة. تعمل تطبيقات OLAP بكميات كبيرة من البيانات المتراكمة في المؤسسة أو المأخوذة من مصادر أخرى. وتتميز هذه الأنظمة بالميزات التالية: * إضافة بيانات جديدة إلى النظام نادراً ما يحدث نسبياً في كتل كبيرة، على سبيل المثال، مرة واحدة في الشهر أو ربع السنة؛ * البيانات المضافة إلى النظام، كقاعدة عامة، لا يتم حذفها أبدًا؛ * قبل التحميل، تخضع البيانات لإجراءات تحضيرية مختلفة تتعلق بإحضارها إلى تنسيقات معينة وما شابه ذلك؛ * الطلبات المقدمة إلى النظام غير منظمة ومعقدة للغاية؛ * سرعة تنفيذ الاستعلام مهمة ولكنها ليست حاسمة. عادةً ما يتم تمثيل قواعد بيانات تطبيق OLAP كمكعب واحد أو أكثر، حيث تمثل أبعادها البيانات المرجعية، وتقوم خلايا المكعب الفائق نفسه بتخزين قيم هذه البيانات. ماديًا، يمكن بناء المكعب الفائق على أساس نموذج بيانات خاص متعدد الأبعاد - OLAP متعدد الأبعاد (MOLAP) أو تمثيله عن طريق نموذج بيانات علائقي - OLAP علائقي (ROLAP). في أنظمة OLAP التي تستخدم نموذج البيانات العلائقية، من المفيد تخزين البيانات في شكل علاقات ضعيفة التطبيع تحتوي على إجماليات أساسية محسوبة مسبقًا. لا يمثل تكرار البيانات والمشكلات ذات الصلة مشكلة هنا، نظرًا لأنه نادرًا ما يتم تحديثها، ويتم إعادة حساب النتائج جنبًا إلى جنب مع تحديث البيانات. يتم توضيح خصائص ونطاق المهام التي يتم حلها بشكل فعال بواسطة كل تقنية من خلال جدول المقارنة التالي: الخصائص OLTPOLAP الغرض من النظام التسجيل والبحث التشغيلي ومعالجة المعاملات والتحليل المنظم العمل مع البيانات التاريخية والمعالجة التحليلية والتنبؤ والنمذجة البيانات المخزنة التشغيلية والتفصيلية التي تغطي فترة كبيرة الوقت المجمع نوع البيانات منظم الأنواع المختلفة "عمر" البيانات الحالية (عدة أشهر) التاريخية (على مر السنين) والمتوقعة تكرار تحديثات البيانات مرتفع، في "أجزاء" صغيرة صغير، في "أجزاء" كبيرة مستوى تجميع البيانات بيانات تفصيلية مجمعة بشكل رئيسي البيانات العمليات السائدة إدخال البيانات والبحث والتحديث تحليل البيانات طريقة استخدام البيانات يمكن التنبؤ بها لا يمكن التنبؤ بها تفاعل المستخدم على مستوى المعاملات على مستوى بيانات قاعدة البيانات بأكملها نوع النشاط العملياتي والتكتيكي التحليلي والاستراتيجية الأولويات الأداء العالي التوفر العالي المرونة استقلالية المستخدم فئة المستخدمون عدد كبير من الموظفين على المستوى التنفيذي عدد صغير نسبيًا من الموظفين على المستوى التنفيذي مقارنة بين OLTP وOLAP خصائص OLTP OLAP طبيعة الاستعلامات العديد من المعاملات البسيطة المعاملات المعقدة البيانات المخزنة تشغيلية ومفصلة تغطي فترة كبيرة من الوقت ومعرف النشاط المجمع التشغيلي والتكتيكي التحليلي , stratum-gical نوع البيانات منظم متعدد الأنواع خاصية النظام المحاسبي (OLTP) OLAP التفاعل مع المستخدم على مستوى المعاملة على مستوى قاعدة البيانات بأكملها البيانات المستخدمة عندما يصل المستخدم إلى النظام السجلات الفردية مجموعات السجلات زمن الاستجابة ثواني من عدة ثوانٍ إلى عدة دقائق استخدام موارد الأجهزة طبيعة ديناميكية ثابتة للبيانات أساسي بشكل أساسي (أدنى مستوى من التفاصيل) مشتق بشكل أساسي (قيم ملخصة) طبيعة الوصول إلى قاعدة البيانات مسارات وصول محددة أو ثابتة وعلاقات البيانات مسارات وصول وعلاقات بيانات غير محددة أو ديناميكية تقلب البيانات مرتفع (يتم تحديث البيانات مع كل معاملة) منخفض (نادرًا ما يتم تحديث البيانات أثناء الاستعلام) الأولويات أداء عالٍ توفر عالي مرونة استقلالية المستخدم

    من الممكن تحديد فئات معينة من الأنظمة التي تكون نماذج البيانات المقيسة بقوة أو ضعيفة أكثر ملاءمة لها.

    تعد نماذج البيانات عالية التطبيع مناسبة تمامًا لما يسمى تطبيقات OLTP(معالجة المعاملات عبر الإنترنت (OLTP)-معالجة المعاملات السريعة ). الأمثلة النموذجية لتطبيقات OLTP هي أنظمة محاسبة المستودعات، وأنظمة طلب التذاكر، والأنظمة المصرفية التي تقوم بعمليات تحويل الأموال، وما إلى ذلك.

    وتتمثل المهمة الرئيسية لهذه الأنظمة في تنفيذ عدد كبير من المعاملات القصيرة. تبدو المعاملات نفسها بسيطة نسبيًا، على سبيل المثال، "سحب مبلغ من المال من الحساب أ، وإضافة هذا المبلغ إلى الحساب ب".

    تكمن المشكلة في أنه أولاً، هناك الكثير من المعاملات، وثانيًا، يتم تنفيذها في وقت واحد (يمكن توصيل عدة آلاف من المستخدمين المتزامنين بالنظام)، وثالثًا، في حالة حدوث خطأ، يجب التراجع عن المعاملة بالكامل وإرجاع النظام إلى الحالة التي كانت قبل بدء المعاملة (لا ينبغي أن يكون هناك موقف يتم فيه سحب الأموال من الحساب أ، ولكن لم تصل إلى الحساب ب). تتكون جميع استعلامات قاعدة البيانات تقريبًا في تطبيقات OLTP من أوامر الإدراج والتحديث والحذف. لذلك، تعد سرعة وموثوقية عمليات تحديث البيانات القصيرة أمرًا بالغ الأهمية لتطبيقات OLTP. كلما ارتفع مستوى تسوية البيانات في تطبيق OLTP، أصبح أسرع وأكثر موثوقية.

    نوع آخر من التطبيقات هو ما يسمى تطبيقات أولاب(المعالجة التحليلية عبر الإنترنت(OLAP) -معالجة البيانات التحليلية التشغيلية ). هذا مصطلح عام يميز مبادئ البناء أنظمة دعم القرار (نظام دعم القرار-مفاجآت صيف دبي),مستودعات البيانات(مستودع البيانات),أنظمة استخراج البيانات (بيانات التعدين). تم تصميم هذه الأنظمة للعثور على التبعيات بين البيانات (على سبيل المثال، يمكنك محاولة تحديد مدى ارتباط حجم مبيعات البضائع بخصائص المشترين المحتملين)، لإجراء تحليل "ماذا لو ...".

    تعمل تطبيقات OLAP على كميات كبيرة من البيانات المتراكمة بالفعل في تطبيقات OLTP، المأخوذة من جداول البيانات أو مصادر البيانات الأخرى. وتتميز هذه الأنظمة بالميزات التالية:

    نادرًا ما تتم إضافة بيانات جديدة إلى النظام في كتل كبيرة (على سبيل المثال، بمجرد تنزيل بيانات ربع سنوية بناءً على نتائج المبيعات ربع السنوية من تطبيق OLTP).

    عادةً لا يتم حذف البيانات المضافة إلى النظام أبدًا.

    قبل التحميل، تخضع البيانات لإجراءات "تنظيف" مختلفة، وذلك نظرًا لحقيقة أن نظامًا واحدًا يمكنه تلقي البيانات من العديد من المصادر التي لها تنسيقات عرض مختلفة لنفس المفاهيم، وقد تكون البيانات غير صحيحة أو خاطئة.

    الاستعلامات الموجهة إلى النظام غير منظمة، وعادة ما تكون معقدة للغاية.

    تعد سرعة تنفيذ الاستعلام أمرًا مهمًا، ولكنها ليست حاسمة.

    عادةً ما يتم تمثيل البيانات من تطبيقات OLAP كمكعب واحد أو أكثر، تكون أبعادها بيانات مرجعية، وتقوم خلايا المكعب الفائق نفسه بتخزين البيانات الفعلية. على سبيل المثال، يمكنك بناء مكعب فائق، أبعاده هي: الوقت (بالأرباع، السنوات)، نوع المنتج وفروع الشركة، وحجم مبيعات متجر الخلايا. سيحتوي هذا المكعب الفائق على بيانات عن مبيعات أنواع مختلفة من البضائع حسب الربع والقسمة. بناءً على هذه البيانات، يمكنك الإجابة على أسئلة مثل "ما هو القسم الذي حقق أفضل حجم مبيعات هذا العام؟"، أو "كيف هي اتجاهات مبيعات أقسام المنطقة الجنوبية الغربية هذا العام مقارنة بالعام السابق؟"

    وبالعودة إلى مشكلة تطبيع البيانات، يمكننا القول أنه في أنظمة OLAP التي تستخدم نموذج البيانات العلائقية (ROLAP)، يُنصح بتخزين البيانات في شكل علاقات طبيعية ضعيفة تحتوي على إجماليات أساسية محسوبة مسبقًا. التكرار الكبير والمشاكل المرتبطة به ليست مخيفة هنا، لأنه يحدث التحديث فقط عند تحميل جزء جديد من البيانات. وفي هذه الحالة، تتم إضافة كل من البيانات الجديدة وإعادة حساب النتائج.

    • < Назад
    • إلى الأمام >