دعونا نلقي نظرة على مفهوم تحسين محركات البحث (SEO) من الألف إلى الياء بالكلمات البشرية. ما الذي ينجح في البيئة الحالية؟ المفاهيم والمبادئ الأساسية لأساليب البحث ذات الترتيب الصفري SEO

06.12.2023

يؤدي الطلب المتزايد على مقدمي الخدمات الذين يقدمون مجموعة واسعة من خدمات الحوسبة السحابية لعدد كبير من المستخدمين حول العالم إلى زيادة عدد التطبيقات التي تهدف إلى معالجة كميات كبيرة من البيانات. وبالتالي، أدى إدخال التقنيات السحابية إلى ظهور أساليب جديدة لتحسين الاستعلامات في قواعد البيانات السحابية. تحلل المقالة الطرق الفعالة لحل مشكلة تحسين الاستعلام. تم تسليط الضوء على الاتجاهات الرئيسية التي تسمح بتحسين تشغيل قواعد البيانات السحابية - في مراكز البيانات السحابية بتنسيق SQL والنموذج الجديد لبناء استعلامات NoSQL. تتناول المقالة الحلول المعتمدة على الهندسة المعمارية، ومن سماتها استخدام النهج الديناميكي. يتم عرض نتائج التنفيذ التجريبي، مع الأخذ في الاعتبار مزايا وعيوب أساليب وأساليب تحسين الاستعلام.

تحسين الاستعلام

طرق تحسين البحث

قواعد البيانات السحابية

حوسبة سحابية

1. نيكولشيف إي.في. إدارة حركة المرور الديناميكية للشبكات المعرفة بالبرمجيات في البنية التحتية السحابية / E.V. نيكولتشيف ، إس. باين، إي.في. بلوجنيك // نشرة جامعة ريازان لهندسة الراديو. – 2003. – العدد 3. – ص54-57.

2. نيكولشيف إي.في. استخدام مجموعات التماثل لتحديد الأنظمة المعقدة / E.V. نيكولشيف // التقنيات الحسابية - 2004. - ت 9. - رقم 3. - ص 72-80.

3. نيكولشيف إي.في. بناء نموذج لتحميل قنوات الاتصال في شبكات نقل البيانات بالاعتماد على المنهج الهندسي / E.V. نيكولتشيف ، إس. Payain // أخبار مؤسسات التعليم العالي. مشكلات الطباعة والنشر – 2008. – العدد 6. – ص 91 – 95.

4. بلوجنيك إي.في. قواعد البيانات شبه المنظمة في البنية التحتية السحابية الهجينة / E.V. بلوجنيك، إي.في. نيكولشيف // المشاكل الحديثة للعلوم والتعليم. 2013.- رقم 4. URL: www.. تاريخ الوصول: 15.10.2013.

5. بلوجنيك إي.في. عمل النظم التعليمية في البنية التحتية السحابية الهجينة / E.V. بلوجنيك، إي.في. نيكولشيف // أخبار الجامعات. مشاكل الطباعة والنشر. 2013. - رقم 3. - ص 96-105.

6. Fegaras L. إطار عمل الأمثل لاستعلامات تقليل الخريطة / L. Fegaras, C. Li, U. Gupta // Proc. المؤتمر الدولي الخامس عشر لتوسيع تكنولوجيا قواعد البيانات. – ACM، 2012. – ص 26-37.

7. Jahani E. التحسين التلقائي لبرامج MapReduce / E. Jahani، M. J. Cafarella، C. Ré // Proceedings of the VLDB Endowment. – 2011. – المجلد 4. – العدد 6. – ص 385-396.

8. Jurczyk P. المعالجة الديناميكية للاستعلام لخدمات بيانات p2p في السحابة / P. Jurczyk، L. Xiong // تطبيقات قواعد البيانات والأنظمة المتخصصة. – سبرينغر برلين هايدلبرغ، 2009. – ص 396-411.

9. Lemmon M. D. نحو إطار سلبي للتحكم في الطاقة وإدارة وقت الاستجابة في الحوسبة السحابية // In Proc. الدولي السابع ورشة عمل حول حوسبة التغذية الراجعة، سان خوسيه، كاليفورنيا.. 2012.

10. Wang X. نهج ترحيل الآلة الافتراضية اللامركزية لمراكز البيانات للحوسبة السحابية / X. Wang, X. Liu, L. Fan, X. Jia // المشكلات الرياضية في الهندسة [المجلة الإلكترونية]. - 2013. - V. 2013. - وضع الوصول: http://www.hindawi.com/journals/mpe/2013/878542/، مجانًا. - تاريخ الوصول: 15/10/2013.

11. Zhang G. تحسين الاستعلام عن البيانات الضخمة في المجموعات الكبيرة / G. Zhang، Chao LI، Yong Zhang، Chunxiao Xing. // مجلة نظم المعلومات الحاسوبية. - 2012. – ج.8. – ص3191–3198.

مقدمة

هناك العديد من التعريفات لمصطلح "تحسين الاستعلام"، وأكثرها شيوعًا في الأدبيات هي كما يلي: يُفهم تحسين الاستعلام على أنه وظيفة نظام إدارة قواعد البيانات (DBMS) التي تبحث عن خطة تنفيذ الاستعلام الأمثل من كل ما هو ممكن لاستعلام معين، أو العملية تغيير الاستعلام و/أو بنية قاعدة البيانات (DB) ) لتقليل استخدام موارد الحوسبة عند تنفيذ الاستعلام.

حاليًا، تتطور تكنولوجيا الحوسبة السحابية وتنتشر. يؤدي الطلب المتزايد على مقدمي الخدمات الذين يقدمون مجموعة واسعة من خدمات الحوسبة السحابية لعدد كبير من المستخدمين حول العالم إلى زيادة عدد التطبيقات التي تهدف إلى معالجة كميات كبيرة من البيانات. يؤدي عمل قواعد البيانات في البيئة السحابية إلى الحاجة إلى البحث عن أدوات جديدة.

الغرض من هذا العمل هو تصنيف وتحليل التطورات الحالية التي يمكن استخدامها لتحسين البحث في قواعد البيانات السحابية.

لاحظ أنه يجب أيضًا أخذ طوبولوجيا الشبكة في الاعتبار عند حل مشكلة تحسين الاستعلام في أنظمة التخزين السحابية.

1. تحسين الاستعلامات في قواعد بيانات SQL السحابية

تتلخص معالجة الاستعلام في تحويل استعلام عالي المستوى إلى نموذج منخفض المستوى مكافئ، والصعوبة الرئيسية في هذه الحالة هي ضمان كفاءة التحويل، مع مراعاة خصوصيات التخزين السحابي.

تستخدم استعلامات SQL القياسية الصلات والتحديدات والإسقاطات والتجميعات الجانبية.

يتم توفير وصف للبنية المصممة لمعالجة وتخزين كميات كبيرة من البيانات بناءً على الخوارزميات الدلالية للبحث عن خطة تنفيذ الاستعلام الحالي في مخطط تنفيذ الاستعلام العالمي (الشكل 1).

أرز. 1. بنية نظام يعتمد على استعلامات SQL

المبادئ الأساسية لهذه البنية هي كما يلي:

1. يتم تخزين كافة الملفات في نظام الملفات المحلي (على سبيل المثال، نظام ملفات Windows، Linux، وما إلى ذلك).

2. تم تصميم قاعدة البيانات السحابية لتخزين وإدارة صفائف ضخمة من ملفات الفهرس والبيانات الوصفية. تجدر الإشارة إلى أن قاعدة البيانات السحابية بكل محتوياتها يتم نشرها فوق نظام الملفات الموزع.

3. يتم إدخال الاستعلامات والحصول على النتائج من خلال واجهة مستخدم الويب.

4. بعد تلقي طلب المستخدم، يتم إجراء بحث دلالي عن خطة تنفيذ الطلب الحالي في المخطط العام (كمجموعة فرعية).

أظهرت نتائج التنفيذ التجريبي للهندسة المعمارية، التي قدمها المؤلفون، زيادة في الإنتاجية بمقدار أربعة أضعاف، مما يشير إلى فعالية الخوارزميات المستخدمة.

2. تحسين الاستعلامات في قواعد بيانات NoSQL السحابية

يعد نموذج برمجة تقليل الخريطة (MR) منصة حوسبة سحابية شائعة تتيح تحليل كميات كبيرة من البيانات في السحابة. يسهل MR التنفيذ المتوازي للمهام الخاصة التي تستغرق وقتًا طويلاً لتحليل كميات كبيرة من البيانات في مجموعة ذات بنية لا شيء مشترك. الفكرة الأساسية لنموذج MR بسيطة. يتم تمثيل كل مهمة MR كخريطة وتقليل المهمة. تحدد مهمة الخريطة كيفية معالجة أزواج المفتاح/القيمة لإنشاء مجموعة من الأزواج المتوسطة، بينما تحدد مهمة التخفيض كيفية دمج جميع القيم المتوسطة المرتبطة بوسيطة واحدة. يستخدم نواة MR نظام الملفات الموزعة (DFS) لتخزين البيانات ونسخها.

يعتمد النهج المقترح على استخدام جبر الاستعلام واستخدام بعض عوامل التشغيل ذات الترتيب الأعلى التي يتم تنفيذها في أنظمة تقليل الخريطة الحالية (على سبيل المثال، Hadoop). لاحظ أن النهج المقترح يركز بشكل أساسي على الاستخدام مع لغة MRQL. على عكس لغات تقليل الخريطة الأخرى الموجودة، مثل HiveQL وPigLatin، والتي تسمح لك بإنشاء نصوص برمجية باستخدام لغات غير تعريفية، فإن MRQL معبرة تمامًا وتسمح لك بكتابة نصوصك البرمجية الخاصة لمجموعة كبيرة من المهام في شكل تعريفي وفي في نفس الوقت قابلة للتحسين.

كما هو الحال مع قواعد البيانات العلائقية، فإن الهدف من تحسين استعلامات MRQL هو العثور على خطة التنفيذ المثالية. تتكون خوارزمية تقييم خطة تنفيذ استعلام MRQL من الخطوات التالية:

1) تبسيط الطلب.

2) بناء الرسم البياني الاستعلام.

3) تمثيل الرسم البياني الاستعلام في شكل جبري.

4) تكوين خريطة من الصورة الجبرية لتقييم وتحسين الخطة باستخدام طريقة التحسين الجبرية.

5) إنشاء وظيفة تركيبة MR بناءً على وظيفة تقليل MR.

تتمثل ميزة هذا النهج في أن الخوارزميات المطورة يتم تنفيذها في شكل إطار عمل، الكود المصدري له متاح مجانًا. وفي الوقت نفسه، المشروع يتطور حاليا بنشاط.

يعد نظام Manimal بمثابة تطور آخر يهدف إلى تحسين برامج تقليل الخريطة. يعتمد النظام على آلية تحليل التعليمات البرمجية الثابتة لاكتشاف الكتل التي يمكن تحسينها. وفقًا للمؤلفين، مثل معظم أدوات تحسين لغة البرمجة، فإن Manimal هو نظام فعال إلى أقصى حد، ولكن مع ذلك، فإن هذا لا يضمن اكتشاف جميع الكتل الموجودة التي يمكن تحسينها، لأنه من الممكن دائمًا التطوير بطريقة ولا يمكن تحسين النتيجة تلقائيًا في المستقبل.

يتكون Manimal من ثلاثة مكونات رئيسية تسمح لك بأتمتة عملية تحسين برامج تقليل الخريطة بشكل كامل. يقوم المحلل بفحص برامج تقليل الخريطة المقدمة من قبل المستخدم ويرسل واصف التحسين الناتج إلى المحسن. يستخدم المحسن واصف التحسين مع المعلمات المحسوبة مسبقًا والمخزنة في دليل محدد لتحديد خطة التنفيذ المثالية، والنتيجة هي واصف التنفيذ. يتم إرسال هذا المقبض مع نسخة من البرنامج الأصلي إلى مصنع التنفيذ. لاحظ أن مصنع التنفيذ يحافظ على التسلسل القياسي للتقليل من الخريطة العشوائية.

وفقًا لمانيمال، فإنه يستخدم ثلاثة أساليب مختلفة للتحسين:

1) تحسين الاختيار. التحديدات الموجودة في الكود هي نتيجة وظيفة Map()، والتي يتم تنفيذها فقط في ظل ظروف معينة مفروضة على المعلمات المرتبطة. كما هو الحال مع أخذ العينات العلائقية، ليس هناك فائدة من معالجة البيانات التي لا تستوفي الشروط المفروضة؛ أي استدعاء لـmap() على هذه البيانات سيكون بلا معنى. كما هو الحال مع أخذ العينات العلائقية، يمكن إجراء التحسين باستخدام أشجار B. من الإنجازات المهمة التي حققها Manimal هو أن النظام يمكنه التعرف تلقائيًا على العينات التي تستوفي الشروط الموضحة أعلاه.

2) تحسين الإسقاط. يعمل تحسين الإسقاط على تعديل ملفات البيانات الموجودة على القرص بحيث يتم تخزين وحدات البايت المطلوبة بالفعل لتنفيذ تعليمات المستخدم البرمجية فقط. سيؤدي ضغط الملف المصدر عن طريق إزالة الحقول غير المستخدمة إلى تقليل حجم الملف والسماح بمعالجته.

3) تحسين ضغط البيانات. يختلف ضغط البيانات عن الضغط الذي يدعمه Hadoop. يقوم Hadoop بتخزين الإصدارات المضغوطة من بيانات الإدخال والصور الوسيطة لها على القرص. يتم التفريغ مباشرة قبل وظائف الخريطة () وتقليل (). في الوقت نفسه، يستخدم Hadoop تقنية واحدة لضغط البيانات لجميع الملفات، بينما يسمح Manimal باستخدام شكلين من أشكال الضغط مرتبطين لغويًا: ضغط دلتا والعمل مباشرة مع البيانات المضغوطة.

أظهرت نتائج التنفيذ التجريبي لبرنامج Manimal على مجموعة من خمس عقد في حالتين من أصل أربع أداءً مشابهًا لأداء أنظمة إدارة قواعد البيانات العلائقية. ومع ذلك، فإن معظم فرص التحسين التي تم تحديدها لم توفر مكاسب كبيرة في الأداء. بناءً على التجارب، يمكننا أن نستنتج أن نظام المانيمال لديه إمكانات، ولكنه يحتاج إلى مزيد من التطوير.

3. الحلول المعتمدة على الهندسة المعمارية

تم اقتراح الإدارة اللامركزية لترحيل الآلة الافتراضية في مراكز المعالجة السحابية واسعة النطاق في . الاهتمام الرئيسي لهذا النهج هو أن هدفه هو موازنة الحمل على المعدات من خلال ترحيل الأجهزة الافتراضية إلى بيئة سحابية، مما يؤدي بشكل غير مباشر إلى زيادة جودة البحث (من الواضح، السرعة التي يتم بها "السحابة" "الاستجابة لطلبات المستخدمين هي أحد معايير جودة البحث).

في كثير من الأحيان، يتم تطوير وتنفيذ حلول مركزية لإدارة الموارد داخل مراكز البيانات واسعة النطاق، ولكن في هذه الحالة، يؤدي فشل عقدة التحكم إلى عدم إمكانية تشغيل النظام بأكمله. ويرد وصف للآلية اللامركزية لتجنب هذه المشكلة.

كما يظهر في الشكل. 2، ترسل كل عقدة نشطة، أثناء التشغيل، بشكل انتقائي مؤشر التحميل الخاص بها إلى بعض عقد النظام في فترة زمنية معينة، بينما تتلقى في نفس الوقت مؤشرات الحمل للعقد النشطة المختارة عشوائيًا. في هذه الحالة، تتغير العقد المستهدفة عند كل تكرار. تتم إضافة معلومات حول تحميل العقد الأخرى إلى ناقل التحميل الخاص بالعقدة الحالية. وبالتالي، فإن متوسط طول ناقل تحميل العقدة يساوي عدد تكرارات إرسال الفهرس. سيتم تخزين المعلومات حول الحمل بشكل لا مركزي، مما سيتجنب المشاكل في حالة فشل بعض العقد. وهناك نقطة إيجابية أخرى وهي أن حركة مرور الشبكة سيتم توزيعها عبر جميع العقد النشطة (على عكس المخطط الذي يتم التحكم فيه مركزيًا، حيث يجب أن تمر جميع الحزم عبر نقاط مشتركة؛ العقدة).

أرز. 2. تبادل مؤشر الحمل اللامركزي.

فهرس تحميل العقدة هو صف من النموذج التالي:

لي = ,

حيث src هو معرف العقدة التي تم الحصول على الفهرس منها، ويحتوي dest على معرف العقدة التي ستتلقى الفهرس، وutil هو استخدام وحدة المعالجة المركزية للعقدة المصدر (src).

نظرًا لأن الأجهزة الافتراضية تستضيف مجموعة متنوعة من التطبيقات ذات أحمال عمل وحدة المعالجة المركزية (CPU) المتنوعة، فقد يختلف الاستخدام الفعلي لوحدة المعالجة المركزية (CPU) بشكل كبير بمرور الوقت. في هذه الحالة، يمكن اتخاذ قرار ترحيل جهاز افتراضي في حالتين:

1. عندما يتجاوز استخدام وحدة المعالجة المركزية مستوى معينًا (العتبة العليا). الغرض من تحديد الحد الأعلى هو الحفاظ على قوة الحوسبة الإضافية في حالة ظهور مواقف مع زيادة حادة (غير مخطط لها) في الحمل.

2. عندما يكون استخدام وحدة المعالجة المركزية أقل من مستوى معين (الحد الأدنى)، فإن العقدة تكون غير مستغلة بشكل كافٍ. الهدف من تحديد حد أدنى هو وضع أكبر عدد ممكن من العقد الفعلية في وضع السكون، وبالتالي تقليل استهلاك الطاقة.

بعد اتخاذ القرار بترحيل الجهاز الظاهري، يبدأ البحث عن العقدة الوجهة. للقيام بذلك، يتم اجتياز متجه التحميل للعقدة الحالية من أجل اكتشاف العقدة ذات أقل استهلاك لوحدة المعالجة المركزية، بشرط أن تقع ضمن الفواصل الزمنية المحددة. إذا تعذر العثور على مثل هذه العقدة، فسيتم إجراء بحث عن العقدة التي لا يتجاوز فهرس تحميلها، عند نقل الجهاز الظاهري المحدد إليها، حد التحميل الأدنى. إذا لم يسفر البحث في هذه الحالة عن نتائج، فسيتم تحويل إحدى العقد في وضع "السكون" إلى الحالة النشطة ويتم تنفيذ الترحيل.

وتجدر الإشارة إلى أن عيوب النهج قيد النظر هي:

1. لا تضمن الخوارزميات (الرموز الزائفة) الموضحة في هذا المستند الاختيار الإلزامي لجهاز افتراضي للترحيل، حتى لو كان ذلك ضروريًا وكانت هناك عقد فعلية مجانية.

2. لم يتم أخذ الاختيار الأمثل للأجهزة الافتراضية للترحيل بعين الاعتبار.

3. لا يتم البحث عن العقدة المستهدفة على مجموعة العقد بأكملها (حسب وصف النهج).

4. لم يتم ذكر عدد المرات التي يتم فيها التحقق من احتياجات الهجرة.

الخوارزميات (على الأقل بالشكل الذي يتم تقديمها به) لا تأخذ في الاعتبار مدة كون العقدة في حالة تحميل متزايد: من الواضح أنه مع التحميل القصير، يمكن أن تقلل مدة الترحيل من كفاءتها .

هناك توجيهات جارية حاليًا لتطوير أساليب ديناميكية تعتمد على عمل . تستخدم هذه الأعمال نماذج ديناميكية في شكل نظام من نماذج الفروق المحدودة بناءً على النماذج المحددة.

تناقش الورقة مخططًا لتنفيذ وتحسين الاستعلامات الموزعة الديناميكية في شبكات نظير إلى نظير السحابية (الشكل 3)؛ كما طور المؤلفون إطار عمل (DObjects) للعمل مع شبكات p2p.

أحد العناصر الأساسية لمعالجة الطلب في النهج المقترح هو وجود نواة يمكنها التكيف ديناميكيًا مع ظروف الشبكة ومصادرها. في هذا النهج، يتم تنفيذ مخرجات النتائج والحسابات الفيزيائية وفقًا للخطة بشكل ديناميكي ومتكرر.

يضمن هذا الأسلوب استجابة أفضل لتغييرات التحميل ويقلل زمن الوصول في النظام. تجدر الإشارة إلى أن تحسين تنفيذ الاستعلام على قواعد البيانات المحلية في النهج الحالي يقع على عاتق المحولات ومصادر البيانات.

أرز. 3. بنية الشبكة السحابية من نظير إلى نظير (p2p).

يتكون تنفيذ الاستعلام وتحسينه من عدة مراحل رئيسية:

1. عندما تتلقى العقدة طلبًا من المستخدم، يتم إنشاء خطة تنفيذ عالية المستوى.

2. في الخطوة التالية، تقوم العقدة التي تنفذ الطلب بتحديد العناصر النشطة للخطة من الأعلى إلى الأسفل بالترتيب. ومع ذلك، يمكن تفويض تنفيذ العنصر النشط إلى أي عقدة في النظام من أجل تحقيق قياس الحمل. لتحديد عقدة التنفيذ المستهدفة في الشبكة، يتم نشر وحدة يمكنها التكيف مع تفاصيل الشبكة وتحميل الموارد. إذا تم نقل عنصر نشط للتنفيذ إلى عقدة بعيدة، فسيتم أيضًا تعيين التحكم في عناصره الفرعية لهذه العقدة. يمكن للعقدة البعيدة بدورها أن تقرر نقل العقد الفرعية لعنصر الخطة للتنفيذ إلى العقد الأخرى، أو للتنفيذ محليًا.

وميزة هذا النهج هو أنه يمكن تنفيذه في أقصر وقت ممكن، حيث تم تنفيذ الخوارزميات في شكل إطار (مجموعة من المكتبات). ومع ذلك، فإن مراكز البيانات السحابية القائمة على شبكات نظير إلى نظير لا تُستخدم حاليًا إلا قليلاً في الممارسة العملية.

خاتمة

كل من الأساليب المقدمة لها مزايا وعيوب. والعيب المشترك للجميع هو الطبيعة الاصطناعية للنتائج، أي أنه تم الحصول على إحصاءات التنفيذ على أنظمة اصطناعية تم إنشاؤها فقط لاختبار النهج.

ومع ذلك، يشير عدد كبير نسبيًا من الدراسات في مجال حديث العهد إلى أن مشكلة التحسين ذات صلة وأن مثل هذه التطورات ستكون مطلوبة في المستقبل القريب.

المراجعون:

فينوكور إيه آي، دكتور في العلوم التقنية، أستاذ ومدير معهد وسائل الإعلام المطبوعة وتكنولوجيا المعلومات، إيفان فيدوروف، جامعة موسكو الحكومية لفنون الطباعة، موسكو.

نيكولشيف إي في، دكتوراه في العلوم التقنية، أستاذ ونائب رئيس الجامعة للعمل العلمي في المؤسسة التعليمية الوطنية للتعليم المهني العالي، معهد موسكو التكنولوجي "VTU"، موسكو.

الرابط الببليوغرافي

ليونوف د. طرق تحسين البحث في قواعد البيانات السحابية // المشكلات الحديثة للعلوم والتعليم. – 2013. – رقم 5.;
عنوان URL: http://science-education.ru/ru/article/view?id=10654 (تاريخ الوصول: 20/08/2019). نلفت انتباهكم إلى المجلات التي تصدرها دار النشر "أكاديمية العلوم الطبيعية"

مرحبا اصدقاء! في هذه المقالة سنلقي نظرة على المفاهيم والمبادئ الأساسية لتحسين محركات البحث (SEO) التي تؤثر على محركات البحث Yandex و Google. إذا هيا بنا!

المبادئ الأساسية لتحسين محركات البحث SEO

أهمية نشر الضيف

منذ وقت ليس ببعيد كانت هناك ضجة حقيقية حول حظر استخدام محركات البحث. كان لها الفضل في شخصية غير مرغوب فيها. ولكن، مع ذلك، لا يزال نشر الضيف يحظى بشعبية كبيرة بين المسوقين للترويج لمورد الإنترنت. الشيء الرئيسي المطلوب منك هو إنشاء محتوى عالي الجودة.

خلق جو مناسب على موارد الويب للمستخدمين

مهما كانت أنشطة تحسين محركات البحث (SEO) التي تقوم بها، يجب أن تتذكر أن التصميم المناسب لموقع الويب هو ضمان لحركة المرور الخاصة به. وبالفعل، بغض النظر عن الحيل التي تستخدمها للترويج لمورد الويب، كل هذا سيكون بلا معنى إذا لم يكن موقعك مثيرًا للاهتمام للمستخدم. ولذلك، فمن الضروري إنشاء واجهة بسيطة ومفهومة. فقط في هذه الحالة يكون لموقعك فرصة ليحتل مرتبة عالية في محركات البحث.

العنصر الرئيسي لأي مورد ويب هو وضع محتوى عالي الجودة

هذا كل شيء لهذا اليوم، حظًا سعيدًا للجميع ونراكم مرة أخرى!

المحاضرة 5. تحسين استرجاع المعلومات: التوصيات

عملية البحث عن المعلوماتعادة ما تكون ذات طبيعة تجريبية. وفي هذه الحالة يكون سلوك المستخدم، باعتباره البداية التنظيمية لإدارة عملية البحث، مدفوعًا بما يلي:

حاجة المعلومات،
تنوع الاستراتيجيات والتقنيات والأدوات التي يوفرها النظام.

لتقييم مدى كفاية تعبير الاستعلامواكتمال النتيجة التي تم الحصول عليها، يمكن للمستخدم:

العثور على معلومات إضافية،
تنظيم عملية البحث بحيث يمكن استخدام جزء من نتائج البحث لتأكيد أو نفي مدى كفاية جزء آخر.

الكائنات التشغيلية المشاركة بشكل مباشر في تفاعل المستخدم مع محرك البحث هيصورة ‏البحث عن وثيقة‏و صورة طلب البحث.

بحث عن صورة الوثيقة - وصف الوثيقة، معبراً عنه بلغة استرجاع المعلومات وتوصيف المحتوى الدلالي الرئيسي أو أي ميزات أخرى لهذه الوثيقة ضرورية للبحث فيها عند الطلب.

تقنيات استرجاع المعلومات- ص أدوات البحث والتقنيات المستخدمة لتلبية احتياجات المعلومات. ويتم تحديدها حسب نوع المشكلة التي يحلها أمين المكتبة: نسبة معرفته وجهله بالموضوع قيد الدراسة. بالإضافة إلى ذلك، يتم تحديد عملية التفاعل بين أمين المكتبة والنظام من خلال مستوى معرفته بالوظيفة.النظام كأداة ومعرفة محتوى المورد (اكتمال عرض المعلومات، وموثوقية المصدر، وما إلى ذلك).

يجب تقسيم إجراءات العثور على المعلومات اللازمة إلى أربع مراحل رئيسية:

1. تنظيم البحث

تعريف مجال المعرفة؛
اختيار نوع البيانات ومصادرها؛

2. تنفيذ عملية البحث

تنظيم البحث بناءً على الأجزاء الأولية من الكلمة،
صياغة "صورة البحث" ،
بحث التحسين النهائي

من المقبول عمومًا تنظيم البحث بناءً على الأجزاء الأولية من الكلمة (البحث مع الاقتطاع على اليمين). على سبيل المثال، بدلا من كلمة "مكتبة"، يمكنك إدخال شظيتها « مكتبة*". في هذه الحالة، سيتم العثور على المستندات التي لا تحتوي على الكلمة فقط « المكتبة "، بل أيضًا"مكتبة"، "أمين مكتبة"، " علم المكتبات"، وما إلى ذلك. في كل حالة على حدة، يجب على أمين المكتبة أن يفهم بوضوح ما يجب العثور عليه (""صياغة صورة البحث"")، لأنه في الخيار المقترح له سيتم العثور على عدد أكبر بكثير من المستندات مقارنة بتحديد الكلمة بالكامل (بدون اقتطاع). في مجموعة المعلومات الناتجة، يمكنك إجراء بحث توضيحي، ونتيجة لذلك، الحصول على بيانات أكثر صلة وذات صلة.

3. تقييم نتائج البحث

يجب أن تستوفي نتيجة البحث المتطلبات التالية:

التفرد,
اكتمال,
تناسق

تحدد أنواع البحث المختلفة متطلبات مختلفة لوظيفة نظام البحث من حيث تقييم النتيجة. ومع ذلك، لهذه القضيةبحث الموضوعيعد إثبات الاكتمال أمرًا بديهيًا: تؤكد نتيجة البحث نفسها وجود (أو عدم وجود) كائن له الخصائص المطلوبة. في هذه الحالة النتيجةالبحث الموضوعيمتعددة وتتطلب التنظيم اللاحق - خطوة إجرائية أخرى لترتيب مجموعة الكائنات الناتجة وفقًا لقيم الأساس غير المحددة بشكل صريح. وبدورها،بحث إشكالييفترض بالفعل تنظيمًا على مستويين.

يتم تعقيد الطلب وتحديده وتفصيله، في حالة الإجابة غير المرضية، عن طريق تعديل صورة البحث، أيإعادة صياغةطلب وإجراء بحث ثانٍ في نفس مجموعة البيانات التي تم الحصول عليها نتيجة للبحث الأولي. يُنصح بالتحقق مرة أخرى من نفس الطلب في محركات بحث مختلفة (على سبيل المثال، مزيج من Google وYandex).

4. معالجة نتائج البحث

اختيار المعلومات الأكثر فائدة؛
اختيار طريقة معالجة المعلومات
البحث عن الأنماط والقواعد الرسمية والروابط الهيكلية في المعلومات المجمعة؛
التفسير الإبداعي للنتائج التي تم الحصول عليها؛
تكامل "المعرفة" المستخرجة.

يتم تطوير عملية البحث عن طريق تعديل تعبير POS، وذلك من خلال إعادة صياغة الاستعلام وإجراء بحث ثانٍ في نفس مصفوفة البيانات أو في مصفوفة فرعية تم الحصول عليها نتيجة للبحث الأولي.

طرق معالجة نتائج البحث

بناءً على طبيعة التحولات (في سياق الاستخدام الإضافي لنتائج المعالجة)، يمكن تقسيم طرق معالجة نتائج البحث إلى مجموعتين:

التحولات الهيكلية والشكلية؛
المعلومات التحليلية (التحولات المنطقية الدلالية والهيكلية الدلالية).

تُستخدم محركات البحث مباشرة للبحث، والتي يصل عددها إلى عدة مئات في العالم. وهي تركز على أنواع معينة من الاستعلامات أو مجموعة منها (الببليوغرافية، والعنوان، والواقعية، والموضوعية، وما إلى ذلك). بالإضافة إلى ذلك، هناك محركات بحث للنصوص الكاملة والمختلطة وغيرها.

فهرس

نظرًا للتعقيد وقلة المعرفة بكائنات التصميم، فإن معايير الجودة والقيود المفروضة على مشكلة التحسين البارامترية، كقاعدة عامة، معقدة للغاية بحيث لا يمكن استخدام الأساليب الكلاسيكية للبحث عن الحد الأقصى. لذلك، في الممارسة العملية، يتم إعطاء الأفضلية لأساليب تحسين محرك البحث. دعونا نفكر المراحل الرئيسية لأي طريقة بحث.

البيانات المدخلة في طرق البحث هي الدقة المطلوبة للطريقة ونقطة بداية البحث X 0 .

ثم يتم تحديد حجم خطوة البحث حووفقا لبعض القواعد يتم الحصول على نقاط جديدة X ك +1 بالنقطة السابقة X كفي ك= 0، 1، 2، … ويستمر الحصول على النقاط الجديدة حتى تحقق شرط إيقاف البحث. تعتبر نقطة البحث الأخيرة هي الحل لمشكلة التحسين. جميع نقاط البحث تشكل مسار البحث.

تختلف طرق البحث عن بعضها البعض في إجراء اختيار حجم الخطوة ح(يمكن أن تكون الخطوة هي نفسها في جميع تكرارات الطريقة أو يتم حسابها عند كل تكرار)، وخوارزمية الحصول على نقطة جديدة وشرط إيقاف البحث.

بالنسبة للطرق التي تستخدم حجم خطوة ثابت، ح ينبغي اختيار دقة أقل بكثير ه. إذا كان بحجم الخطوة المحدد حإذا لم يكن من الممكن الحصول على حل بالدقة المطلوبة، فأنت بحاجة إلى تقليل حجم الخطوة ومواصلة البحث من النقطة الأخيرة للمسار الحالي.

من المعتاد استخدام ما يلي كشروط لإنهاء البحث:

1) جميع نقاط البحث المجاورة أسوأ من النقطة السابقة؛

2) ج F(X ك +1 )-F(X ك ) ç £ هأي قيم الدالة الموضوعية و(س)عند النقاط المتجاورة (الجديدة والسابقة) تختلف عن بعضها البعض بمقدار لا يزيد عن الدقة المطلوبة ه;

3) ,أنا = 1, …, n، أي أن جميع المشتقات الجزئية عند نقطة البحث الجديدة تساوي عمليا 0، أي أنها تختلف عن 0 بمقدار لا يتجاوز الدقة e.

خوارزمية للحصول على نقطة بحث جديدة X ك+1 على النقطة السابقة X كتختلف كل طريقة بحث عن الأخرى، ولكن يجب ألا تكون كل نقطة بحث جديدة أسوأ من السابقة: إذا كانت مشكلة التحسين تمثل الحد الأدنى من مشكلة البحث، إذن و(X ك +1 ) £ و(X ك ).

عادةً ما يتم تصنيف طرق تحسين محركات البحث وفقًا لترتيب مشتق دالة الهدف المستخدمة للحصول على نقاط جديدة. وبالتالي، في طرق البحث ذات الترتيب الصفري ليست هناك حاجة لحساب المشتقات، بل تكون الدالة نفسها كافية و(X).تستخدم طرق البحث من الدرجة الأولى المشتقات الجزئية الأولى، وتستخدم طرق البحث من الدرجة الثانية مصفوفة المشتقة الثانية (مصفوفة هسه).

كلما ارتفع ترتيب المشتقات، كلما كان اختيار نقطة بحث جديدة أكثر تبريرًا وقل عدد تكرارات الطريقة. ولكن في الوقت نفسه، يتطلب كل تكرار عمالة كثيفة بسبب الحاجة إلى الحساب العددي للمشتقات.

يتم تحديد فعالية طريقة البحث من خلال عدد التكرارات وعدد حسابات الدالة الهدف و(س)في كل تكرار للطريقة.

دعونا نفكر طرق البحث الأكثر شيوعا، ترتيبها حسب عدد التكرارات المتناقص.

لطرق البحث ذات الترتيب الصفريما يلي صحيح: في طريقة البحث العشوائي، من المستحيل التنبؤ بعدد العمليات الحسابية مسبقًا و(س)في تكرار واحد ن، وفي طريقة النسب الإحداثي ن 2 جنيه إسترليني × ن، أين ن- عدد المعلمات الخاضعة للرقابة X = (س 1 , س 2 .,…, س ن ).

لطرق البحث من الدرجة الأولىالتقديرات التالية صحيحة: في طريقة التدرج مع خطوة ثابتة ن = 2 × ن; في طريقة التدرج مع التقسيم التدريجي ن=2 × ن + ن 1 ، أين ن 1 - عدد الحسابات و(س)،ضروري للتحقق من ظروف التكسير التدريجي؛ في طريقة الهبوط الأكثر حدة ن = 2 × ن + ن 2 ، أين ن 2 - عدد الحسابات و(س)،ضروري لحساب حجم الخطوة الأمثل؛ وفي طريقة دافيدون-فليتشر-باول (DFP). ن = 2 × ن + ن 3 , أين ن 3 - عدد الحسابات و(س)،ضروري لحساب مصفوفة تقريبية لمصفوفة هسه (للكميات ن 1 , ن 2 , ن 3 النسبة صالحة ن 1 < ن 2 < ن 3 ).

وأخيرا في طريقة الترتيب الثاني- طريقة نيوتن ن = 3 × ن 2 .

عند الحصول على هذه التقديرات، يفترض إجراء حساب تقريبي للمشتقات باستخدام صيغ الفروق المحدودة، أي أنه لحساب المشتق من الدرجة الأولى، هناك حاجة إلى قيمتين للدالة الموضوعية و(س)،وبالنسبة للمشتق الثاني – قيم الدالة عند ثلاث نقاط.

من الناحية العملية، وجدت طريقة الهبوط الأكثر انحدارًا وطريقة DFT استخدامًا واسع النطاق كطرق ذات نسبة مثالية لعدد التكرارات وكثافة اليد العاملة.

لنبدأ بالنظر إلى طرق البحث ذات الترتيب الصفري. وفي طريقة البحث العشوائي تكون البيانات الأولية هي الدقة المطلوبة للطريقة، وهي نقطة بداية البحث X 0 = (س 1 0 , س 2 0 , …, س ن 0 ) وحجم خطوة البحث ح.

يتم البحث عن نقاط جديدة في اتجاه عشوائي، حيث يتم تأجيل الخطوة المحددة ح، وبالتالي الحصول على نقطة المحاكمة والتحقق مما إذا كانت نقطة التجربة أفضل من نقطة البحث السابقة. بالنسبة لمشكلة البحث الدنيا فهذا يعني أن:

(6.19)

إذا تم استيفاء هذا الشرط، فسيتم تضمين نقطة التجربة في مسار البحث (
). وبخلاف ذلك، يتم استبعاد نقطة الاختبار من الاعتبار ويتم تحديد اتجاه عشوائي جديد من النقطة X ك , ك= 0، 1، 2، … (الشكل 6.3).

X ك +1

و(س)

على الرغم من بساطة هذه الطريقة، إلا أن عيبها الرئيسي هو حقيقة أنه من غير المعروف مسبقًا عدد الاتجاهات العشوائية المطلوبة للحصول على نقطة جديدة في مسار البحث X ك +1 مما يجعل تكلفة تكرار واحد مرتفعة للغاية.

أرز. 6.3. نحو أسلوب البحث العشوائي

بالإضافة إلى ذلك، نظرًا لأن اختيار اتجاه البحث لا يستخدم معلومات حول وظيفة الهدف و(س)عدد التكرارات في طريقة البحث العشوائي كبير جدًا.

وفي هذا الصدد، تم استخدام طريقة البحث العشوائي لدراسة الأجسام التصميمية غير المدروسة وللهروب من منطقة جذب الحد الأدنى المحلي عند البحث عن الحد الأقصى العالمي للدالة الموضوعية.

على عكس طريقة البحث العشوائي، في طريقة النسب الإحداثي، يتم اختيار الاتجاهات الموازية للمحاور الإحداثية كاتجاهات بحث محتملة، كما أن الحركة ممكنة في اتجاه زيادة ونقصان قيمة الإحداثيات.

البيانات الأولية في طريقة النسب الإحداثية هي حجم الخطوة حونقطة بداية البحث X 0 = (س 1 0 , س 2 . 0 ,…, س ن 0 ) . نبدأ الحركة من النقطة X 0 على طول المحور x 1 في اتجاه الإحداثيات المتزايدة. دعونا نحصل على نقطة الاختبار
(س 1 ك + ح, س 2 ك ,…, س ن ك), ك= 0. دعونا نقارن قيمة الدالة و(س)بقيمة الدالة عند نقطة البحث السابقة X k .

لو
(نفترض أننا بحاجة إلى حل مشكلة التقليل و(س)، ثم يتم تضمين نقطة التجربة في مسار البحث (
) .

وبخلاف ذلك، فإننا نستبعد نقطة الاختبار من الاعتبار ونحصل على نقطة اختبار جديدة تتحرك على طول المحور س 1 نحو تناقص الإحداثيات. دعونا نحصل على نقطة الاختبار
(س 1 ك – ح, س 2 ك ,…, س ن ك). تحقق فيما لو
، ثم نواصل التحرك على طول المحور x 2 في اتجاه زيادة الإحداثيات. دعونا نحصل على نقطة الاختبار
(س 1 ك + ح, س 2 ك ,…, س ن ك)، إلخ.

عند إنشاء مسار البحث، يُحظر تكرار الحركة على طول النقاط المدرجة في مسار البحث.

ويستمر الحصول على نقاط جديدة بطريقة النسب الإحداثي حتى يتم الحصول على النقطة X k والتي يكون جميع المجاورة لها 2× ننقاط الاختبار (في كل الاتجاهات س 1 , س 2 , …, س نفي اتجاه زيادة وخفض قيم الإحداثيات) سيكون أسوأ، أي
. ثم يتوقف البحث ويتم تحديد النقطة الأخيرة من مسار البحث باعتبارها النقطة الدنيا س*= س ك .

دعونا نلقي نظرة على تشغيل طريقة النسب الإحداثي باستخدام مثال (الشكل 2.21): ن = 2, X = (س 1 , س 2 )، F (س 1 , س 2 )  دقيقة, F(س 1 , س 2 ) = (س 1 – 1) 2 + (س 2 – 2) 2 , ح= 1، س 0 = (0, 1) .

نبدأ في التحرك على طول المحور س 1 إلى أعلى

الإحداثيات. دعونا نحصل على نقطة الاختبار الأولى

(س 1 0 + ح, س 2 0 ) = (1, 1), F() = (1-1) 2 + (1-2) 2 = 1,

و(X 0 ) = (0-1) 2 + (1-2) 2 = 2,

F( ) < Ф(Х 0 )  X 1 = (1, 1).

س 1 من النقطة X 1

=(س 1 1 + ح, س 2 1 ) = (2, 1), F( ) = (2-1) 2 + (1-2) 2 = 2,

و(X 1 ) = (1-1) 2 + (1-2) 2 = 1,

إنه F( ) > ح(خ 1 ) – يتم استبعاد نقطة الاختبار ذات الإحداثيات (2، 1) من الاعتبار، ويستمر البحث عن الحد الأدنى من النقطة X 1 .

نواصل التحرك على طول المحور س 2 من النقطة X 1 نحو زيادة الإحداثيات. دعونا نحصل على نقطة الاختبار

= (س 1 1 , س 2 1 + ح) = (1, 2), F( ) = (1-1) 2 + (2-2) 2 = 0,

و(X 1 ) = (1-1) 2 + (1-2) 2 = 1,

F( ) < Ф(Х 1 )  X 2 = (1, 2).

نواصل التحرك على طول المحور س 2 من النقطة X 2 نحو زيادة الإحداثيات. دعونا نحصل على نقطة الاختبار

= (س 1 2 , س 2 2 + ح) = (1, 3), F( ) = (1-1) 2 + (3-2) 2 = 1,

و(X 2 ) = (1-1) 2 + (2-2) 2 = 0,

إنه F( ) > ح(خ 2 ) – يتم استبعاد نقطة الاختبار ذات الإحداثيات (1، 3) من الاعتبار، ويستمر البحث عن الحد الأدنى من النقطة X 2 .

5. استمر في التحرك على طول المحور س 1 من النقطة X 2 نحو زيادة الإحداثيات. دعونا نحصل على نقطة الاختبار

= (س 1 2 + ح, س 2 2 ) = (2, 2), F( ) = (2-1) 2 + (2-2) 2 =1,

و(X 2 ) = (1-1) 2 + (2 - 2) 2 = 0,

إنه و(X ^ ) > ح(خ 2 ) – يتم استبعاد نقطة الاختبار ذات الإحداثيات (2، 2) من الاعتبار، ويستمر البحث عن الحد الأدنى من النقطة X 2 .

6. استمر في التحرك على طول المحور س 1 من النقطة X 2 نحو تناقص الإحداثيات. دعونا نحصل على نقطة الاختبار

= (س 1 2 - ح, س 2 2 ) = (0, 2), F( ) = (0-1) 2 +(2-2) 2 = 1,

و(X 2 ) = (1-1) 2 + (2 - 2) 2 = 0,

إنه F( ) > ح(خ 2 ) – يتم استبعاد نقطة الاختبار ذات الإحداثيات (0، 2) من الاعتبار، ويتم الانتهاء من البحث عن الحد الأدنى، حيث بالنسبة للنقطة X 2 استيفاء شرط إيقاف البحث. النقطة الدنيا للدالة F(س 1 , س 2 ) = (س 1 – 1) 2 + (س 2 - 2) 2 هو X * = س 2 .

في طرق البحث من الدرجة الأولى، كاتجاه البحث عن أقصى دالة موضوعية و(س)يتم تحديد ناقل التدرج للوظيفة الهدف خريج(و(X ك )) للعثور على الحد الأدنى - ناقل التدرج - خريج(و(X ك )) . في هذه الحالة، يتم استخدام خاصية متجه التدرج للإشارة إلى اتجاه أسرع تغيير في الدالة:

الخاصية التالية مهمة أيضًا لدراسة طرق البحث من الدرجة الأولى: التدرج المتجه خريج(و(X ك )) ، موجه عادي إلى خط مستوى الوظيفة و(س)عند هذه النقطة X ك .

خطوط المستوىهي منحنيات تأخذ فيها الدالة قيمة ثابتة ( F(X) = شاركnst).

يناقش هذا القسم خمسة تعديلات على طريقة التدرج:

- طريقة التدرج مع خطوة ثابتة،

- طريقة التدرج مع تقسيم الخطوة،

- طريقة النزول الحاد،

– طريقة دافيدون-فليتشر-باول (DFP)،

– طريقة التكيف ذات المستويين.

في طريقة التدرج ذات الخطوة الثابتة، تكون البيانات الأولية هي الدقة المطلوبة ه، نقطة انطلاق البحث X 0 وخطوة البحث ح.

X ك+1 = X ك - ح× خريجF(X ك ) ، ك=0،1،2،… (6.20)

تنطبق الصيغة (2.58) على الوظيفة و(س)تحتاج إلى العثور على الحد الأدنى. إذا تم طرح مشكلة التحسين البارامترية كمشكلة بحث قصوى، فإنه للحصول على نقاط جديدة في طريقة التدرج بخطوة ثابتة، يتم استخدام الصيغة:

X ك+1 = X ك + ح× خريجF(X ك )، ك = 0، 1، 2، ... (6.21)

كل من الصيغ (6.20)، (6.21) هي علاقة متجهة تتضمن معادلات n. على سبيل المثال، مع الأخذ بعين الاعتبار X ك +1 = (س 1 ك +1 , س 2 ك +1 ,…, س ن ك +1 )، العاشر ك =(س 1 ك , س 2 ك ,…, س ن ك ) :

(6.22)

أو، في شكل عددي،

(6.23)

في الصورة العامة (2.61) يمكننا أن نكتب:

(6.24)

كقاعدة عامة، يتم استخدام مزيج من شرطين كشرط لإيقاف البحث في جميع طرق التدرج: ç F(X ك +1 ) - F(X ك ) ç £ هأو
للجميع أنا =1, …, ن.

 خذ بعين الاعتبار مثالاً لإيجاد الحد الأدنى باستخدام طريقة التدرج بخطوة ثابتة لنفس الوظيفة كما في طريقة النسب الإحداثي:

ن = 2, X = (س 1 , س 2 ),  =0.1,

F(س 1 , س 2 ) = (س 1 – 1) 2 + (س 2 – 2) 2  دقيقة, ح = 0,3, X 0 = (0, 1).

دعونا نحصل على نقطة X 1 حسب الصيغة (2.45):

F(X 1 ) = (0.6–1) 2 + (1.6–2) 2 = 0.32، ف(X 0 ) = (0 –1) 2 + (1–2) 2 = 2.

 F(X 1 ) - F(X 0 ) =1,68 >  = 0.1  تابع البحث.

دعونا نحصل على نقطة X 2 حسب الصيغة (2.45):

F(X 2 ) = (0.84–1) 2 + (1.84–2) 2 = 0.05,

F(X 1 ) = (0,6 –1) 2 + (1,6–2) 2 = 0,32.

 F(X 1 ) - F(X 0 ) =0,27 >  = 0.1  تابع البحث.

وبالمثل نحصل على X 3:

F(X 3 ) = (0.94–1) 2 + (1.94–2) 2 = 0.007,

F(X 3 ) = (0,84 –1) 2 + (1,84–2) 2 = 0,05.

منذ استيفاء شرط وقف البحث، وجدت X * = X 3 = (0.94، 1.94) بدقة  = 0.1.

يظهر مسار البحث لهذا المثال في الشكل. 6.5.

الميزة التي لا شك فيها لأساليب التدرج هي عدم وجود تكاليف غير ضرورية للحصول على نقاط الاختبار، مما يقلل من تكلفة تكرار واحد. بالإضافة إلى ذلك، نظرًا لاستخدام اتجاه بحث فعال (ناقل التدرج)، يتم تقليل عدد التكرارات بشكل ملحوظ مقارنة بطريقة النزول الإحداثي.

في طريقة التدرج، يمكنك تقليل عدد التكرارات قليلاً إذا تعلمت تجنب المواقف التي يتم فيها تنفيذ عدة خطوات بحث في نفس الاتجاه.

في طريقة التدرج مع تقسيم الخطوة، يتم تنفيذ إجراء تحديد حجم الخطوة في كل تكرار على النحو التالي.

ه، نقطة انطلاق البحث X 0 ح(عادة ح= 1). يتم الحصول على نقاط جديدة باستخدام الصيغة:

X ك+1 = X ك - ح ك × خريجF(X ك ) ، ك=0،1،2،…، (6.25)

أين ح ك- حجم الخطوة لكل كتكرار البحث، في ح ك ويجب استيفاء الشرط التالي:

و(X ك – ح ك × خريجو(X ك )) £ و(X ك ) - ه× ح ك ×½ خريجو(X ك ) ½ 2 . (6.26)

إذا كانت القيمة ح كإذا لم تتحقق المتباينة (2.64)، فتنقسم الخطوة حتى يتحقق هذا الشرط.

يتم إجراء تقسيم الخطوة وفقًا للصيغة ح ك = ح ك × أ, حيث 0< أ < 1.Такой подход позволяет сократить число итераций, но затраты на проведение одной итерации при этом несколько возрастают.

وهذا يجعل من السهل استبدال وتوسيع الإجراءات والبيانات والمعرفة.

في طريقة النزول الأكثر انحدارًا، عند كل تكرار لطريقة التدرج، يتم تحديد الخطوة المثالية في اتجاه التدرج.

البيانات المدخلة هي الدقة المطلوبة هنقطة بداية البحث X 0 .

يتم الحصول على نقاط جديدة باستخدام الصيغة:

X ك+1 = X ك - ح ك × خريجF(X ك ) ، ك=0،1،2،…، (6.27)

أين ح ك = الارجنتين دقيقةو(X ك – ح ك × خريجو(X ك )) أي أنه يتم تحديد الخطوة بناءً على نتائج التحسين أحادي البعد فيما يتعلق بالمعلمة ح (عند 0< ح < ¥).

الفكرة الرئيسية لطريقة الهبوط الأكثر انحدارًا هي أنه في كل تكرار للطريقة، يتم تحديد الحد الأقصى لحجم الخطوة الممكن في اتجاه أسرع انخفاض في الوظيفة الموضوعية، أي في اتجاه متجه مضاد التدرج للدالة الهدف وظيفة و(س)عند هذه النقطة X ك. (الشكل 2.23).

عند اختيار حجم الخطوة الأمثل، فمن الضروري من بين مجموعة متنوعة من X م = (x½ س= س ك – ح× خريجو(X ك ), ح Î / ح = 22(2 ح-1)2=8(2ح-1)=0.

لذلك، ح 1 = 1/2 - الخطوة المثالية في التكرار الأول لطريقة الهبوط الأكثر انحدارًا. ثم

X 1 = X 0 – 1/2خريجو(X 0 ),

س 1 1 =0 -1/2 = 1, س 2 1 = 1-1/2 = 2  X 1 = (1, 2).

دعونا نتحقق من استيفاء شروط إنهاء البحث عند نقطة البحث X 1 = (1، 2). لم يتم استيفاء الشرط الأول

F(X 1 )-F(X 0 ) = 0-2 =2 >  = 0.1، ولكن عادلة

أي جميع المشتقات الجزئية بدقة  يمكن اعتبارها مساوية للصفر، وتم العثور على النقطة الدنيا: س*=س 1 =(1، 2). يظهر مسار البحث في الشكل. 6.7.

وهكذا، فإن طريقة الانحدار الأكثر انحدارًا وجدت الحد الأدنى للدالة الموضوعية في تكرار واحد (نظرًا لحقيقة أن خطوط مستوى الوظيفة F(س 1 , س 2 ) = (س 1 – 1) 2 + (س 2 – 2) 2 . ((س 1 – 1) 2 + (س 2 –2) 2 = مقدار ثابتهي معادلة دائرة، ومتجه مضاد التدرج من أي نقطة يتم توجيهه بدقة إلى النقطة الدنيا - مركز الدائرة).

من الناحية العملية، تعد الوظائف الموضوعية أكثر تعقيدًا، كما أن الخطوط لها أيضًا تكوين معقد، ولكن على أي حال يكون ما يلي صحيحًا: من بين جميع طرق التدرج، تحتوي طريقة الهبوط الأكثر انحدارًا على أقل عدد من التكرارات، ولكن العثور على الخطوة المثالية يمثل استخدام الطرق العددية بعض المشكلات، لأنه في المشكلات الحقيقية التي تنشأ عند تصميم الدقة، فإن استخدام الطرق الكلاسيكية للعثور على الحد الأقصى يكاد يكون مستحيلًا.

بالنسبة لمشاكل التحسين في ظل ظروف عدم اليقين (تحسين الكائنات العشوائية)، حيث تكون واحدة أو أكثر من المعلمات الخاضعة للرقابة هي متغيرات عشوائية، يتم استخدام طريقة تحسين البحث التكيفي ذات المستويين، وهو تعديل لطريقة التدرج.

X 0 والقيمة الأولية لخطوة البحث ح(عادة
). يتم الحصول على نقاط جديدة باستخدام الصيغة:

X ك+1 = X ك - ح ك+1 × خريجФ(Х ك)، ك= 0,1,2,…, (6.28)

أين هي الخطوة ح ك +1 يمكن حسابها باستخدام إحدى الصيغتين: ح ك +1 = ح ك + ل ك +1 × أ ك، أو ح ك +1 = ح ك × إكسب(ل ك +1 × أ ك ) . وعادة ما يتم اختيار عامل التخفيض ل ك =1/ ك، أين ك- رقم التكرار لطريقة البحث.

معنى استخدام المعامل ل كهو أنه في كل تكرار يتم إجراء بعض التعديل لحجم الخطوة، وكلما زاد رقم التكرار لطريقة البحث، كلما كانت نقطة البحث التالية أقرب إلى النقطة القصوى وكلما كان تعديل الخطوة أكثر دقة (أصغر) بالترتيب لمنع الابتعاد عن النقطة القصوى.

ضخامة أ كيحدد علامة هذا التعديل (مع أ ك>0 تزيد الخطوة، وفي أ ك <0 уменьшается):

أ ك = علامة ((غرادF(X ك )،خريجF(X))} ,

إنه أ كهي علامة المنتج العددي لمتجهات تدرجات الدالة الموضوعية عند النقاط X كو ، أين =X ك – ح ك × خريجو(X ك ) نقطة الاختبار، و ح كهي الخطوة التي تم استخدامها للحصول على هذه النقطة X كفي التكرار السابق للطريقة.

تتيح لنا علامة المنتج القياسي لمتجهين تقدير حجم الزاوية بين هذه المتجهات (نشير إلى هذه الزاوية  ). لو   9، فيجب أن يكون المنتج العددي موجبًا، وإلا سالبًا. مع الأخذ في الاعتبار ما سبق، ليس من الصعب فهم مبدأ ضبط حجم الخطوة في الطريقة التكيفية ذات المستويين. إذا كانت الزاوية بين antigradients    (زاوية حادة) فيكون اتجاه البحث من النقطة X كتم اختياره بشكل صحيح، ويمكن زيادة حجم الخطوة (الشكل 6.8).

أرز. 6.8. تحديد اتجاه البحث متى   

إذا كانت الزاوية بين antigradients    (زاوية منفرجة) فيكون اتجاه البحث من النقطة X كيبعدنا عن النقطة الدنيا ×*، ويجب تقليل الخطوة (الشكل 6.9).

أرز. 6.9. تحديد اتجاه البحث متى  > 

تسمى هذه الطريقة بمستويين، لأنه في كل تكرار بحث لا يتم تحليل نقطتين، ويتم إنشاء متجهين مضادين للتدرج.

وهذا بالطبع يزيد من تكلفة تنفيذ تكرار واحد، ولكنه يسمح بتكييف (تعديل) حجم الخطوة ح ك +1 على سلوك العوامل العشوائية.

على الرغم من بساطة التنفيذ، لا يوصى بالطريقة الأكثر انحدارًا كإجراء تحسين "جاد" لحل مشكلة التحسين غير المقيد لوظيفة العديد من المتغيرات، لأنها تعمل ببطء شديد بحيث لا يمكن استخدامها عمليًا.

والسبب في ذلك هو حقيقة أن خاصية الهبوط الأكثر انحدارًا هي خاصية محلية، لذا من الضروري إجراء تغييرات متكررة في اتجاه البحث، مما قد يؤدي إلى إجراء حسابي غير فعال.

يمكن الحصول على طريقة أكثر دقة وكفاءة لحل مشكلة التحسين البارامترية باستخدام المشتقات الثانية للدالة الهدف (طرق الدرجة الثانية). وهي تستند إلى التقريب (أي الاستبدال التقريبي) للدالة و(س)وظيفة ي(X),

ي(X) = Ф(Х 0 ) + (س - س 0 ) ت × خريجو(X 0 ) + ½ ز(X 0 ) × (س - س 0 ) , (6.29)

أين ز(X 0 ) - مصفوفة هسه (هسه، مصفوفة المشتقات الثانية)، محسوبة عند هذه النقطة X 0 :

¶ 2 و(س) ¶ 2 و(س) . . . ¶ 2 و(س)

¶ س 1 2 ¶ س 1 ¶ س 2 ¶ س 1 ¶ س ن

ز(X) = ¶ 2 و(س) ¶ 2 و(س) . . . ¶ 2 و(س)

¶ س 2 ¶ س 1 ¶ س 2 2 ¶ س 2 ¶ س ن

¶ 2 و(س) ¶ 2 و(س) . . . ¶ 2 و(س)

¶ س ن ¶ س 1 ¶ س ن ¶ س 2 ¶ س ن 2 .

تمثل الصيغة (2.67) الحدود الثلاثة الأولى لموسع الدالة و(س)في سلسلة تايلور بالقرب من نقطة ما X 0 لذلك عند تقريب الدالة و(س)وظيفة ي(X)يحدث خطأ لا يزيد عن ½½ X-X 0 ½½ 3 .

ومع الأخذ في الاعتبار (2.67)، فإن البيانات الأولية في طريقة نيوتن هي الدقة المطلوبة ه، نقطة انطلاق البحث X 0 ويتم الحصول على نقاط جديدة باستخدام الصيغة:

X ك +1 = س ك – ز -1 (x ك ) × خريجФ(Х ك)، ك=0,1,2,…, (6.30)

أين ز -1 (x ك ) - مصفوفة معكوسة لمصفوفة هسه، محسوبة عند نقطة البحث X ك (ز(x ك ) × ز -1 (x ك ) = أنا،

أنا = 0 1 … 0 - مصفوفة الهوية.

لنفكر في مثال لإيجاد الحد الأدنى لنفس الوظيفة كما في طريقة التدرج بخطوة ثابتة وفي طريقة النسب الإحداثي:

ن = 2, X = (س 1 , س 2 ),  = 0.1,

F(س 1 , س 2 ) = (س 1 – 1) 2 + (س 2 – 2) 2  دقيقة، اكس 0 =(0, 1).

دعونا نحصل على نقطة X 1 :

X 1 = X 0 – G –1 (X 0)∙grad Ф(X 0),

أين

غراد Ф(X 0) = (2∙(x 1 0 –1)))، 2∙(x 1 0 –1) = (–2, –2)، أي

أو

س 1 1 = 0 – (1/2∙(–2) + 0∙(–2)) = 1,

س 2 1 = 1 – (0∙(–2) + 1/2∙(–2)) = 2,

X 1 = (1, 2).

دعونا نتحقق من استيفاء شروط إنهاء البحث: لم يتم استيفاء الشرط الأول

F(X 1 )-F(X 0 ) = 0 - 2  = 2 >  = 0.1,

ولكن عادلة

أي أن جميع المشتقات الجزئية بدقة  يمكن اعتبارها مساوية للصفر، وتم العثور على النقطة الدنيا: س* = س 1 = (12). يتزامن مسار البحث مع مسار طريقة الهبوط الأكثر انحدارًا (الشكل 2.24).

العيب الرئيسي لطريقة نيوتن هو تكلفة حساب معكوس هسي ز -1 (x ك ) في كل تكرار للطريقة.

تتغلب طريقة DFT على أوجه القصور في كل من طريقة الهبوط الأكثر انحدارًا وطريقة نيوتن.

وميزة هذه الطريقة هي أنها لا تتطلب حساب معكوس هسي، والاتجاه – ن ك × خريجF(س ك)، حيث ن ك- مصفوفة متماثلة موجبة ومحددة يتم إعادة حسابها عند كل تكرار (خطوة من طريقة البحث) وتقريب معكوس هسي ز -1 (x ك ) (ن ك ® ز -1 (x ك ) مع زيادة ك).

بالإضافة إلى ذلك، فإن طريقة DFT، عند استخدامها للعثور على الحد الأقصى لدالة ذات متغيرات n، تتقارب (أي تعطي حلاً) في ما لا يزيد عن n من التكرارات.

يتضمن الإجراء الحسابي لطريقة DFT الخطوات التالية.

يتم إدخال البيانات بالدقة المطلوبة، وهي نقطة بداية البحث X 0 والمصفوفة الأولية ن 0 (عادة مصفوفة الهوية، ن 0 = أنا).

على كالتكرار الرابع للطريقة، ونقطة البحث X k والمصفوفة معروفة ن ك (ك = 0,1,…).

دعونا نشير إلى اتجاه البحث

د ك = -ن ك × خريجФ(Х ك).

العثور على حجم الخطوة الأمثل ل كفي الاتجاه د ك باستخدام طرق التحسين أحادية البعد (بنفس الطريقة كما في طريقة الهبوط الأكثر انحدارًا، تم تحديد القيمة في اتجاه ناقل التدرج المضاد)

ح. دعونا نشير الخامس ك = ل ك × د كوالحصول على نقطة بحث جديدة X ك +1 = X ك + الخامس ك .

4. التأكد من استيفاء شرط إيقاف البحث.

إذا ½ الخامس ك ½£ هأو ½ خريجو(X ك +1 ) ½£ ه، ثم تم العثور على الحل X * = س ك +1 . وإلا فإننا نواصل الحسابات.

5. دعونا نشير ش ك = خريجФ(Х ك +1) - خريجФ(Х k) والمصفوفة ن ك +1 احسب باستخدام الصيغة:

ح ك +1 = ح ك +أ ك + ب ك , (6.31)

أين أ ك = ضد ك . الخامس ك ت /(الخامس ك ت × ش ك ) , ب ك = - ح ك × ش ك . ش ك ت . ح ك /(ش ك ت × ح ك × ش ك ) .

أ كو في كهي مصفوفات مساعدة للحجم ن X ن (الخامس ك تيتوافق مع ناقلات الصف، الخامس كيعني متجه العمود، نتيجة الضرب ن-خط الأبعاد على نالعمود ذو الأبعاد هو كمية قياسية (رقم)، وضرب عمود في صف يعطي مصفوفة الحجم نس ن).

6. قم بزيادة رقم التكرار بمقدار واحد وانتقل إلى النقطة 2 من هذه الخوارزمية.

تعد طريقة DFT بمثابة إجراء تحسين قوي وفعال في تحسين معظم الوظائف. لتحسين حجم الخطوة أحادي البعد في طريقة DFT، يتم استخدام طرق الاستيفاء.

حصة هذه المادة:

مقالات مماثلة

17 أبريل 2015
SuperBeam هي أداة قوية لنقل الملفات عبر شبكة Wi-Fi بدون الإنترنت

17 أبريل 2015
متعدد النواة DSP TMS320C6678

17 أبريل 2015
منتجات إنتل: الشرائح وميزاتها

17 أبريل 2015
كاتربيلر تكشف عن هاتف ذكي مزود بكاميرا حرارية Cat S60

أنواع

أجهزة التوجيه

الأقراص الصلبة

لا يتم تشغيله

الطابعات

الفرامل

يتجمد

الفيروسات

أجهزة لوحية

المواد شعبية

كيفية التسجيل في Steam بدون بريد إلكتروني

Cs يذهب إلى ذاكرة التخزين المؤقت للجلد. كيفية بيع عناصر CS:Go؟ هل يمكنك الوثوق بـ CSGO Cash؟ ما هي ضمانات المعاملات؟

مراجعة الكمبيوتر المحمول Lenovo ThinkPad X1 Carbon (2018): خفيف ومريح وقوي

جهاز مجسم لاستقبال الإرسال عن بعد

فك ربط صفحة الانستقرام من الفيسبوك

كيفية الاتصال بجهاز كمبيوتر عبر الشبكة المحلية؟

مقالات جديدة

تقوم عملية النظام (نظام NT Kernel) بتحميل النظام: ماذا تفعل؟

تحديث البرامج الثابتة للهواتف الذكية Samsung Galaxy

كيفية إزالة الإعلانات في المتصفح: إزالة اللافتات والنوافذ المنبثقة

ما هو رمز العملة المشفرة

نقوم بتشخيص القرص الصلب في حالة ظهور تشققات وضوضاء غريبة