ما هو محرك البحث الذي جاء أولاً؟ تاريخ تطور محركات البحث

27.06.2020


في أوائل التسعينيات، لم يكن مستخدمو الإنترنت معتادين على طرح الأسئلة على محركات البحث. تم جمع الروابط إلى المواقع المفيدة، والتي تعلمنا عنها بشكل رئيسي من الأصدقاء، في ملفات نصية منفصلة. في وقت لاحق، ظهرت مواقع الدليل مع الفئات التي تم تجديدها يدويا. مثل، على سبيل المثال، كانت ياهو! والمكتبة الافتراضية (VLib)، التي تم صيانتها وتخزينها على خادم CERN بواسطة مخترع الإنترنت الحديث، تيم بيرنرز لي.

يعتبر محرك البحث الأول في التاريخ هو Archie، الذي ظهر في عام 1990، وهو أرشيف ملفات يحتوي على أدلة مواقع قابلة للتنزيل والقدرة على البحث فيها، أنشأه طلاب جامعة ماكجيل في مونتريال. لم يقوم آرتشي بفهرسة محتوى المواقع: فقد تعلمت ذلك محركات البحث التي تم إطلاقها عام 1993، بما في ذلك World Wide Web Wanderer وALIWEB وJumpStation. أصبح هذا الأخير أول محرك بحث متكامل بالمعنى الحديث: بمساعدة الروبوتات، قام بجمع الروابط وتصنيفها في نتائج البحث بناءً على التشابه مع استعلام المستخدم.

منشئو محركات البحث الأولى
بالنسبة للجزء الأكبر أو ترك هذه الوظيفة، أو ذهب للعمل
لشركات الانترنت الكبرى

تم طرح AltaVista في عام 1994، وأصبح أول محرك بحث يعمل مع استعلامات اللغة الطبيعية، وكان WebCrawler أول محرك بحث قوي حقًا، والذي قام بفهرسة محتوى الصفحات بالكامل. وأخيراً، في الفترة 1997-1998، تم إطلاق محركي البحث جوجل وياندكس، وهما محركا البحث الأكثر شعبية في روسيا اليوم. وبفضل الخوارزميات الأفضل، أصبحت هذه الشركات رائدة على المستوى الدولي والإقليمي، على التوالي، لكن الأمر استغرق وقتًا طويلاً للحصول على حصة من المشاركين الآخرين في السوق. معظم منشئي محركات البحث الأولى إما تركوا هذا الاحتلال أو ذهبوا للعمل لدى شركات الإنترنت الكبيرة التي اشترت أنظمتها بالكامل.








شعبية محركات البحث في روسيا وأوكرانيا والعالم. تاريخ تطور محركات البحث. رامبلر وأبورت من الديناصورات المنقرضة.
لقد أكدت دائمًا وسأواصل التأكيد على أن المتخصص الضيق الذي لا يهتم بأي شيء آخر غير التفاصيل العملية البحتة لن يتمكن من تحقيق ارتفاعات حقيقية في مهنته. لا يصبح مثل هذا الشخص "ضيقًا" بل "ضيق الأفق" :-) لذلك دعونا نلقي نظرة على تاريخ تطور محركات البحث، وكذلك حصة السوق التي يشغلها كل محرك بحث حاليًا. تعد شعبية محركات البحث في روسيا وأوكرانيا لحظة مهمة جدًا للترويج.

تاريخ تطور محركات البحث . في التسعينيات، عندما كان الإنترنت قد بدأ للتو في الاستخدام، لم تكن محركات البحث بالمعنى الحديث للكلمة موجودة. تم البحث عن المورد المطلوب من خلال أدلة المواقع، حيث تم تنظيم مشاريع الإنترنت المتاحة في ذلك الوقت حسب العناوين. نظرًا لوجود عدد قليل من المستخدمين على الشبكة، وعدد قليل من مواقع الويب على الإطلاق، كانت طريقة تنظيم البيانات هذه مريحة وكافية تمامًا.

أول محرك بحث متكامل كان مشروع WebCrawler. كان الاختلاف الأساسي عن سابقاته هو أن محرك البحث هذا ينفذ ما يسمى ب. البحث عن النص الكامل. أولئك. لم يتم البحث محليًا فقط في بعض الأدلة، وليس فقط من خلال العلامة الوصفية للكلمات الرئيسية، ولكن تم تحليل النص الكامل لصفحة الويب، مما جعل من الممكن العثور على أي عبارات بنجاح (وليس فقط تلك التي أشار إليها مشرف الموقع في وصف موقعه) كعناصر رئيسية).

شخصيًا، اسم WebCrawler لا يعني شيئًا بالنسبة لي - إنه قديم جدًا في الماضي، في روسيا في ذلك الوقت لم يسمع الجميع كلمة الإنترنت :-) لكن Lycos، التي ظهرت في عام 1996، معروفة بالفعل بين كبار السن مشرفي المواقع، على الأقل هذا هو الاسم المألوف للكثيرين. بعد وقت قصير من إطلاق Lykos، تم إطلاق AltaVista، أفضل محرك بحث في ذلك الوقت، وربما سمعت هذا الاسم. حتى عام 2000 تقريبًا، ظل AltaVista محرك البحث الرائد في العالم.

تأسست جوجل في عام 1998. أحدث مطوروها، سيرجي برين ولاري بيج، ثورة في جودة البحث من خلال تطوير خوارزمية PageRank، التي تسمح بمراعاة "وزن" الصفحة، اعتمادًا على عدد الروابط إليها. أدى هذا إلى تحسين جودة البحث بشكل جذري لدرجة أن Google بدأ يكتسب جمهورًا سريعًا وفي غضون سنوات قليلة أصبح محرك البحث الرائد في العالم، والذي لا يزال قائمًا حتى يومنا هذا. أتذكر، حوالي عام 2000، في المعهد، شاهدت جدالًا بين طالبين في مجموعتنا حول مدى سوء برنامج Altavista، لكن البحث في Google أفضل :-)

محرك البحث ابورت . تطوير شركة أجاما، صدر عام 1996. المشروع الذي ظل لعدة سنوات محرك البحث الرائد على Runet. بينما أكتب هذا، بدأت أشعر بأنني قديم جدًا :-) بعد كل شيء، في يوم من الأيام، كطلاب، كان Aport هو ما كنا نبحث عنه. لم تكن هناك بدائل أخرى، ولم تكن هناك حاجة إليها، لأن شركة Aport قامت بعملها على أكمل وجه.


ومع ذلك، فإن البداية الممتازة لم تضمن تطورًا ممتازًا بنفس القدر في المستقبل. كان Aport بمثابة لقمة لذيذة لدرجة أنه قام بتغيير مالكيه عدة مرات، وفي كل مرة كان يبيع المزيد والمزيد. وهذا ما دمره على ما يبدو. وبرزت "الإدارة والتسويق الفعالان" إلى الواجهة، في حين تم إهمال الدعم الفني بكل بساطة. بعد ذلك، أدار مستخدمو Runet ظهورهم لـ Aport - لحسن الحظ، كان محركا البحث الرئيسيان الآخران - Rambler و Yandex - يقاتلان بنشاط من أجل مكان تحت الشمس.

لا أتذكر التواريخ الدقيقة، لكن أول Aport تخلت عن خوارزميات التصنيف الخاصة بها، وبدأت في استخدام بيانات Yandex، وقبل عامين لم تعد موجودة تمامًا كمحرك بحث. يوجد الآن متجر على الإنترنت في المجال الشهير، وليس بأفضل جودة.

إيه... ولكن ذات مرة كان لدى Aport أيضًا كتالوج خاص به، والذي سعى مشرفو المواقع إلى الدخول إليه بنفس القوة تقريبًا كما يفعلون الآن في Yandex. بالمناسبة، تم تطوير التصميم الأول لـ Aport بواسطة Artemy Lebedev... تقريبًا بالتزامن مع تصميم Yandex.

محرك البحث رامبلر . تم إطلاق Rambler في عام 1996 وظل أحد اللاعبين الرئيسيين في السوق لمدة عقد تقريبًا. على عكس Aport، الذي "سقط" بسرعة كبيرة جدًا، انزلق Rambler إلى "وضعه المتشرد" الحالي ببطء وبمقاومة.


تقريبًا حتى اللحظة الأخيرة، استمر Rambler في تشغيل محرك البحث الخاص به، والذي بالمناسبة أنتج جودة جيدة. فكر فقط - لسنوات عديدة، كان Rambler هو محرك البحث الثاني لـ Runet، والثالث لم يكن Aport نصف ميت، ولكن Google العظيم!

ومع ذلك، انخفضت حصة Rambler في السوق وتقلصت، وفي عام 2011 تم شراؤها من قبل Yandex وبدأت في تقديم نتائج مماثلة لتلك الخاصة بـ Yandex. وهكذا انتهت قصة رامبلر، الذي كان ذات يوم أقوى محرك بحث روسي.

محركات البحث جوجل وياندكس . في الوقت الحالي، لم يتبق سوى محركي بحث ذي صلة - ياندكس وجوجل. لقد تم نسيان جميع أنواع Lukos وAltavists منذ فترة طويلة ولا تعمل كخدمات بحث. تم شراء Rambler بواسطة Yandex ويظهر الآن نتائج هذا الأخير. لقد تحول الميناء إلى متجر على الإنترنت. تمتلك شركتا ياهو وبينج، محرك بحث ميكروسوفت، حصة سوقية صغيرة جدًا. في روسيا، بالإضافة إلى Yandex و Google، هناك Mail.ru، ولكن ليس لديه محرك بحث خاص به، ولكنه يستخدم نتائج البحث من Google، وإجراء تعديلات طفيفة فقط عليها.

شعبية محركات البحث في روسيا وأوكرانيا والعالم . في الوقت الحالي، ينقسم سوق البحث في روسيا تقريبًا على النحو التالي:

ياندكس – 63%
جوجل – 26%
Mail.ru – 8%
متسكع – 1.5%
بنج – 0.6%

وفي أوكرانيا، تختلف النسبة بشكل كبير؛ وتتخلف شركة ياندكس كثيرًا عن منافسها الرئيسي، ولكنها تعمل على زيادة حصتها في السوق ببطء:

جوجل – 60%
ياندكس – 29%
Mail.ru – 6%

يوجد في البحث العالمي قائد واحد فقط، مطلق وغير مشروط، وهو Google.

بالمناسبة، يمكننا أن نشعر بالفخر المستحق في بلدنا - فقط روسيا والصين أنشأتا أنظمة البحث الخاصة بهما. لم تظهر محركات البحث عالية الجودة في أي مكان آخر في العالم. في الدول الأوروبية - فرنسا وألمانيا وغيرها - يستخدم Google ما يصل إلى 97-99% من المستخدمين، أي. لا يوجد بديل في الأساس.

هناك أيضًا جانب عملي لذلك - يتمتع مشرف الموقع الروسي بفرصة أفضل لجذب الزوار من البحث. غالبًا ما يحدث أن موقع Yandex "يحب" موقعًا ما، لكن Google لا يحبه، أو العكس. ولكن في كلتا الحالتين، الموقع لديه عملاء. ويستخدم زملاؤنا الغربيون مبدأ "كل شيء أو لا شيء".

هناك نقطة ثانية - يختلف الترويج في Google وYandex إلى حد ما، والرغبة في الوصول إلى قمة كلا الزعيمين تترك بصماتها على نموذج الترويج للموقع.

تم نشر كتابي في النسخة الورقية.إذا كان هذا البرنامج التعليمي مفيدًا لك، فيمكنك أن تشكرني ليس فقط معنويًا، ولكن أيضًا بطرق ملموسة تمامًا.
للقيام بذلك عليك أن تذهب إلى

تتضمن بنية محرك البحث عادةً ما يلي:

يوتيوب الموسوعي

    1 / 5

    ✪ الدرس الثالث: كيف يعمل محرك البحث. مقدمة لكبار المسئولين الاقتصاديين

    ✪ محرك بحث من الداخل

    ✪ شودان - جوجل الأسود

    ✪ سيحل محرك البحث CHEBURASHKA محل Google وYandex في روسيا

    ✪ الدرس الأول - كيف يعمل محرك البحث

    ترجمات

قصة

التسلسل الزمني
سنة نظام حدث
1993 كتالوج W3؟! يطلق
عليويب يطلق
جامب ستيشن يطلق
1994 WebCrawler يطلق
إنفوسيك يطلق
ليكوس يطلق
1995 التافيستا يطلق
داوم قاعدة
افتح النصمؤشر الويب يطلق
ماجلان يطلق
تثير يطلق
سابو يطلق
ياهو! يطلق
1996 Dogpile يطلق
إنكتومي قاعدة
متسكع قاعدة
هوت بوت قاعدة
اسأل جيفيس قاعدة
1997 الضوء الشمالي يطلق
ياندكس يطلق
1998 جوجل يطلق
1999 AlltheWeb يطلق
GenieKnows قاعدة
نيفر يطلق
تيوما قاعدة
فيفيسيمو قاعدة
2000 بايدو قاعدة
إكساليد قاعدة
2003 معلومات.كوم يطلق
2004 ياهو!  يبحث الإطلاق النهائي
A9.com يطلق
سوجو يطلق
2005 بحث MSN  الإطلاق النهائي
اسأل.كوم يطلق
نجمة يطلق
بحث جيد يطلق
فتشني قاعدة
2006 wikiseek قاعدة
كويرو قاعدة
بحث حي يطلق
تشاتشا الإطلاق (إصدار تجريبي)
Guruji.com الإطلاق (إصدار تجريبي)
2007 wikiseek يطلق
سبروس يطلق
ويكيا بحث يطلق
بلاكلي.كوم يطلق
2008 دك دك جو يطلق
توبي يطلق
بيكولاتور يطلق
فيوزي يطلق
كويل يطلق
بوجامي يطلق
ليبفيش الإطلاق (إصدار تجريبي)
فورستل يطلق
فادلو يطلق
مجموعة الطاقة يطلق
2009 بنج يطلق
KAZ.KZ يطلق
يبول الإطلاق (إصدار تجريبي)
مجوردي إغلاق
كشاف يطلق
2010 كويل إغلاق
بليكو الإطلاق (إصدار تجريبي)
فيوزي إغلاق
2012 وازوب يطلق
2014 الأقمار الصناعية الإطلاق (إصدار تجريبي)

في وقت مبكر من تطوير الإنترنت، احتفظ تيم بيرنرز لي بقائمة من خوادم الويب المستضافة على موقع CERN. أصبح هناك المزيد والمزيد من المواقع، وأصبح الحفاظ على هذه القائمة يدويًا أكثر صعوبة. يحتوي موقع NCSA على قسم خاص بعنوان "ما الجديد!" (باللغة الإنجليزية: ما الجديد!)، حيث تم نشر روابط لمواقع جديدة.

أول برنامج حاسوبي للبحث في الإنترنت كان البرنامج ارشي(أرتشي الإنجليزي - أرشيف بدون الحرف "ج"). تم إنشاؤه في عام 1990 من قبل آلان إيمتاج، وبيل هيلان، وجي بيتر دويتش، طلاب علوم الكمبيوتر في جامعة ماكجيل في مونتريال. قام البرنامج بتنزيل قوائم بجميع الملفات من جميع خوادم FTP المجهولة المتاحة وقام ببناء قاعدة بيانات يمكن البحث فيها عن طريق أسماء الملفات. ومع ذلك، لم يقوم برنامج آرتشي بفهرسة محتويات هذه الملفات، نظرًا لأن كمية البيانات كانت صغيرة جدًا بحيث يمكن العثور على كل شيء يدويًا بسهولة.

أدى تطور وانتشار بروتوكول شبكة غوفر، الذي اخترعه مارك مكاهيل في جامعة مينيسوتا عام 1991، إلى إنشاء برنامجين جديدين للبحث، فيرونيكاو جغيد. مثل آرتشي، بحثوا عن أسماء الملفات والرؤوس المخزنة في أنظمة فهرس غوفر. فيرونيكا (الإنجليزية) فهرس شبكي سهل للغاية موجه نحو القوارض للأرشيفات المحوسبة) يسمح بالبحث عن الكلمات الرئيسية لمعظم عناوين قائمة Gopher عبر جميع قوائم Gopher. برنامج جهيد التنقيب والعرض الهرمي لجونزي غوفر العالمي) تم استرداد معلومات القائمة من خوادم Gopher محددة. على الرغم من أن اسم محرك بحث Archie لم يكن مرتبطًا بسلسلة الكتب المصورة "ارشي"ومع ذلك، فإن فيرونيكا وجغيد هما شخصيتان في هذه القصص المصورة.

بحلول صيف عام 1993، لم يكن هناك نظام واحد للبحث في الإنترنت بعد، على الرغم من الاحتفاظ بالعديد من الأدلة المتخصصة يدويًا. كتب أوسكار نيرستراسز من جامعة جنيف سلسلة من نصوص بيرل التي نسخت هذه الصفحات بشكل دوري وأعادت كتابتها إلى تنسيق قياسي. أصبح هذا هو الأساس ل كتالوج W3؟!، أول محرك بحث بدائي على شبكة الإنترنت، تم إطلاقه في 2 سبتمبر 1993.

ربما كان أول زاحف ويب مكتوب بلغة بيرل هو روبوت "World Web Wanderer" الذي أنشأه ماثيو جراي في يونيو 1993. أنشأ هذا الروبوت فهرس البحث "Wandex". كان هدف Wanderer هو قياس حجم شبكة الويب العالمية والعثور على جميع صفحات الويب التي تحتوي على الكلمات من الاستعلام. وفي عام 1993، ظهر محرك البحث الثاني “علي ويب”. لم تستخدم Aliweb أي زاحف، بل توقعت بدلاً من ذلك إشعارات من مسؤولي مواقع الويب حول وجود ملف فهرس بتنسيق معين على مواقعهم.

جامب ستيشن، التي أنشأها جوناثان فليتشر في ديسمبر 1993، قامت بالبحث في صفحات الويب وفهرستها باستخدام زاحف الويب، واستخدمت نموذج ويب كواجهة لصياغة استعلامات البحث. وكانت أول أداة بحث على الإنترنت تجمع بين أهم ثلاث وظائف لمحرك البحث (التحقق، والفهرسة، والبحث نفسه). نظرًا لموارد الكمبيوتر المحدودة في ذلك الوقت، كانت الفهرسة وبالتالي البحث مقتصرة على عناوين وعناوين صفحات الويب التي يعثر عليها الزاحف فقط.

شاركت محركات البحث في "فقاعة الدوت كوم" في أواخر التسعينيات. دخلت العديد من الشركات السوق بطريقة مذهلة، وحققت أرباحًا قياسية خلال عروضها العامة الأولية. لقد تخلى البعض عن سوق محركات البحث العامة وبدأوا العمل فقط مع قطاع الشركات، على سبيل المثال. الضوء الشمالي.

تبنت شركة جوجل فكرة بيع الكلمات المفتاحية عام 1998، وكانت آنذاك شركة صغيرة وفرت محرك بحث على موقع goto.com. تمثل هذه الخطوة تحولًا لمحركات البحث من التنافس مع بعضها البعض إلى أن تصبح واحدة من أكثر المشاريع التجارية ربحية على الإنترنت. بدأت محركات البحث في بيع الأماكن الأولى في نتائج البحث للشركات الفردية.

لقد كان محرك بحث Google بارزًا منذ أوائل العقد الأول من القرن الحادي والعشرين. حققت الشركة مكانة عالية بفضل نتائج البحث الجيدة باستخدام خوارزمية PageRank. تم تقديم الخوارزمية للجمهور في مقال "تشريح محرك البحث"، الذي كتبه سيرجي برين ولاري بيج، مؤسسي جوجل. تقوم هذه الخوارزمية التكرارية بتصنيف صفحات الويب بناءً على تقدير عدد الارتباطات التشعبية إلى صفحة ويب، على افتراض أن الصفحات "الجيدة" و"المهمة" تحتوي على روابط أكثر من غيرها. تم تصميم واجهة Google بأسلوب بسيط، حيث لا يوجد شيء غير ضروري، على عكس العديد من منافسيها الذين قاموا ببناء محرك البحث في بوابة الويب. لقد أصبح محرك البحث جوجل مشهورا لدرجة ظهور أنظمة مقلدة له على سبيل المثال الباحث الغامض(محرك البحث السري).

البحث عن المعلومات باللغة الروسية

في عام 1996، تم إجراء بحث مع الأخذ في الاعتبار الشكل الروسي على محرك البحث Altavista وتم إطلاق محركي البحث الروسيين الأصليين Rambler وAport. في 23 سبتمبر 1997، تم افتتاح محرك بحث Yandex. في 22 مايو 2014، افتتحت روستيليكوم محرك البحث الوطني سبوتنيك، والذي كان في وقت الاختبار التجريبي في عام 2015. وفي 22 أبريل 2015، تم إطلاق خدمة سبوتنيك الجديدة.  الأطفال خاصة للأطفال مع زيادة السلامة.

أصبحت طرق التحليل العنقودي والبحث في البيانات الوصفية شائعة جدًا. ومن السيارات العالمية من هذا النوع أشهرها "متكئ"شركات فيفيسيمو. في عام 2005، في روسيا، وبدعم من جامعة موسكو الحكومية، تم إطلاق محرك بحث Nigma، الذي يدعم التجميع التلقائي. في عام 2006، تم افتتاح الآلة الروسية الخارقة Quintura، التي تقدم تجميعًا مرئيًا على شكل سحابة علامات. جرب Nygma أيضًا التجميع البصري.

كيف يعمل محرك البحث؟

المكونات الرئيسية لنظام البحث: روبوت البحث، المفهرس، محرك البحث.

عادة، تعمل الأنظمة على مراحل. أولاً، يقوم الزاحف باسترداد المحتوى، ثم يقوم المفهرس بإنشاء فهرس قابل للبحث، وأخيرًا، يوفر محرك البحث وظيفة البحث في البيانات المفهرسة. لتحديث محرك البحث، يتم تكرار دورة الفهرسة هذه.

تعمل محركات البحث عن طريق تخزين المعلومات حول العديد من صفحات الويب، والتي تسترجعها من صفحات HTML. روبوت البحث أو "الزاحف" (eng. Crawler) هو برنامج يقوم تلقائيًا بتصفح جميع الروابط الموجودة في الصفحة ويسلط الضوء عليها. يبحث الزاحف، استنادًا إلى الروابط أو قائمة العناوين المحددة مسبقًا، عن مستندات جديدة لم يعرفها محرك البحث بعد. يمكن لمالك الموقع استبعاد صفحات معينة باستخدام ملف robots.txt، والذي يمكن استخدامه لمنع فهرسة الملفات أو الصفحات أو الدلائل الموجودة على الموقع.

يقوم محرك البحث بتحليل محتوى كل صفحة لمزيد من الفهرسة. يمكن استخراج الكلمات من العناوين أو نص الصفحة أو الحقول الخاصة - العلامات الوصفية. المفهرس عبارة عن وحدة تقوم بتحليل الصفحة، بعد تقسيمها مسبقًا إلى أجزاء، باستخدام الخوارزميات المعجمية والمورفولوجية الخاصة بها. يتم عزل جميع عناصر صفحة الويب وتحليلها بشكل منفصل. يتم تخزين بيانات صفحة الويب في قاعدة بيانات الفهرس لاستخدامها في الاستعلامات اللاحقة. يتيح لك الفهرس العثور بسرعة على المعلومات بناءً على طلب المستخدم. يقوم عدد من محركات البحث، مثل Google، بتخزين الصفحة الأصلية بأكملها أو جزء منها، وما يسمى بذاكرة التخزين المؤقت، بالإضافة إلى معلومات متنوعة حول صفحة الويب. وتقوم أنظمة أخرى، مثل نظام AltaVista، بتخزين كل كلمة في كل صفحة يتم العثور عليها. يساعد استخدام ذاكرة التخزين المؤقت في تسريع عملية استرجاع المعلومات من الصفحات التي تمت زيارتها بالفعل. تحتوي الصفحات المخزنة مؤقتًا دائمًا على النص الذي حدده المستخدم في استعلام البحث. يمكن أن يكون هذا مفيدًا في حالة تحديث صفحة الويب، أي أنها لم تعد تحتوي على نص طلب المستخدم، ولا تزال الصفحة الموجودة في ذاكرة التخزين المؤقت قديمة. ويرتبط هذا الوضع لفقدان الروابط. linkrot) ونهج (سهولة الاستخدام) سهل الاستخدام من Google. يتضمن ذلك إرجاع أجزاء نصية قصيرة من ذاكرة التخزين المؤقت التي تحتوي على نص الطلب. ينطبق مبدأ المفاجأة الأقل؛ وعادةً ما يتوقع المستخدم رؤية الكلمات التي تم البحث عنها في نصوص الصفحات المستلمة ( توقعات المستخدم). بالإضافة إلى حقيقة أن استخدام الصفحات المخزنة مؤقتًا يؤدي إلى تسريع عمليات البحث، فقد تحتوي الصفحات المخزنة مؤقتًا على معلومات لم تعد متوفرة في أي مكان آخر.

يعمل محرك البحث مع ملفات الإخراج الواردة من المفهرس. يقبل محرك البحث استعلامات المستخدم، ويعالجها باستخدام فهرس ويعيد نتائج البحث.

عندما يقوم المستخدم بإدخال استعلام في محرك بحث (عادة باستخدام الكلمات الرئيسية)، يتحقق النظام من فهرسه ويعيد قائمة بصفحات الويب الأكثر صلة (مرتبة حسب بعض المعايير)، عادةً مع ملخص قصير يحتوي على عنوان المستند و في بعض الأحيان أجزاء من النص. تم إنشاء فهرس البحث باستخدام تقنية خاصة تعتمد على المعلومات المستخرجة من صفحات الويب. منذ عام 2007، يتيح لك محرك بحث Google إمكانية البحث على أساس الوقت، وإنشاء المستندات التي تبحث عنها (استدعاء قائمة "أدوات البحث" وتحديد النطاق الزمني). تدعم معظم محركات البحث استخدام عوامل التشغيل المنطقية AND وOR وNOT في الاستعلامات، مما يسمح لك بتحسين قائمة الكلمات الرئيسية التي تم البحث عنها أو توسيعها. في هذه الحالة، سيقوم النظام بالبحث عن الكلمات أو العبارات تمامًا كما تم إدخالها. بعض محركات البحث لديها هذا الخيار بحث تقريبي، في هذه الحالة، يقوم المستخدمون بتوسيع منطقة البحث عن طريق تحديد المسافة إلى الكلمات الرئيسية. هناك أيضا البحث المفاهيميوالذي يستخدم التحليل الإحصائي لاستخدام الكلمات والعبارات التي تم البحث عنها في نصوص صفحات الويب. تسمح هذه الأنظمة بكتابة الاستعلامات باللغة الطبيعية. مثال على محرك البحث هذا هو موقع Ask com.

تعتمد فائدة محرك البحث على مدى صلة الصفحات التي يجدها. في حين أن الملايين من صفحات الويب قد تتضمن كلمة أو عبارة معينة، فقد يكون بعضها أكثر صلة أو شهرة أو موثوقية من غيرها. تستخدم معظم محركات البحث أساليب التصنيف لإحضار النتائج "الأفضل" إلى أعلى القائمة. تحدد محركات البحث الصفحات الأكثر صلة بالموضوع وبأي ترتيب يجب عرض النتائج بطرق مختلفة. تتغير طرق البحث، مثل الإنترنت نفسه، بمرور الوقت. هذه هي الطريقة التي ظهر بها نوعان رئيسيان من محركات البحث: أنظمة الكلمات الرئيسية المحددة مسبقًا والمرتبة هرميًا والأنظمة التي يتم فيها إنشاء فهرس مقلوب بناءً على تحليل النص.

معظم محركات البحث هي مؤسسات تجارية تحقق الربح من خلال الإعلانات؛ وفي بعض محركات البحث يمكنك شراء الأماكن الأولى في نتائج البحث لكلمات رئيسية معينة مقابل رسوم. إن محركات البحث التي لا تتقاضى أموالاً مقابل أمر إصدار النتائج تجني الأموال من الإعلانات السياقية، بينما تتوافق الرسائل الإعلانية مع طلب المستخدم. يتم عرض مثل هذه الإعلانات على صفحة تحتوي على قائمة نتائج البحث، وتكسب محركات البحث الأموال في كل مرة ينقر فيها المستخدم على الرسائل الإعلانية.

أنواع محركات البحث

هناك أربعة أنواع من محركات البحث: الآلية، والمحركات التي تعمل بالطاقة البشرية، والمختلطة، والميتا.

  • الأنظمة التي تستخدم روبوتات البحث
وهي تتألف من ثلاثة أجزاء: الزاحف ("بوت"، "روبوت" أو "العنكبوت")، وبرنامج الفهرس ومحرك البحث. هناك حاجة إلى الزاحف للزحف إلى الويب وإنشاء قوائم بصفحات الويب. الفهرس عبارة عن أرشيف كبير لنسخ صفحات الويب. الغرض من البرنامج هو تقييم نتائج البحث. نظرا لحقيقة أن روبوت البحث في هذه الآلية يستكشف الشبكة باستمرار، فإن المعلومات أكثر أهمية. معظم محركات البحث الحديثة هي أنظمة من هذا النوع.
  • الأنظمة التي يديرها الإنسان (أدلة الموارد)
تقوم محركات البحث هذه باسترداد قوائم صفحات الويب. يحتوي الدليل على العنوان والعنوان ووصف مختصر للموقع. يبحث دليل الموارد فقط عن نتائج من أوصاف الصفحات المقدمة إليه من قبل مشرفي المواقع. تتمثل ميزة الكتالوجات في أنه يتم فحص جميع الموارد يدويًا، وبالتالي ستكون جودة المحتوى أفضل مقارنة بالنتائج التي يتم الحصول عليها تلقائيًا بواسطة النوع الأول من النظام. ولكن هناك أيضًا عيبًا - حيث يتم تحديث بيانات الكتالوج يدويًا ويمكن أن يتخلف بشكل كبير عن الوضع الحقيقي. لا يمكن أن تتغير تصنيفات الصفحات على الفور. ومن أمثلة هذه الأنظمة دليل ياهوودموز وجلاكسي.
  • الأنظمة الهجينة
تجمع محركات البحث مثل Yahoo وGoogle وMSN بين وظائف الأنظمة التي تستخدم روبوتات البحث والأنظمة التي يديرها البشر.
  • الأنظمة الفوقية
تجمع محركات البحث الوصفية نتائج عدة محركات بحث في وقت واحد وتصنفها. كانت محركات البحث هذه مفيدة عندما كان لكل محرك بحث فهرس فريد وكانت محركات البحث أقل "ذكاءً". وبما أن البحث قد تحسن كثيرًا الآن، فقد انخفضت الحاجة إليها. أمثلة: ميتاكراولروبحث MSN.

سوق محركات البحث

يعد Google محرك البحث الأكثر شعبية في العالم بحصة سوقية تبلغ 68.69%. ويحتل موقع Bing المركز الثاني بحصة 12.26%.

أشهر محركات البحث في العالم:

نظام البحث الحصة السوقية في يوليو 2014 الحصة السوقية في أكتوبر 2014 الحصة السوقية في سبتمبر 2015
جوجل 68,69 % 58,01 % 69,24%
بايدو 17,17 % 29,06 % 6,48%
بنج 6,22 % 8,01 % 12,26%
ياهو! 6,74 % 4,01 % 9,19%
أمريكا أون لاين 0,13 % 0,21 % 1,11%
تثير 0,22 % 0,00 % 0,00 %
بسأل 0,13 % 0,10 % 0,24%

آسيا

في دول شرق آسيا وروسيا، لا يعد Google محرك البحث الأكثر شعبية. في الصين، على سبيل المثال، هو أكثر شعبية محرك البحث سوسو؟!.

في كوريا الجنوبية، يتم استخدام بوابة البحث الخاصة بشركة Naver بواسطة حوالي 70% من مستخدمي Yahoo!  اليابان وياهو! تايوان هي محرك البحث الأكثر شعبية في اليابان وتايوان على التوالي.

روسيا ومحركات البحث باللغة الروسية

وفقًا لبيانات LiveInternet في يونيو 2015 حول تغطية استعلامات البحث باللغة الروسية:

  • جميع اللغات:
    • ياهو! (0.1%) ومحركات البحث المملوكة لهذه الشركة: إنكتوميألتا فيستا, Alltheweb
  • الناطقة باللغة الإنجليزية والدولية:
    • اسألجيفز(محرك تيوما)
  • الناطقة بالروسية - تقوم معظم محركات البحث "باللغة الروسية" بفهرسة النصوص والبحث عنها بالعديد من اللغات - الأوكرانية والبيلاروسية والإنجليزية والتتارية وغيرها. وهي تختلف عن الأنظمة "جميع اللغات" التي تقوم بفهرسة جميع المستندات المتتالية من حيث أنها تقوم بشكل أساسي بفهرسة الموارد الموجودة في مناطق النطاق حيث تهيمن اللغة الروسية، أو بطرق أخرى تقصر الروبوتات الخاصة بها على المواقع الناطقة باللغة الروسية.

تستخدم بعض محركات البحث خوارزميات بحث خارجية.

البيانات الكمية لمحرك بحث جوجل

يتزايد باستمرار عدد مستخدمي الإنترنت ومحركات البحث ومتطلبات المستخدم لهذه الأنظمة. ولزيادة سرعة البحث عن المعلومات الضرورية، تحتوي محركات البحث الكبيرة على عدد كبير من الخوادم. يتم عادةً تجميع الخوادم في مراكز الخوادم (مراكز البيانات). تمتلك محركات البحث الشهيرة مراكز خوادم منتشرة حول العالم.

في أكتوبر 2012، أطلقت جوجل مشروع "حيث يعيش الإنترنت"، حيث يتم منح المستخدمين الفرصة لاستكشاف مراكز بيانات الشركة.

يعرف محرك بحث Google ما يلي حول تشغيل مراكز البيانات:

  • قدرت القدرة الإجمالية لجميع مراكز بيانات جوجل، اعتبارًا من عام 2011، بنحو 220 ميجاوات.
  • عندما خططت جوجل لافتتاح مجمع جديد في ولاية أوريجون عام 2008، يتكون من ثلاثة مبان بمساحة إجمالية تبلغ 6.5 مليون متر مربع، قدرت مجلة هاربر أن مثل هذا المجمع الكبير سيستهلك أكثر من 100 ميجاوات من الكهرباء، مقارنة بالطاقة استهلاك مدينة يبلغ عدد سكانها 300000 نسمة.
  • العدد المقدر لخوادم جوجل في عام 2012 هو 1,000,000.
  • بلغت نفقات جوجل على مراكز البيانات 1.9 مليار دولار في عام 2006، و2.4 مليار دولار في عام 2007.

يبلغ حجم شبكة الويب العالمية كما فهرستها Google اعتبارًا من ديسمبر 2014 حوالي 4.36 مليار صفحة.

محركات البحث التي تأخذ في الاعتبار المحظورات الدينية

وقد ساهم الانتشار العالمي لشبكة الإنترنت وتزايد شعبية الأجهزة الإلكترونية في العالم العربي والإسلامي، وخاصة في دول الشرق الأوسط وشبه القارة الهندية، في تطوير محركات البحث المحلية التي تراعي التقاليد الإسلامية. تحتوي محركات البحث هذه على مرشحات خاصة تساعد المستخدمين على تجنب زيارة المواقع المحظورة، مثل المواقع التي تحتوي على مواد إباحية، وتسمح لهم باستخدام فقط تلك المواقع التي لا يتعارض محتواها مع العقيدة الإسلامية. قبل شهر رمضان المبارك، في يوليو 2013، تم تقديم العالم البحث عن حلال- نظام يوفر للمستخدمين الروابط الحلال "الصحيحة" فقط، وتصفية نتائج البحث الواردة من محركات البحث الأخرى مثل Google وBing. قبل ذلك بعامين، في سبتمبر 2011، تم إطلاق محرك بحث أنا حلال لخدمة المستخدمين في الشرق الأوسط. ومع ذلك، كان لا بد من إغلاق خدمة البحث هذه قريبًا، وفقًا للمالك، بسبب نقص التمويل.

إن الافتقار إلى الاستثمار والوتيرة البطيئة لانتشار التكنولوجيا في العالم الإسلامي قد أعاقا التقدم وأعاقا نجاح محرك بحث إسلامي جاد. فشل الاستثمارات الضخمة في مشاريع الويب الخاصة بنمط حياة المسلمين، وكان أحدها موكسليم. لقد جمع ملايين الدولارات من مستثمرين مثل Rite Internet Ventures، والآن - وفقًا لآخر منشور لموقع I'mHalal قبل إغلاقه - يروج لفكرة مشكوك فيها مفادها أن "فيسبوك أو جوجل التالي قد يأتي من الشرق الأوسط فقط". ادعموا شبابنا الرائعين". ومع ذلك، فإن خبراء الإنترنت الإسلامي يعملون منذ سنوات عديدة في تحديد ما هو متوافق أو غير متوافق مع الشريعة الإسلامية، وتصنيف مواقع الويب على أنها "حلال" أو "حرام". جميع محركات البحث الإسلامية السابقة والحالية هي مجرد مجموعة من البيانات المفهرسة خصيصًا، أو هي محركات بحث رئيسية مثل Google وYahoo وBing، مع استخدام بعض أنظمة التصفية لمنع المستخدمين من الوصول إلى المواقع المحرمة مثل المواقع المتعلقة بالعري، وLGBT، وLGBT، القمار وأي مواضيع أخرى تعتبر معادية للإسلام.

وتشمل محركات البحث الدينية الأخرى Jewogle، النسخة اليهودية من Google، وSeekFind.org، وهو موقع مسيحي يتضمن مرشحات لحماية المستخدمين من المحتوى الذي قد يقوض أو يضعف عقيدتهم.

النتائج الشخصية وفقاعات التصفية

تستخدم العديد من محركات البحث، مثل Google وBing، خوارزميات لتخمين المعلومات التي يود المستخدم رؤيتها بشكل انتقائي بناءً على نشاط التصفح السابق. ونتيجة لذلك، تعرض مواقع الويب فقط المعلومات التي تتوافق مع اهتمامات المستخدم السابقة. ويسمى هذا التأثير "فقاعة التصفية".

كل هذا يؤدي إلى حقيقة أن المستخدمين يتلقون معلومات أقل بكثير تتعارض مع وجهة نظرهم ويصبحون معزولين فكريًا في "فقاعة المعلومات" الخاصة بهم. وبالتالي، فإن "تأثير الفقاعة" يمكن أن يكون له عواقب سلبية على تكوين الرأي المدني.

تحيز محرك البحث

على الرغم من أن محركات البحث مبرمجة لتصنيف مواقع الويب على أساس مزيج من الشعبية والأهمية، إلا أن الأبحاث التجريبية تشير في الواقع إلى أن عوامل سياسية واقتصادية واجتماعية مختلفة تؤثر على نتائج البحث.

قد يكون هذا التحيز نتيجة مباشرة للعمليات الاقتصادية والتجارية: فالشركات التي تعلن على محرك بحث قد تصبح أكثر شهرة في نتائج البحث العضوية على المحرك. تعد إزالة نتائج البحث التي لا تتوافق مع القوانين المحلية مثالاً على تأثير العمليات السياسية. على سبيل المثال، لن تعرض شركة جوجل بعض المواقع الإلكترونية الخاصة بالنازيين الجدد في فرنسا وألمانيا، حيث يعتبر إنكار الهولوكوست أمراً غير قانوني.

يمكن أن يكون التحيز أيضًا نتيجة للعمليات الاجتماعية، حيث غالبًا ما يتم تصميم خوارزميات محرك البحث لاستبعاد وجهات النظر غير المنسقة لصالح نتائج أكثر "شعبية". تعطي خوارزميات الفهرسة لمحركات البحث الرئيسية الأولوية للمواقع الأمريكية.

يعد قصف البحث أحد الأمثلة على محاولة التلاعب بنتائج البحث لأسباب سياسية أو اجتماعية أو تجارية.

أنظر أيضا

  • قويكا
  • المكتبة الإلكترونية#قوائم المكتبات و  محركات البحث
  • شريط أدوات مطور الويب

ملحوظات

الأدب

  • أشمانوف إ.س.، إيفانوف أ.أ.ترويج الموقع في محركات البحث. - م: ويليامز، 2007. - 304 ص. -ردمك 978-5-8459-1155-1.
  • بايكوف ف.د.إنترنت. ابحث عن معلومات. الترويج لموقع الويب. - سان بطرسبرج. : BHV-بطرسبرغ، 2000. - 288 ص. -ردمك 5-8206-0095-9.
  • كوليسنيتشينكو د.ن.محركات البحث وترويج المواقع على شبكة الإنترنت. - م: الجدلية، 2007. - 272 ص. -ردمك 978-5-8459-1269-5.
  • لاندي دي.البحث عن المعرفة على شبكة الإنترنت. - م: الجدلية، 2005. - 272 ص. -ردمك 5-8459-0764-0.
  • لاند دي في، سنارسكي إيه إيه، بيسودنوف آي في.الإنترنت: التنقل في الشبكات المعقدة: النماذج والخوارزميات. - م: ليبروكوم (افتتاحية URSS)، 2009. - 264 ص. -ردمك 978-5-397-00497-8.
  • تشو ه، روزنتال م.

يعود تاريخ تطور الإنترنت الروسي (Runet) رسميًا إلى عام 1994. في ذلك الوقت، تم تسجيل النطاق Zone.ru، وبدأت المواقع الأولى في الظهور، ونما الكثير منها فيما بعد إلى بوابات شعبية.

مكتبة موشكوف، وكالة المعلومات RosBusinessConsulting، استوديو أرتيمي ليبيديف - تأسست كل هذه الموارد في منتصف التسعينيات من القرن الماضي.

كيف ظهرت محركات البحث الأولى

لفترة طويلة، كان "سكان" Runet يقتصر على عدد صغير من رواد تقنيات الشبكات. كان هناك عدد قليل جدًا منهم لدرجة أن مفهوم "البحث" لم يكن موجودًا في تلك الأيام.

يمكن حفظ معظم المواقع الضرورية في الإشارات المرجعية للمتصفح، وبالنسبة للباقي كانت هناك أدلة حيث تم تجميع جميع الروابط في عدة فئات رئيسية. كان أول كتالوج من هذا القبيل هو مشروع "روسيا على الشبكة" (http://www.ru)، وبعد ذلك بقليل ظهر DMOZ وYahoo وYandex.Catalog.

ومع ذلك، مع مرور الوقت، زاد عدد مستخدمي الإنترنت، كما زاد عدد المواقع التي تم إنشاؤها حتى يتمكن هؤلاء المستخدمون من زيارتها والحصول على المعلومات التي يحتاجون إليها.

تدريجيًا، نمت قواعد بيانات الكتالوج بشكل كبير لدرجة أنه أصبح من الصعب جدًا العثور على أي شيء يدويًا. ثم جاءت فكرة أتمتة عملية البحث وإنشاء خدمة تفاعلية متخصصة لذلك.

يؤدي الطلب دائمًا إلى العرض، لذلك بدأت مشاريع البحث من مؤلفين مختلفين تظهر على الإنترنت واحدًا تلو الآخر. البعض منهم، مثل WebCrawler، Lycos، InfoSeek وغيرها، لم يتمكنوا من تحقيق أي نجاح جدي وبعد مرور بعض الوقت ماتوا في الغموض على مساحات شاسعة من شبكة الويب العالمية.

ولكن بالنسبة للشركات الأخرى الأكثر نجاحا، فقد تحول كل شيء بشكل أفضل بكثير - تم تشكيل المطورين الحديثين الرائدين لتقنيات البحث خلال هذه الفترة وعلى مدى السنوات الماضية تمكنوا من تحقيق نتائج مذهلة.

ما هو محرك البحث

يعد محرك البحث الحديث آلية معقدة للغاية تتطلب موارد هائلة (بشرية ومادية) لدعم العمل المستمر والتنمية المستدامة.

يعتمد تشكيل نتائج البحث على صيغة التصنيف سيئة السمعة، والتي تأخذ في الاعتبار مئات العوامل المختلفة، بدءًا من البنية الداخلية للموقع ونصوص صفحاته وحتى الروابط الخارجية، وجاذبية العروض التجارية المنشورة على المورد، و الخصائص السلوكية للمستخدمين الذين تحولوا إليها من البحث.

في الفترة 2006-2007، ذكر ممثلو ياندكس أن هناك حاجة إلى معهد أبحاث كامل لفك رموز الخوارزمية الخاصة بهم، لأن بحثهم كان يعتمد على أخذ أكثر من 800 عامل مختلف في الاعتبار. لقد مرت سنوات منذ ذلك الحين، وأصبحت صيغة التصنيف أكثر تعقيدًا بعدة مراتب، وأصبح التأثير على العوامل التي لها التأثير الأكبر على نتائج البحث شبه مستحيل.

لذا، خلف البساطة الخارجية للصفحة الرئيسية والاستجابة السريعة من Yandex أو Google لعبارة البحث التي أدخلتها، يختبئ العمل المضني لآلاف الأشخاص والاستثمارات المالية الضخمة في البنية التحتية والمعدات والموارد البشرية.

وفي الوقت نفسه، من الواضح أن الشركات الرائدة اليوم قد ضمنت مثل هذا التفوق على أولئك الذين يريدون التنافس معها، على الأقل بطريقة ما، بحيث يقاس سعر الدخول إلى هذا السوق بمليارات الدولارات.

يمكن تأكيد هذا الوضع من خلال تاريخ المحاولات التي قامت بها شركة البرمجيات الشهيرة والأغنى Microsoft لاختراق سوق البحث. لقد تم وضع محرك بحث Bing الخاص بها كمنافس جدي للاعبين الرائدين لأكثر من عقد من الزمان، حيث تم استثمار مبالغ ضخمة فيه.

وفقط في السنوات الأخيرة، بدأت هذه الاستثمارات في تحقيق النتائج الأولى، على الرغم من أنه لا يزال من الممكن وصفها بأنها مرضية فقط بمبالغة كبيرة جدًا: كانت حصة Bing في السوق الروسية في وقت كتابة هذا التقرير أقل من واحد بالمائة.

مثال آخر يوضح الاستنتاجات التي تم التوصل إليها سابقًا هو محرك البحث الروسي Nigma. اختار منشئوها استراتيجية تسويقية متخصصة. على ما يبدو، مدركين جيدًا أنه في مجال البحث العام المفتوح يكاد يكون من المستحيل التنافس مع ركائز السوق، فقد اتخذ مطورو الخوارزمية طريق تقديم خدمات البحث للهياكل التعليمية في مجال الكيمياء والرياضيات والفيزياء و علوم أخرى.

ومع ذلك، من الواضح أن الجمهور المستهدف لمثل هذا المشروع صغير، وهو ما ينعكس بوضوح في حضوره: وفقًا لعداد Liveinternet، فإن عدد مستخدمي هذا النظام لا يتجاوز عُشر واحد بالمائة.

  1. الزعيم بلا منازع في الترتيب هو ياندكس. ووفقا لنفس العداد، تمتلك ياندكس "حصة مسيطرة" في سوق محركات البحث: في يوليو 2014، كانت حصة محرك البحث أكثر من 52٪.
  2. واحتلت جوجل بكل ثقة المركز الثاني بنسبة 38%.
  3. تحتل البوابة mail.ru المركز الثالث بفارق كبير إلى حد ما. منذ بعض الوقت، كان أحد المواقع الشهيرة، على ما يبدو، يبحث عن أخ أكبر يمكن أن يبيعه بسعر أعلى - تم دمج محركات Yandex وGoogle بالتناوب في منصة البحث الخاصة بهم. ولكن منذ عام 2013، حددت الشركة مسارًا للتطوير المستقل، والآن ينفذ الموقع خوارزمية بحث بتصميمه الخاص. صحيح أن هذا لم يؤثر بأي شكل من الأشكال على حصة النظام في السوق، والتي يبدو أنها تتحدد بشكل أساسي من خلال الترويج للعلامة التجارية وجاذبية الخدمات المقدمة على الموقع. على مدى السنوات الماضية، تقلبت حركة المرور إلى خدمة go.mail.ru بحوالي 7٪.

لا يمكن اعتبار جميع محركات البحث الأخرى، بما في ذلك محرك Rambler الذي كان قويًا في السابق، إلا كخلفية طبيعية - فليس لها جميعًا تأثير كبير على توزيع الأماكن في أفضل محركات البحث، حيث تكون عند مستوى 0.1-0.7 بالمائة من سوق.

تحليل سوق البحث على الإنترنت في روسيا

سوق محركات البحث في روسيا محدد للغاية. لوصف ذلك، يمكن استخدام خاصيتين: مركزة وضعيفة المنافسة. والواقع أن حصة اللاعبين الرئيسيين الثلاثة تتجاوز 97%، وهو ما يشير إلى تفوقهم الساحق على كل الآخرين.

يتمتع محرك البحث الروسي ياندكس بموقع مهيمن. وكما قلنا سابقاً فإن حصتها تتجاوز 50%. وفي هذا فإن بلدنا فريد من نوعه: هنا فقط، في الصين وجمهورية التشيك، توفر محركات البحث الوطنية منافسة ملموسة للعملاق العالمي - جوجل.

من حيث عدد استعلامات البحث التي تمت معالجتها، تحتل ياندكس المرتبة الرابعة في العالم. علاوة على ذلك، إذا كان المركز الأول الذي تحتله جوجل في هذه القائمة لا يمكن التشكيك فيه، فإن المركز الثاني لشركة بايدو الصينية يرجع فقط إلى العدد الهائل من السكان في هذا البلد. المركز الثالث يذهب إلى شركة ياهو، التي تتمتع حاليًا بميزة مضاعفة على المحتكر الروسي.

وفقًا لقواعد السوق الأوروبية، يمكن بالفعل تسمية Yandex بالمحتكر - حيث يتم تعيين هذا التعريف هناك لأي شركة تتجاوز حصتها في السوق 35٪.

في بلادنا يسمى هذا الوضع بالهيمنة ولا يعاقب عليه إلا بعد إثبات حقيقة إساءة استخدام الميزة الحالية. من الواضح أنه في بيئة الإنترنت من الصعب جدًا تأكيد حقيقة إساءة الاستخدام.

كيفية تحديد حصة محرك البحث في إجمالي حركة المرور

من السهل جدًا الحصول على تقييم موضوعي لهذا المؤشر. الحقيقة هي أن الغالبية العظمى من المواقع الروسية قامت بتثبيت عدادات من شركة Liveinternet الرائدة في مجال إحصائيات الإنترنت.

بالطبع، لا تقوم جميع المواقع بتثبيت هذه العدادات، علاوة على ذلك، فإن الرابط التالي لا يأخذ في الاعتبار نطاقات النطاق .su و ref؛ ولكن لا يزال، يمكن اعتبار العينة ممثلة تماما؛ فهي تأخذ في الاعتبار جميع المواضيع الرئيسية والمناطق وأنواع المواقع المتوفرة اليوم على RuNet.

لذلك، يمكنك رؤية الوضع الحالي على الرابط: http://www.liveinternet.ru/stat/ru/searches.html?date=2014-07-31;period=... .

هذا ملخص كامل لعدد الزوار الذين ذهبوا إلى المواقع المسجلة للمستخدمين الروس لشهري يونيو ويوليو 2014.

الاستنتاجات واضحة. لقد قدمنا ​​بالفعل تحليلاً للحالة في القسم السابق.

خصائص محركات البحث الرئيسية في روسيا

ياندكس

يوضح ظهور محرك البحث هذا في السوق جيدًا الوضع في البلاد في الوقت الذي بدأ فيه يتخذ شكلًا حديثًا. لا عجب أن يُطلق على Yandex اسم مرآة Runet - على ما يبدو، يمكن توسيع هذا التعريف ليشمل الواقع الموضوعي.

إن تطور الشركة يشبه إلى حد كبير تطور المجتمع بأكمله، لذا فإن الزعيم الوطني هو إلى حد ما مرآة للبلد بأكمله في نهاية القرن العشرين.

من أجل توضيح مثل هذا البيان الجريء، دعونا نلقي نظرة سريعة على تاريخ الشركة ومحرك بحث Yandex.

تتميز الأوقات التي تلت البيريسترويكا بإعادة تقييم جدية للقيم من قبل الجزء الأكثر نشاطا في المجتمع وظهور أشخاص نشيطين جدد في الساحة السياسية والتجارية، توحدهم الفكرة الرئيسية في حياتهم: تحديث الظروف المعيشية للشعب. أنفسهم ووطنهم من أجل ضمان مستوى معيشي لائق لكل من يشاركهم معتقداتهم.

أحد النجوم البارزين في تلك الحقبة هو أركادي فولوز، الذي تمكن من الجمع حول نفسه أفضل المتخصصين مدمني العمل الذين وضعوا الأساس لنظام البحث المستقبلي.

ربما لن تصبح ياندكس أبدًا مرآة لـ Runet لولا الغريزة المذهلة لـ Arkady Volozh، الذي كان قادرًا على رؤية الاحتمال الرئيسي في ذلك الوقت في بناء محرك بحث روسي.

ولتنفيذ فكرته، تمكن من إعادة توجيه التدفقات المالية إلى هذا المشروع الناتجة عن معاملات المقايضة لتبادل مجموعات من أجهزة الكمبيوتر المستوردة إلى بلدنا مقابل قطارات من بذور اليقطين كوبان.

وبطبيعة الحال، لا يتم تنفيذ المشاريع الكبيرة دون وجود فريق من الأشخاص ذوي التفكير المماثل. ومن ثم كان مؤسس ياندكس محظوظًا - فقد تمكن من جذب الفيزيائي الموهوب والواعد للغاية إيليا سيجالوفيتش إلى جانبه، والذي كان يعرفه منذ المدرسة.

من الصعب أن نقول ما هي القشة الأخيرة التي رجحت كل احتمالات الحصول على مهنة علمية رائعة للعالم العظيم في المستقبل. ربما يكون الهوس الحقيقي وموهبة الإقناع للمدير الدائم لشركة ياندكس قد لعبا دورًا حاسمًا، لكن إيليا أصبح المدير الفني للشركة وقدم مساهمة لا تقدر بثمن في تطويرها.


كان هو الذي أصبح مؤلف الاسم والشعار، وهو معروف الآن لكل من زار الإنترنت على الإطلاق. أصبح سيجالوفيتش مهتمًا بفكرة التحليل الصرفي للعبارات باللغة الروسية وإمكانية تصنيف النصوص بناءً على قواعد بناء الهياكل النحوية.

ونتيجة لذلك، ظهر تعبير "مؤشر آخر"، والذي أصبح في نسخة مختصرة، بفضل اليد الخفيفة لمؤسسي محرك البحث، كلمة Yandex. بعد ذلك، من أجل التأكيد على الغرض الرئيسي من محرك البحث - البحث في الجزء الناطق باللغة الروسية من الإنترنت - تم تحويل الشعار إلى Yandex.

كرس إيليا سيجالوفيتش حياته كلها لتشكيل وتطوير هذا المشروع. لسوء الحظ، توفي في عام 2013، لكن عمله لا يزال قائما؛ تعمل ياندكس على زيادة تفوقها على المنافسين من خلال التحسين المستمر لخوارزمية البحث، والتي وضع أسسها مدير التكنولوجيا والتطوير الراحل.

جوجل

تم إنشاء محرك بحث Google قبل عام من إنشاء محرك Yandex، لكنه ظهر في السوق الروسية فقط في عام 2004. وبطبيعة الحال، على مر السنين، نجحت ياندكس في تكييف بحثها مع تفاصيل بلدنا.

على الرغم من حقيقة أن عددًا لا بأس به من مستخدمي الإنترنت، ردًا على سؤال لا يعرفون إجابته، يقترحون "Google" بدلاً من "اسأل Yandex"، إلا أن المشكلة الرئيسية للعملاق العالمي هي عدم الاهتمام الكافي بـ "Google" مورفولوجيا النصوص باللغة الروسية، ونتيجة لذلك غالبًا ما تكون الإجابة على استفسارات المستخدمين غير مكتملة أو مشوهة قليلاً.

يمكنك الجدال لفترة طويلة حول من هو البحث الأفضل وأي نظام يوفر عملاء أكثر تحفيزًا (أو "ساخنين"). ولكن يبدو لنا أن الصورة النموذجية للمستخدم الروسي هي كما يلي: أولاً، يتم طلب "مرآة Runet"، وإذا كانت نتائج البحث غير ذات صلة (وهذا، للأسف، يحدث كثيرًا)، يتم الطلب إعادة إرسالها إلى جوجل.


تحدث تحديثات Google العالمية بشكل أقل تكرارًا من تحديثات Yandex. لكنهم يغيرون نتائج البحث على محمل الجد لدرجة أن العديد من المواقع الموثوقة التي كانت في القمة لسنوات عديدة تجد نفسها في أسفل أول مائة نتيجة بحث.

على سبيل المثال، كان للإصدار الأخير من خوارزمية باندا تأثير كبير على بعض المتاجر الرائدة على الإنترنت، حتى أنه أثر على موقع Amazon.com الذي يبدو أنه لا يمكن المساس به وغيره.

وفي عام 2013، توقفت الشركة أخيرًا عن بث عمليات بحث الآخرين على موقعها ونفذت نسختها الخاصة من محرك البحث على go.mail.ru.

لا يمكن الترحيب بهذه الخطوة إلا، لأنه في المستقبل قد يوفر محرك البحث من mail.ru مقاومة جدية للثنائي القيادي، والذي يمكنه الآن الاسترخاء قليلاً، دون الشعور بالتنفس العاصف للمنافسين خلف ظهره.

لا تتجاوز حصة محرك البحث هذا حاليًا 7%، ولكن لديها احتمالية جيدة للزيادة بسبب تطور الخدمات الاجتماعية التي تقدمها الشركة: Odnoklassniki، Moi Krug، البريد، إلخ.

محركات البحث التي تقل حصتها في السوق عن 1%

تحتوي هذه المجموعة بشكل أساسي على أنظمة لم تتمكن أبدًا من اقتحام نخبة البحث الروسي. من بينها، تحتل شركة Rambler مكانة خاصة، حيث احتلت بثقة المركز الثاني وأظهرت اتجاهات واعدة للغاية.

متسكع

بعد أن ظهر في عام 1996 باعتباره من بنات أفكار مبرمجين من مدينة بوشينو العلمية تحت قيادة المتحمس الموهوب دميتري كريوكوف، أصبح رامبلر على الفور رائدًا في سوق محركات البحث. في تلك الأيام، لم تكن ياندكس موجودة بعد، وكانت جوجل قد بدأت للتو مسيرتها عبر أمريكا والدول المجاورة.

يبدو أن مثل هذه البداية كان ينبغي أن تساعد "المتشرد" (هذه هي الطريقة التي تُترجم بها كلمة Rambler من الإنجليزية) للحصول على مزايا تنافسية ملحوظة في التنمية.

ولكن إما الصراعات الداخلية في الشركة، أو عدم وجود استراتيجية محددة بوضوح، أدت إلى حقيقة أن Rambler يبث الآن بحث Yandex وهو معروف بشكل أفضل كمجمع لبعض الخدمات الشعبية، بما في ذلك موقع تصنيف Rambler Top100.

بنج

Aka MSN Search، Live Seacrh، Windows Live Seacrh هو أحد منتجات Microsoft، التي تناضل بشدة من أجل الحصول على مكان تحت الشمس في سوق محركات البحث. هذه إحدى الخدمات القليلة التي تستخدم محركها الخاص.

نتائج البحث مقبولة تمامًا، ويبدو أن المشكلة الرئيسية للموقع هي انخفاض شعبيته بين المستخدمين.

ميناء

مثال آخر على المصير المحزن لما كان ذات يوم أحد رواد السوق. كانت هناك أوقات احتل فيها محرك البحث هذا المركز الثالث بقوة بعد Yandex وRambler، وسعى مشرفو المواقع إلى الدخول إلى كتالوجه بنفس النشاط كما هو الحال في DMOZ أو كتالوج Yandex.

يستضيف الموقع الآن متجرًا إلكترونيًا للسلع المنزلية الشهيرة. إذا استمر البحث في المنفذ، فسيتم إخفاؤه في مكان ما في أعماق المورد، في أحد نطاقاته الفرعية.

ما تحتاجه لكتابة محرك البحث الخاص بك

للإجابة على هذا السؤال، يجب أن يكون لديك فهم جيد لمعنى محرك البحث وكيف يعمل. لقد قمنا بالفعل بدراسة جزئية للمبادئ الأساسية لبناء صيغة لتصنيف المواقع في نتائج البحث. وبالإضافة إلى ذلك، ينبغي ملاحظة النقاط التالية:

تتمثل المهمة الرئيسية لمحرك البحث في تقديم إجابة لطلب المستخدم. يجب أن تكون الإجابة واضحة وذات صلة، وإلا سينتقل المستخدم إلى أنظمة أخرى، حتى على الرغم من قلة المنافسة في هذه الصناعة.

لإعطاء مثل هذه الإجابة، تحتاج خوارزمية البحث، وقت تشكيلها، إلى فحص محتويات مليارات عديدة من الصفحات على الإنترنت بحثًا عن أنسبها لطلب معين. للقيام بذلك، تقوم محركات البحث بإنشاء قواعد البيانات الخاصة بها، والتي تسمى الفهارس، وتخزين جميع المعلومات الضرورية هناك.

يتم تشكيل الفهرس من خلال المسح المستمر للشبكة بحثًا عن المواقع الجديدة التي ظهرت، بالإضافة إلى التغييرات في الصفحات المفهرسة بالفعل. يتم تنفيذ هذا العمل بواسطة برامج خاصة تسمى روبوتات الفهرسة.

يزورون مواقع الويب على مدار الساعة ويقرأون المعلومات المحدثة. يتطلب تنظيم تشغيل مثل هذه الروبوتات بناء مركز بيانات كبير لعدة آلاف من أجهزة الكمبيوتر القوية مع جميع البنية التحتية، بدءًا من إمدادات الطاقة غير المنقطعة والتبريد وحتى الصيانة والتحديثات المنتظمة.

يرغب المستخدمون في الحصول على إجابات سريعة وكافية لاستفساراتهم. لذلك، يجب على محرك البحث الحديث أن يأخذ في الاعتبار ليس فقط خصائص المواقع التي يعرفها، ولكن أيضًا التفضيلات والخصائص السلوكية والموقع الجغرافي لكل عميل من عملائه.

وللقيام بذلك، يجب أن تحتوي خوارزميات البحث على عناصر الذكاء الاصطناعي وأن تكون قادرة على التعلم بشكل مستقل أثناء عملها. من الواضح أن كتابة مثل هذا المحرك تحتاج إلى فريق كبير من المبرمجين من الدرجة الأولى.

وبالنظر إلى أن محركات البحث الرائدة قد حلت بالفعل كل هذه المشاكل ولديها كل الإمكانات اللازمة لمزيد من التطوير، فإن تكلفة دخول هذا السوق تبدو باهظة تقريبا.

لذلك، من غير المرجح أن يظهر لاعب جديد في المستقبل القريب، قادر على أخذ مكانه الصحيح بسرعة بين الأنظمة الحالية. على الرغم من أنه إذا حدث هذا فجأة، فسوف يستفيد الجميع - محركات البحث نفسها، والتي ستتلقى حوافز جديدة لمزيد من التحسين، ونحن، المستخدمين العاديين المتقلبين، الذين نفتقد دائمًا شيئًا ما ونريد أن يصبح البحث أفضل وأعلى جودة كل عام. يوم .

ما هو محرك البحث الأول في RuNet؟ ياندكس، أبورت أو رامبلر؟

محركات البحث الأولى في Runet (والتي، وفقا لأحد مؤسسي Rambler، كان هناك 2 أو 3) غرقت بسرعة كبيرة في غياهب النسيان. وكان من بينها امتدادات مورفولوجية لنظام AltaVista، والتي لم تترك لنا أسمائها. لذلك، سيتعين علينا الاختيار من بين أولئك الذين سيبقون:

متسكع

بدأ إنشاء Rambler في عام 1996، عندما لم يكن هناك سوى بضع عشرات من المواقع في الجزء الروسي من الإنترنت. تم الانتهاء من التطوير بحلول خريف ذلك العام. تم تسجيل النطاق rambler.ru في 26 سبتمبر و 8 أكتوبر 1996، في عيد ميلاد أحد المبدعين، تم فتح Rambler للمستخدمين.

Rambler - أول محرك بحث في Runetمن الموجودين حاليا.

تم تطوير محرك بحث Aport بحلول فبراير 1996، ولكن في ذلك الوقت كان يبحث فقط على موقع russia.agama.com. تدريجيا نما عدد المواقع وقرب الافتتاح الرسمي 11 نوفمبر 1997في العام الماضي، تم بالفعل البحث عن "Aport" في 10000 موقع. وهكذا، كان "Aport" من أوائل محركات البحث على شبكة RuNet، ولكن نظرًا لنطاق البحث المحدود، لا يمكن اعتباره الأقدم.

ياندكس

تأسست شركة CompTek، الشركة التي طورت Yandex، في عام 1989. في عام 1993، قامت شركة CompTek بتطوير برنامج Yandex، وهو برنامج للبحث عن القرص الصلب. وفي عام 1996، أضاف البرنامج القدرة على البحث في الويب. في عام 1997، تم كتابة أول روبوت بحث، وتم فهرسة Runet و 23 سبتمبر 1997تم العرض الرسمي لـ Yandex.

إن شركة Yandex التابعة لشركة CompTek ليست الأقدم، لكن تقنيات البحث والأبحاث الخاصة بها في اللغويات والمورفولوجيا هي الأقدم في روسيا.