تحليل البيانات في متخصص لغة SQL. استخدام R مع قواعد البيانات

28.03.2019
Power Query عبارة عن أداة لتكامل البيانات في Excel من مصادر خارجية.
يتيح لك Power Query البحث عن البيانات وفتحها من مصادر متعددةمتاح عبر الإنترنت ومن خلال شبكات الشركات. يمكنه تحميل البيانات إلى Excel أنواع مختلفةوالتنسيقات والهياكل، وكذلك من مصادر مختلفة تمامًا:
مصدر ويكي
يسمح لك Power Query باستيراد مصادر بيانات خارجية (شبه منظمة) ومعالجتها في Excel. يظهر المثال أدناه أكبر المدنفي أمريكا الشمالية والجنوبية على الخريطة حسب عدد سكانها.


(قابل للنقر)

استيراد وتحليل رسائل البريد الإلكتروني في Outlook
من الممكن أيضًا استيراد الحروف كمصدر بيانات وتحليلها في Outlook. يوضح المثال أدناه استيراد البريد وينشئ رسمًا بيانيًا لعدد رسائل الشخص الذي تتم المراسلات معه في أغلب الأحيان.


(قابل للنقر)

الايجابيات: PowerQuery هي واحدة من أقوى الأدوات، من ناحية وظائف واسعةمن ناحية أخرى، من الصعب جدًا إتقان التحليل ويستخدمه المحللون بشكل أساسي. يعمل مثل مع نماذج جدوليةومع متعددة الأبعاد. قادرة على توصيل مصادر إضافية

السلبيات: غير مناسب للمستخدمين "العاديين"، ويصعب تعلمه، وبطيء نوعًا ما. لا توجد إمكانية لمشاركة الوصول، أو فرض قيود على حجم الملفات/السجلات، وما إلى ذلك.

مواد إضافية

تحميل

مايكروسوفت باور بي

Power BI هي أداة لإنشاء تقارير أعمال تفاعلية تتمتع بالقدرة تعاونوالتصور والعمل التفاعلي.

الخصائص الرئيسية:

  • التطوير السريع لتقارير الأعمال ولوحات المعلومات المفيدة (عبر الإنترنت) - مع القدرة على التفاعل واستكشاف البيانات.
  • التحديث التلقائي لتقارير ذكاء الأعمال والمرئيات عندما تتغير البيانات
  • دعم لغة الاستعلام، بما في ذلك Power Query. إمكانية التفاعل بين المشاركين على مستوى الطلب.
  • إنشاء كتالوج البيانات مع فهارس البحث.
  • لغة الاستعلام قريبة من الطبيعية (لمحلل الأعمال) وإمكانية العمل التفاعلي.
  • دعم الجهاز المحمول
مثال لتقرير يمكن نشره على الويب ومتاح للتفاعل والبحث من قبل المشاركين الآخرين.

مثال مع الاستعلامات والجمع بين المصادر: الجمع بين المصادر من بورصة نيويورك والمؤشر المالي S&P 500.


(قابل للنقر)

الايجابيات: جديد منتج حديثواجهة سهلة الاستخدام، سهلة التعلم، حل عبر الإنترنت.

السلبيات: الحل "خام" (بعض المكونات قد تكون غير مستقرة)، لا يعمل معه مكعبات OLAP، انخفاض الوظائف مقارنة بالمنافسين.

مواد إضافية:

تحليلات الهرم



Pyramid Analytics - منصة تحليلات الأعمال السحابية؛ يحتوي على ثلاثة مكونات رئيسية:
  • استخراج البيانات - اكتشاف البيانات
  • العمل التفاعلي مع البيانات والتصور - لوحات المعلومات
  • تقديم البيانات إلى جمهورك - الناشر
أمثلة على تقرير مزود بإمكانيات التصور الجغرافي واستكشاف البيانات.

فيديو تمهيدي:

(قناة يوتيوب الهرم التحليلات)

تتمتع المنصة بالقدرة على تحليل البيانات ووضع نماذج لها بشكل مشترك، بالإضافة إلى عدد من الميزات المفيدة الأخرى:

PyramidAnalytics هو الأكثر أداة قويةمن تلك التي نستخدمها.

الايجابيات: سهل التعلم، ويعمل مع كمية كبيرةمصادر، وظائف واسعة جدا.

السلبيات: سعر.

مكونات تحليلات خادم MS SQL (MDS، SSIS، SSAS)

يتيح لك SQL Server إجراء التحليل داخل نظامه البيئي. يحتوي على مجموعة واسعة من المكونات وسنركز على المكونات الثلاثة الأكثر شهرة.


خدمات البيانات الرئيسية- العمليات والأدوات اللازمة لإدارة البيانات الرئيسية للشركة. اقرأ أكثر.
(البيانات الرئيسية هي بيانات الأعمال: حول العملاء، والمنتجات، والخدمات، والموظفين، والتقنيات، والمواد، وما إلى ذلك)

خادم قاعدة البياناتتكامل الخدمات- ترحيل البيانات وتكاملها. اقرأ أكثر.

خدمات تحليل خادم SQLأولاب و بيانات التعدينداخل خادم قاعدة البيانات. اقرأ أكثر.

الأداة الرئيسية هي الدماغ

قد يكون من الصعب الخلط بين الرسوم البيانية الأربعة الموضحة أدناه. ومع ذلك، إذا قمنا بدلاً من التصور بحساب متوسط ​​القيمة والتباين والارتباط وبناء الانحدار بناءً عليها، فسنفاجأ بالحصول على نفس النتيجة تمامًا.


(ماتبلوتليب
  • التفاعل بين R و python
  • مؤامرات الويب التفاعلية في مؤامرة
  • أداة المكافأة

    أثناء كتابة هذا المقال، أعلنت شركة مايكروسوفت عن شراء أداة تحليلية من شركة Datazen، لذا سيكون من المفيد أن نذكرها بإيجاز.

    Datazen هو حل متعدد المنصات يسمح لك بإنشاء التقارير، بغض النظر عن النظام الأساسي (الكمبيوتر الشخصي، iOS، Android، هاتف ويندوز). سمة مميزةالمنتج هو التكامل والقدرة على نطاق واسع عمل كاملمنصة تحليلية عبر الأجهزة المحمولة.

    الايجابيات: يدعم مجموعة واسعة من المنصات، التي يدعمها ويطورها MS، ويعمل معها كمية كبيرةمصادر.

    السلبيات: لا يعمل مع OLAP مباشرة (تحتاج إلى إنشاء استعلامات MDX بنفسك)، وله عدد من القيود (بدءًا من إمكانيات الواجهة إلى تخصيص الوظائف)، ولا يتم بيعه بشكل منفصل، ويأتي مزودًا بـ MS SQL Enterprise Edition.

    في المقالة التالية سنلقي نظرة على Datazen وPyramid Analytics بالتفصيل، وسنتعرف أيضًا على كيفية إنشاء التقارير بناءً عليهما.

    تحليل البيانات بلغة SQL

    تعد لغة SQL أقوى أداة لمعالجة البيانات اخترعها الإنسان. لغة الاستعلام البسيطة والمعبرة هذه مدعومة من قبل جميع قواعد البيانات الحديثة (بما في ذلك بما في ذلك مايكروسوفتو Oracle و IBM) وأدوات التحليل والبرمجة (بما في ذلك Excel).

    على هذه الدورةسوف تصبح على دراية بقواعد بيانات اللغة استعلامات SQL. الهدف من الدورة هو تعلم كيفية استخدام قواعد البيانات الحديثة بطلاقة وثقة، بما في ذلك تحليل البيانات وبناء التقارير.

    جمهور الدورة:المحللون ومطورو التقارير الذين يعملون مع قواعد البيانات.

    عند الانتهاء من الدورة سوف تكون قادرا على:

    • يستخدم قواعد حديثةبيانات
    • كتابة استعلامات قاعدة البيانات بلغة SQL
    • استخدام بنيات SQL المعقدة
    • إجراء تحليل بسيط للبيانات
    • بناء التقارير

    هناك طلب كبير حاليًا على المتخصصين الذين يتمتعون بهذه المعرفة والمهارات. معظم خريجي الدورة لدينا يفعلون ذلك مهنة ناجحةويحظى باحترام أصحاب العمل.

    مدة الدورة - 24 ف. ح.

    برنامج الدورة

    الوحدة 1: قواعد البيانات العلائقية

    • نظام إدارة قواعد بيانات خادم SQL
    • لغة الاستعلام SQL
    • استوديو الإدارة
    • قواعد البيانات والجداول
    • كتابة وتنفيذ الاستفسارات
    • الوصول إلى البيانات من Excel
    • استخراج البيانات من مصادر مختلفة

    الوحدة 2. عمليات بسيطةمع طاولة واحدة

    • بيان التحديد
    • تصفية الجدول حسب الأعمدة
    • تصفية الجدول حسب الصفوف
    • استخدام الوظائف
    • أنواع البيانات
    • التعامل مع القيم غير المعروفة
    • فرز
    • عملية أعلى
    • القضاء على التكرارات
    • ترتيب العمليات في الطلب

    الوحدة 3: تحويل الجدول

    • تجميع
    • التجميع
    • تصفية المجموعة

    الوحدة 4. تعديل البيانات

    • إضافة صفوف
    • تعديل السلسلة
    • إزالة الصفوف

    الوحدة 5: عمليات الجداول المتعددة

    • استخدام جداول متعددة في الاستعلام
    • الاتحاد والتقاطع والاختلاف بين المجموعات
    • الاستعلامات الفرعية
    • استخدام الاستعلامات الفرعية في عبارة SELECT
    • الانضمام إلى الجداول
    • باستخدام الاتصالات
    • اتصالات خارجية
    • اتصالات مترابطة
    • التقسيم العلائقي

    الوحدة 6. بناء التقارير

    • الجداول المحورية
    • حساب المجاميع الفرعية
    • تتراوح
    • إخراج الصفحة
    • التجميع مع نافذة منزلقة
    • وظائف الأوفست

    الوحدة 7. العمل مع مستودعات البيانات وأسواق البيانات

    • قواعد البيانات التشغيلية
    • مستودعات البيانات وأسواق البيانات
    • هيكل التخزين
    • العمل مع التخزين
    • المعالجة التحليلية لكميات كبيرة من البيانات
    • تحليل البيانات الإحصائية
    • أدوات تحليل البيانات

    عند الانتهاء من الدورة، الامتحان النهائي. يتم إجراء الشهادة في شكل اختبار في الدرس الأخير أو على أساس الدرجات العمل التطبيقييتم تنفيذها خلال الدورة.

    إذا كنت تريد أن تصبح عالم بيانات، فلا يمكنك الاستغناء عن SQL. لا يمكن استخدام هذه اللغة من قبل المحللين أو العلماء فحسب، بل أيضًا من قبل أي شخص يمكنه قضاء بضعة أيام فيها تعلم SQLالطلبات:

    SQL لتحليل البيانات؟ ما هذا؟ ما الفائدة من ذلك؟

    SQL تعني لغة الاستعلام الهيكلية، والتي تُترجم إلى " لغة الاستعلام الهيكلية».

    لكني أحب وصفًا آخر: إنه Excel المنشط. إليك ما تبدو عليه مجموعة البيانات نفسها في Excel وSQL:


    كما نرى، SQL وExcel متشابهان تمامًا. يقدم كلاهما البيانات كجدول ثنائي الأبعاد يحتوي على أعمدة وصفوف. كلاهما منظم للغاية وسهل الفهم.

    ولكن هناك عدد من الاختلافات بينهما:

    1. الأول هو أداء. يعمل برنامج Excel بشكل رائع مع كميات صغيرةالبيانات، ولكن عندما يكون لديك 100000 صف، فإن استخدام الصيغ يصبح تمرينًا مستهلكًا للوقت وغير فعال.
    2. والثاني هو طريقة التفاعل مع قاعدة البيانات. يعد Excel في المقام الأول واجهة مستخدم رسومية ( واجهة المستخدم الرسومية). يسمح لك بتمرير الجدول وإدخال الصيغ باستخدام المؤشر المجالات المطلوبة. ليس في SQL واجهة المستخدم الرسومية- يتم استخدام ما يسمى باستعلامات SQL هنا.



    عندما تتقن استعلامات SQL للمبتدئينستدرك أن العمل به أكثر شفافية وكفاءة من استخدام Excel. بالإضافة إلى ذلك، في SQL، يكون الأمر أكثر ملاءمة لأتمتة عملك واستخدام التطورات السابقة.

    عند تحليل البيانات، ستستخدم لغة SQL لمهام بسيطة إلى حد ما: التلخيص، والجمع بين مجموعات البيانات، والتحليلات الإحصائية البسيطة الأساليب الرياضية. ولكن مع SQL، سيصبح عملك أكثر كفاءة وستتمكن من استخدام مجموعات بيانات أكبر من ذي قبل.

    ماذا عن Python أو R أو bash؟

    عندما تبدأ في استخدام هذه اللغات لتحليل البيانات، ستدرك أن Python وR جيدان لشيء واحد، وSQL لشيء آخر. يكمن الاختلاف الرئيسي بين هذه اللغات في بناء الجملة و"الوظائف" والأداء. حسنًا، لننتقل الآن إلى الجزء العملي!

    الخطوة 0 – تثبيت نظام إدارة قواعد بيانات SQL

    سأستخدم PostgreSQL. هناك أنواع أخرى من SQL DBMS. لكنها كلها متشابهة، لذلك إذا تعلمت postgreSQL، فإن التكيف مع لغة أخرى لن يستغرق سوى بضع ساعات (أو حتى دقائق).

    على هذه اللحظةيجب أن يكون لديك ثلاثة أشياء:

    1. خادم البيانات مع إمكانية الوصول عبر المحطة الطرفية أو iTerm؛
    2. PostgreSQL مثبت على الخادم الخاص بك؛
    3. Pgadmin4 مثبت على جهاز الكمبيوتر الخاص بك (أو منضدة SQL).

    ملاحظة: سأستخدم SQL Workbench كأداة SQL الخاصة بي.

    الخطوة 1 – قم بتسجيل الدخول إلى قاعدة بيانات SQL الخاصة بك عبر موجه الأوامر

    تحتاج أولاً إلى الوصول إلى قاعدة البيانات من سطر الأوامر. سأوضح لك كيفية القيام بذلك، وفي المستقبل سوف تحتاج إلى القيام بنفس الشيء:

    1. فتح المحطة ( أو iTerm):
    2. الاتصال بالخادم عبر SSH.

    في حالتي أدخل:

    سش تومي@[my_ip_address]


    1. من خلال تسجيل الدخول إلى الخادم، يمكنني الوصول إلى قاعدة بيانات postgreSQL. وبما أنني قد سمحت بالفعل بالوصول إلى المستخدم الخاص بي، فأنا أدخل الأمر التالي:

    psql -U tomi -d postgres

    psql هو الأمر نفسه، -U يشير إلى اسم المستخدم ( في حالتي هو "تومي")، و -d يحدد اسم قاعدة البيانات ( في حالتي postgres، مثل حالتك). يجب أن يتغير موجه الأوامر إلى ما يلي:


    مستعد! الآن لديك الوصول الكاملإلى القاعدة بيانات SQL .

    1. ل الشيكات SQLالاستعلام الذي يمكنك إدخاله:

    ستظهر قائمة بجميع جداول البيانات على الشاشة. حتى الآن هناك واحد فقط. لكن هذا سيتغير قريباً:


    ملحوظة: تسمى قواعد بيانات SQL أيضًا " قواعد البيانات العلائقيةبيانات».

    الخطوة 2 - تحميل البيانات

    في هذا القسم سوف نعمل مع مجموعة صغيرةبيانات تسمى حديقة الحيوان ("حديقة الحيوان"). يمكنك تحميله من هنا على تنسيق النص.tsv.

    ولكن دعونا نواصل مع مثال استعلام SQL:

    1) إنشاء جدول:

    إنشاء حديقة حيوانات الجدول (حيوان varchar(10)، عدد صحيح uniq_id المفتاح الأساسي، water_need عدد صحيح)؛


    2) تأكد من إنشاء الجدول بالتأكيد:

    لدينا طاولة جديدةالبيانات: حديقة الحيوان!


    3) تحميل البيانات!

    انسخ الطلب:

    أدخل في حديقة الحيوان (animal,uniq_id,water_need) القيم ("فيل"،1001,500)، ("فيل"،1002,600)، ("فيل"،1003,550)، ("نمر"،1004,300) , ("النمر"،1005,320)، ("النمر"،1006,330)، ("النمر"،1007,290)، ("النمر"،1008,310)، ("الحمار الوحشي"، 1009,200) ، ("حمار وحشي"،1010،220)، ("حمار وحشي"،1011،240)، ("حمار وحشي"،1012،230)، ("حمار وحشي"،1013،220)، ("حمار وحشي"،1014،100) ، ("حمار وحشي"،1015،80)، ("أسد"،1016،420)، ("أسد"،1017،600)، ("أسد"،1018،500)، ("أسد"،1019،390) ، ("الكنغر"،1020،410)، ("الكنغر"،1021،430)، ("الكنغر"،1022،410)؛

    إذا سارت الأمور على ما يرام، ستتلقى الرسالة التالية:


    أهم عبارة SQL: SELECT

    حان الوقت للاستكشاف المشغل الرئيسي لغة الاستعلام SQL. هنا هو:

    اختر * من اسم الجدول؛

    سنستخدم SELECT في كل مرة نحتاج فيها إلى قراءة البيانات وتصفيتها وتحويلها وتلخيصها. في البداية، دعونا نختار ( كلمة انجليزيةيتم ترجمة التحديد تمامًا كـ "تحديد") كل ما هو موجود في جدول حديقة الحيوان.

    اختر * من حديقة الحيوان؛


    أعاد عامل الهاتف لي الجدول بأكمله.

    اختر * من حديقة الحيوان؛

    SELECT هو البيان الأساسي الذي يخبر SQL أننا نريد قراءة البيانات من الجدول.
    * - يشير إلى أننا نريد تحديد كافة الأعمدة.
    يخبر FROM SQL بأننا سنقوم بتحديد جدول لقراءة البيانات منه.
    حديقة الحيوان هو اسم الجدول. يمكن استبداله بأي شيء آخر إذا كان لديك عدة جداول.
    ; هذا هو بناء الجملة المطلوب من قبل SQL. يجب أن ينتهي كل استعلام بفاصلة منقوطة. إذا قمت بتخطيه عن طريق الخطأ، فسوف ينتظر SQL حتى يستمر الاستعلام ولن يعرض أي شيء.

    سوف نستخدم التعبير الذي تمت مناقشته أعلاه بانتظام عند العمل معه استعلامات معقدة SQL.

    اختيار الأعمدة

    يمكن استبدال العلامة * بأسماء الأعمدة. خذ بعين الاعتبار الاستعلام التالي كمثال:

    حدد الحيوان الذي يحتاج إلى الماء من حديقة الحيوان؛


    لقد حصلنا على ما توقعناه بالضبط: هناك عمودان "animal" و"water_need" على الشاشة، ولكن لم يعد "uniq_id".

    بنفس الطريقة، يمكنك تحديد أي أعمدة؛ ما عليك سوى تحديد أسمائها، مفصولة بفاصلة. يمكنك أيضًا القيام بشيء مثل هذا:

    حدد الحيوان، الحيوان، الحيوان من حديقة الحيوان؛


    سيتم تكرار نفس العمود عدة مرات... ولكن بما أن هذا لا معنى له، فلا يستحق القيام بذلك.

    عرض الصفوف القليلة الأولى من البيانات - تعليمات محدودة

    نعمل حاليًا على جدول بيانات يتكون من 22 صفًا. لقصر التحديد على الصفوف القليلة الأولى، سنستخدم التعليمة LIMIT - وهي "امتداد" صغير للاستعلام الأساسي:

    اختر * من حديقة الحيوان LIMIT 10؛

    سيتم عرض الأسطر العشرة الأولى فقط على الشاشة.


    تصفية الصفوف - بيان أين

    باستخدام جملة WHERE، يمكنك تحديد صفوف معينة بناءً على قيمها. مثال لاستعلام SQL:

    "اختر * من حديقة الحيوان -" هذا هو "الاستعلام الأساسي"
    أين - يخبر SQL أنك تريد تصفية شيء ما.
    "الحيوان = "الفيل" -" الحيوان هو اسم العمود الذي نبحث فيه القيمة المطلوبة، والفيل هو المعنى نفسه. في SQL نحتاج دائمًا إلى إضافة عمود نبحث فيه عن القيمة المطلوبة.
    ; – “لا تنسى الفاصلة المنقوطة!

    الاختبار الذاتي رقم 1

    هذه مقالة تمهيدية، وبالتالي فإن المهمة الأولى ستكون أيضًا بسيطة جدًا:

    يختار اول ثلاثةالحمير الوحشية ( الحمار الوحشي) من حديقة الحيوان الجدول .

    إذا كنت تريد أن تصبح عالم بيانات، فلا يمكنك الاستغناء عن SQL. يمكن استخدام هذه اللغة ليس فقط من قبل المحللين أو العلماء، ولكن أيضًا من قبل أي شخص يمكنه قضاء بضعة أيام في دراسة استعلامات SQL:

    SQL لتحليل البيانات؟ ما هذا؟ ما الفائدة من ذلك؟

    SQL تعني لغة الاستعلام الهيكلية، والتي تُترجم إلى " لغة الاستعلام الهيكلية».

    لكني أحب وصفًا آخر: إنه Excel المنشط. إليك ما تبدو عليه مجموعة البيانات نفسها في Excel وSQL:

    كما نرى، SQL وExcel متشابهان تمامًا. يقدم كلاهما البيانات كجدول ثنائي الأبعاد يحتوي على أعمدة وصفوف. كلاهما منظم للغاية وسهل الفهم.

    ولكن هناك عدد من الاختلافات بينهما:

    1. الأول هو أداء. يعمل برنامج Excel بشكل رائع مع كميات صغيرة من البيانات، ولكن عندما يكون لديك 100000 صف، يصبح استخدام الصيغ تمرينًا مستهلكًا للوقت وغير فعال.
    2. والثاني هو طريقة التفاعل مع قاعدة البيانات. يعد Excel في المقام الأول واجهة مستخدم رسومية ( واجهة المستخدم الرسومية). فهو يسمح لك بتمرير الجدول وإدخال الصيغ واستخدام المؤشر لتحريك المنطقة المطلوبة. لا يحتوي SQL على واجهة مستخدم رسومية - فهو يستخدم ما يسمى باستعلامات SQL.

    عندما تتقن استعلامات SQL للمبتدئينستدرك أن العمل به أكثر شفافية وكفاءة من استخدام Excel. بالإضافة إلى ذلك، في SQL، يكون الأمر أكثر ملاءمة لأتمتة عملك واستخدام التطورات السابقة.

    في تحليل البيانات، ستستخدم SQL لمهام بسيطة إلى حد ما: التلخيص، والجمع بين مجموعات البيانات، والأساليب الإحصائية والرياضية البسيطة. ولكن مع SQL، سيصبح عملك أكثر كفاءة وستتمكن من استخدام مجموعات بيانات أكبر من ذي قبل.

    ماذا عن Python أو R أو bash؟

    عندما تبدأ في استخدام هذه اللغات لتحليل البيانات، ستدرك أن Python وR جيدان لشيء واحد، وSQL لشيء آخر. والفرق الرئيسي بين هذه اللغات هو في بناء الجملة، " المهام"والإنتاجية. حسنًا، لننتقل الآن إلى الجزء العملي!

    الخطوة 0 – تثبيت نظام إدارة قواعد بيانات SQL

    سأستخدم PostgreSQL. هناك أنواع أخرى من SQL DBMS. لكنها كلها متشابهة، لذلك إذا تعلمت postgreSQL، فإن التكيف مع لغة أخرى لن يستغرق سوى بضع ساعات (أو حتى دقائق).

    في هذه المرحلة يجب أن يكون لديك ثلاثة أشياء:

    1. خادم البيانات مع إمكانية الوصول عبر المحطة الطرفية أو iTerm؛
    2. PostgreSQL مثبت على الخادم الخاص بك؛
    3. Pgadmin4 مثبت على جهاز الكمبيوتر الخاص بك ( أو منضدة SQL).

    ملاحظة: سأستخدم SQL Workbench كأداة SQL الخاصة بي.

    الخطوة 1 – قم بتسجيل الدخول إلى قاعدة بيانات SQL الخاصة بك عبر موجه الأوامر

    تحتاج أولاً إلى الوصول إلى قاعدة البيانات من سطر الأوامر. سأوضح لك كيفية القيام بذلك، وفي المستقبل سوف تحتاج إلى القيام بنفس الشيء:

    1. فتح المحطة ( أو iTerm):
    2. الاتصال بالخادم عبر SSH.

    في حالتي أدخل:

    سش تومي@[my_ip_address]

    1. من خلال تسجيل الدخول إلى الخادم، يمكنني الوصول إلى قاعدة بيانات postgreSQL. وبما أنني قد سمحت بالفعل بالوصول إلى المستخدم الخاص بي، فأنا أدخل الأمر التالي:
    psql -U tomi -d postgres

    psql هو الأمر نفسه، -U يشير إلى اسم المستخدم ( في حالتي هو "تومي")، و -d يحدد اسم قاعدة البيانات ( في حالتي postgres، مثل حالتك). يجب أن يتغير موجه الأوامر إلى ما يلي:

    بوستجرس=>

    مستعد! لديك الآن حق الوصول الكامل إلى قاعدة بيانات SQL .

    1. للتحقق من استعلام SQL يمكنك إدخال:
    dt


    ستظهر قائمة بجميع جداول البيانات على الشاشة. حتى الآن هناك واحد فقط. لكن هذا سيتغير قريباً:

    ملحوظة: تسمى قواعد بيانات SQL أيضًا " قواعد البيانات العلائقية ».

    الخطوة 2 - تحميل البيانات

    في هذا القسم، سنعمل مع مجموعة بيانات صغيرة تسمى حديقة الحيوان(" حديقة حيوان"). يمكنك تنزيله من هنا بتنسيق نص .tsv.

    ولكن دعونا نواصل مع مثال استعلام SQL:

    1) إنشاء جدول:

    إنشاء جدول حديقة الحيوان (animal varchar (10)، uniq_id integer PRIMARY KEY، water_need integer)؛

    2) تأكد من إنشاء الجدول بالتأكيد:

    لدينا جدول بيانات جديد: حديقة الحيوان!

    3) تحميل البيانات!

    انسخ الطلب:

    أدخل في حديقة الحيوان (animal,uniq_id,water_need) القيم ("فيل"،1001,500)، ("فيل"،1002,600)، ("فيل"،1003,550)، ("نمر"،1004,300) , ("النمر"،1005,320)، ("النمر"،1006,330)، ("النمر"،1007,290)، ("النمر"،1008,310)، ("الحمار الوحشي"، 1009,200) ، ("حمار وحشي"،1010،220)، ("حمار وحشي"،1011،240)، ("حمار وحشي"،1012،230)، ("حمار وحشي"،1013،220)، ("حمار وحشي"،1014،100) ، ("حمار وحشي"،1015،80)، ("أسد"،1016،420)، ("أسد"،1017،600)، ("أسد"،1018،500)، ("أسد"،1019،390) ، ("الكنغر"،1020،410)، ("الكنغر"،1021،430)، ("الكنغر"،1022،410)؛

    إذا سارت الأمور على ما يرام، ستتلقى الرسالة التالية:

    أدخل 0 22

    أهم عبارة SQL: SELECT

    حان الوقت لدراسة المشغل الرئيسي لغة الاستعلام SQL. هنا هو:

    اختر * من اسم الجدول؛

    سنستخدم SELECT في كل مرة نحتاج فيها إلى قراءة البيانات وتصفيتها وتحويلها وتلخيصها. في البداية، دعونا نختار ( تتم ترجمة الكلمة الإنجليزية "select" تمامًا إلى "choose") كل ما هو موجود في جدول حديقة الحيوان.

    اختر * من حديقة الحيوان؛

    أعاد عامل الهاتف لي الجدول بأكمله.

    اختر * من حديقة الحيوان؛

    SELECT هو البيان الأساسي الذي يخبر SQL أننا نريد قراءة البيانات من الجدول.
    * - يشير إلى أننا نريد تحديد كافة الأعمدة.
    يخبر FROM SQL بأننا سنقوم بتحديد جدول لقراءة البيانات منه.
    حديقة الحيوان هو اسم الجدول. يمكن استبداله بأي شيء آخر إذا كان لديك عدة جداول.
    ; هذا هو بناء الجملة المطلوب من قبل SQL. يجب أن ينتهي كل استعلام بفاصلة منقوطة. إذا قمت بتخطيه عن طريق الخطأ، فسوف ينتظر SQL حتى يستمر الاستعلام ولن يعرض أي شيء.

    سوف نستخدم التعبير الذي تمت مناقشته أعلاه بانتظام عند العمل مع استعلامات SQL المعقدة.

    اختيار الأعمدة

    يمكن استبدال العلامة * بأسماء الأعمدة. خذ بعين الاعتبار الاستعلام التالي كمثال:

    حدد الحيوان الذي يحتاج إلى الماء من حديقة الحيوان؛

    لقد حصلنا على ما توقعناه بالضبط: هناك عمودان "animal" و"water_need" على الشاشة، ولكن لم يعد "uniq_id".

    بنفس الطريقة، يمكنك تحديد أي أعمدة؛ ما عليك سوى تحديد أسمائها، مفصولة بفاصلة. يمكنك أيضًا القيام بشيء مثل هذا:

    حدد الحيوان، الحيوان، الحيوان من حديقة الحيوان؛

    سيتم تكرار نفس العمود عدة مرات... ولكن بما أن هذا لا معنى له، فلا يستحق القيام بذلك.

    عرض الصفوف القليلة الأولى من البيانات - تعليمات محدودة

    نعمل حاليًا على جدول بيانات يتكون من 22 صفًا. لقصر التحديد على الصفوف القليلة الأولى، سنستخدم تعليمات LIMIT - علامة صغيرة " توسع» للاستعلام الأساسي:

    اختر * من حديقة الحيوان LIMIT 10؛

    سيتم عرض الأسطر العشرة الأولى فقط على الشاشة.

    تصفية الصفوف - بيان أين

    باستخدام جملة WHERE، يمكنك تحديد صفوف معينة بناءً على قيمها. مثال لاستعلام SQL:

    اختر * من حديقة الحيوان حيث الحيوان = "الفيل"؛

    اختر * من حديقة الحيوان – "هذا" الطلب الأساسي»
    أين - يخبر SQL أنك تريد تصفية شيء ما.
    الحيوان = "الفيل" –» الحيوان هو اسم العمود الذي نبحث فيه عن القيمة المطلوبة، والفيل هو القيمة نفسها. في SQL نحتاج دائمًا إلى إضافة عمود نبحث فيه عن القيمة المطلوبة.
    ; – “لا تنسى الفاصلة المنقوطة!

    الاختبار الذاتي رقم 1

    هذه مقالة تمهيدية، وبالتالي فإن المهمة الأولى ستكون أيضًا بسيطة جدًا:

    حدد الحمير الوحشية الثلاثة الأولى ( الحمار الوحشي) من حديقة الحيوان الجدول .

    في الواقع، سيكون حل هذه المشكلة نتيجة مقال اليوم.

    مستعد؟

    هذا هو الحل الخاص بي:

    اختر * من حديقة الحيوان حيث الحيوان = "حمار وحشي" الحد 3؛

    موافق، SQL سهل .

    وشيء آخر: النحو...

    1. يجب أن تنتهي جميع استعلامات SQL بفاصلة منقوطة (;). إذا قمت بتخطيه عن طريق الخطأ، فسوف تفترض SQL أن الاستعلام لم ينته بعد ولن يتم عرض أي شيء على الشاشة. على سبيل المثال:
    postgres=> SELECT * من حديقة الحيوان postgres->

    بطريقة ما ليس جدًا... سيكون الأمر أفضل هكذا:

    Postgres=> SELECT * من حديقة الحيوان؛

    1. SQL ليست حساسة لحالة الأحرف عندما يتعلق الأمر بالكلمات الرئيسية ( حدد وأين والحد وما إلى ذلك..). على سبيل المثال:
    اختر * من حديقة الحيوان؛

    يعمل نفس

    اختر * من حديقة الحيوان؛

    تعتمد حساسية حالة أسماء الجداول وأسماء الأعمدة وقيمها على الإعدادات. في حالنا ( في باستخدام PostgreSQL ) أسماء الجداول والأعمدة ليست حساسة لحالة الأحرف، على عكس قيم الحقول. على سبيل المثال:

    اختر * من حديقة الحيوان حيث الحيوان = "الفيل"؛ -" اختيار الأعمال * من حديقة الحيوان حيث الحيوان = 'الفيل'؛ –» الأعمال اختر * من حديقة الحيوان حيث الحيوان = "الفيل"؛ -" لا يعمل

    لاحظ أن معظم الأشخاص يكتبون بلغة استعلام SQL الكلمات الدالة بالحروف الكبيرة (اختر، أين، الحد، الخ... )، مما يزيد من إمكانية قراءة التعليمات البرمجية.

    خاتمة

    لقد اتخذنا الخطوة الأولى نحو باستخدام SQLلتحليل البيانات! تهانينا! الآن يمكنك كتابة الاستعلامات الأساسية. ولكن هذا هو مجرد بداية!

    ترجمة المقال " SQL لتحليل البيانات – برنامج تعليمي للمبتدئين – الحلقة 1تم إعداده من قبل الفريق الودود لمشروع بناء الموقع من الألف إلى الياء.