معادلة الانحدار المتعدد في Excel. الحل باستخدام معالج جداول البيانات Excel

16.05.2019

يمكن أيضًا إجراء معالجة البيانات الإحصائية باستخدام وظيفة إضافية حزمة التحليل(الشكل 62).

من العناصر المقترحة اختر العنصر " تراجع" وانقر عليها بزر الفأرة الأيسر. بعد ذلك، انقر فوق موافق.

ستظهر نافذة كما هو موضح في الشكل. 63.

أداة التحليل " تراجع» يستخدم لملاءمة الرسم البياني مع مجموعة من الملاحظات باستخدام طريقة المربعات الصغرى. يستخدم الانحدار لتحليل التأثير على متغير تابع واحد لقيم واحد أو أكثر من المتغيرات المستقلة. على سبيل المثال، هناك عدة عوامل تؤثر على الأداء الرياضي للرياضي، بما في ذلك العمر والطول والوزن. ومن الممكن حساب الدرجة التي يؤثر بها كل من هذه العوامل الثلاثة على أداء الرياضي، ثم استخدام تلك البيانات للتنبؤ بأداء رياضي آخر.

تستخدم أداة الانحدار الدالة لاينست.

مربع الحوار الانحدار

التسميات حدد خانة الاختيار إذا كان الصف الأول أو العمود الأول من نطاق الإدخال يحتوي على عناوين. قم بإلغاء تحديد خانة الاختيار هذه في حالة عدم وجود رؤوس. في هذه الحالة، سيتم إنشاء رؤوس مناسبة لبيانات جدول الإخراج تلقائيًا.

مستوى الموثوقية حدد خانة الاختيار لتضمين مستوى إضافي في جدول ملخص المخرجات. في الحقل المناسب، أدخل مستوى الثقة الذي تريد تطبيقه، بالإضافة إلى مستوى 95% الافتراضي.

ثابت - صفر حدد خانة الاختيار لإجبار خط الانحدار على المرور عبر نقطة الأصل.

نطاق الإخراج أدخل المرجع إلى الخلية العلوية اليسرى لنطاق الإخراج. قم بتوفير سبعة أعمدة على الأقل لجدول ملخص المخرجات، والذي سيتضمن: نتائج ANOVA، والمعاملات، والخطأ المعياري لحساب Y، والانحرافات المعيارية، وعدد الملاحظات، والأخطاء القياسية للمعاملات.

ورقة عمل جديدة حدد هذا الخيار لفتح ورقة عمل جديدة في المصنف ولصق نتائج التحليل، بدءًا من الخلية A1. إذا لزم الأمر، أدخل اسمًا للورقة الجديدة في الحقل الموجود مقابل زر الاختيار المقابل.

مصنف جديد حدد هذا الخيار لإنشاء مصنف جديد مع إضافة النتائج إلى ورقة عمل جديدة.

المتبقيات حدد خانة الاختيار لتضمين المتبقيات في جدول الإخراج.

المخلفات القياسية حدد خانة الاختيار لتضمين المخلفات القياسية في جدول الإخراج.

المخطط المتبقي حدد خانة الاختيار لرسم المتبقي لكل متغير مستقل.

Fit Plot حدد خانة الاختيار لرسم القيم المتوقعة مقابل القيم المرصودة.

مؤامرة الاحتمالية العاديةحدد خانة الاختيار لرسم رسم بياني احتمالي عادي.

وظيفة لاينست

لإجراء العمليات الحسابية، حدد بالمؤشر الخلية التي نريد عرض القيمة المتوسطة فيها واضغط على المفتاح = على لوحة المفاتيح. بعد ذلك، في حقل الاسم، حدد الوظيفة المطلوبة، على سبيل المثال متوسط(الشكل 22).

وظيفة لاينستحساب إحصائيات سلسلة باستخدام طريقة المربعات الصغرى لحساب الخط المستقيم الذي يقارب البيانات المتاحة بشكل أفضل ثم إرجاع صفيف يصف الخط المستقيم الناتج. يمكنك أيضًا الجمع بين الوظيفة لاينستمع وظائف أخرى لحساب أنواع أخرى من النماذج الخطية في معلمات غير معروفة (التي تكون معلماتها غير المعروفة خطية)، بما في ذلك متسلسلة متعددة الحدود، واللوغاريتمية، والأسية، ومتسلسلات القوى. نظرًا لإرجاع مصفوفة من القيم، يجب تحديد الدالة كصيغة مصفوفة.

معادلة الخط المستقيم هي:

y=m 1 x 1 +m 2 x 2 +…+b (في حالة وجود عدة نطاقات من قيم x)،

حيث القيمة التابعة y هي دالة للقيمة المستقلة x، وقيم m هي المعاملات المقابلة لكل متغير مستقل x، وb ثابت. لاحظ أن y وx وm يمكن أن تكون متجهات. وظيفة لاينستإرجاع المصفوفة (mn;mn-1;…;m 1 ;b). لاينستقد يُرجع أيضًا إحصائيات الانحدار الإضافية.

لاينست(known_values_y;known_values_x;const;الإحصائيات)

Known_y_values ​​​​- مجموعة من قيم y المعروفة بالفعل بالعلاقة y=mx+b.

إذا كانت صفيفknown_y_values ​​​​يحتوي على عمود واحد، فسيتم التعامل مع كل عمود في صفيفknown_x_values ​​​​كمتغير منفصل.

إذا كانت صفيفknown_y_values ​​​​يحتوي على صف واحد، فسيتم التعامل مع كل صف في صفيفknown_x_values ​​​​كمتغير منفصل.

قيم Known_x هي مجموعة اختيارية من قيم X المعروفة بالفعل بالعلاقة y=mx+b.

يمكن أن تحتوي المصفوفةknown_x_values ​​​​على مجموعة واحدة أو أكثر من المتغيرات. إذا تم استخدام متغير واحد فقط، فيمكن أن يكون لمصفوفاتknown_y_values ​​​​وknown_x_values ​​​​أي شكل - طالما أن لها نفس البعد. إذا تم استخدام أكثر من متغير واحد، فيجب أن تكون القيم المعروفة y_values ​​​​متجهًا (أي فاصل زمني بارتفاع صف واحد أو عرض عمود واحد).

إذا تم حذف array_known_x_values ​​​​، فمن المفترض أن يكون المصفوفة (1;2;3;...) بنفس حجم array_known_values_y.

Const هي قيمة منطقية تحدد ما إذا كان الثابت b مطلوبًا أن يساوي 0.

إذا كانت الوسيطة "const" TRUE أو تم حذفها، فسيتم تقييم الثابت b كالمعتاد.

إذا كانت الوسيطة "const" خاطئة، فسيتم تعيين قيمة b على 0 ويتم تحديد قيم m بحيث يتم استيفاء العلاقة y=mx.

الإحصائيات - قيمة منطقية تحدد ما إذا كان يجب إرجاع إحصائيات الانحدار الإضافية.

إذا كانت الإحصائيات TRUE، فستُرجع الدالة LINEST إحصائيات انحدار إضافية. ستبدو المصفوفة التي تم إرجاعها بالشكل التالي: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

إذا كانت الإحصائيات FALSE أو تم حذفها، فستُرجع الدالة LINEST المعاملات m والثابت b فقط.

إحصائيات الانحدار الإضافية (الجدول 17)

ضخامة وصف
se1، se2،...، سين قيم الخطأ القياسية للمعاملات m1,m2,...,mn.
seb قيمة الخطأ القياسية للثابت b (seb = #N/A إذا كانت قيمة const FALSE).
ص2 معامل الحتمية. تتم مقارنة القيم الفعلية لـ y والقيم التي تم الحصول عليها من معادلة الخط؛ وبناء على نتائج المقارنة يتم حساب معامل الحتمية وتطبيعه من 0 إلى 1. فإذا كان يساوي 1 فإن هناك ارتباط كامل مع النموذج، أي لا يوجد فرق بين القيم الفعلية والمقدرة ذ. وفي الحالة المعاكسة، إذا كان معامل التحديد 0، فلا فائدة من استخدام معادلة الانحدار للتنبؤ بقيم y. لمزيد من المعلومات حول كيفية حساب r2، راجع "الملاحظات" في نهاية هذا القسم.
سيي الخطأ القياسي لتقدير y.
F F-القيمة الإحصائية أو F-المرصودة. يتم استخدام إحصائية F لتحديد ما إذا كانت العلاقة المرصودة بين متغير تابع ومتغير مستقل ناتجة عن الصدفة.
df درجات الحرية. درجات الحرية مفيدة للعثور على قيم F الحرجة في جدول إحصائي. لتحديد مستوى الثقة في النموذج، يمكنك مقارنة القيم الموجودة في الجدول بإحصائيات F التي يتم إرجاعها بواسطة الدالة LINEST. لمزيد من المعلومات حول حساب df، راجع "الملاحظات" في نهاية هذا القسم. بعد ذلك، يوضح المثال 4 استخدام قيم F وdf.
com.ssreg مجموع الانحدار من المربعات.
com.ssresid مجموع المربعات المتبقية. لمزيد من المعلومات حول حساب ssreg وssresid، راجع "الملاحظات" في نهاية هذا القسم.

يوضح الشكل أدناه الترتيب الذي يتم به إرجاع إحصائيات الانحدار الإضافية (الشكل 64).

ملحوظات:

يمكن وصف أي خط مستقيم بميله وتقاطعه مع المحور الصادي:

المنحدر (م): لتحديد ميل الخط، والذي يُشار إليه عادةً بالرمز m، عليك أن تأخذ نقطتين على الخط (x 1 ,y 1) و (x 2 ,y 2)؛ سيكون الميل مساويًا لـ (y 2 -y 1)/(x 2 -x 1).

التقاطع y (b): التقاطع y للخط، يُشار إليه عادةً بالرمز b، هو قيمة y للنقطة التي يتقاطع عندها الخط مع المحور y.

معادلة الخط المستقيم هي y=mx+b. إذا كانت قيمتي m وb معروفة، فيمكن حساب أي نقطة على الخط عن طريق استبدال قيم y أو x في المعادلة. يمكنك أيضًا استخدام الدالة TREND.

إذا كان هناك متغير مستقل واحد فقط x، فيمكنك الحصول على الميل وتقاطع y مباشرة باستخدام الصيغ التالية:

المنحدر: INDEX(LINEST(known_y_values;known_x_values); 1)

تقاطع Y: INDEX(LINEST(known_y_values;known_x_values); 2)

تعتمد دقة التقريب باستخدام الخط المستقيم المحسوب بواسطة الدالة LINEST على درجة تشتت البيانات. كلما كانت البيانات أقرب إلى الخط المستقيم، كلما كان النموذج المستخدم بواسطة الدالة LINEST أكثر دقة. تستخدم الدالة LINEST المربعات الصغرى لتحديد أفضل ملاءمة للبيانات. عندما يكون هناك متغير مستقل واحد فقط x، يتم حساب m وb باستخدام الصيغ التالية:

حيث x وy عبارة عن متوسطين نموذجيين، على سبيل المثال x = AVERAGE(known_x's) وy = AVERAGE(known_y's).

يمكن لوظائف التركيب LINEST وLGRFPRIBL حساب الخط المستقيم أو المنحنى الأسي الذي يناسب البيانات بشكل أفضل. ومع ذلك، فإنهم لا يجيبون على سؤال أي من النتيجتين أكثر ملاءمة لحل المشكلة. يمكنك أيضًا تقييم الدالة TREND(known_y's;known_x's) لخط مستقيم أو الدالة GROW(known_y's;known_x's) لمنحنى أسي. تقوم هذه الوظائف، ما لم يتم تحديد قيم_x جديدة، بإرجاع مصفوفة من قيم y المحسوبة لقيم x الفعلية على طول الخط أو المنحنى. ويمكنك بعد ذلك مقارنة القيم المحسوبة بالقيم الفعلية. يمكنك أيضًا إنشاء مخططات للمقارنة المرئية.

عند إجراء تحليل الانحدار، يقوم Microsoft Excel بحساب مربع الفرق بين قيمة y المتوقعة وقيمة y الفعلية لكل نقطة. يُطلق على مجموع هذه الاختلافات المربعة اسم مجموع المربعات المتبقية (ssresid). يقوم Microsoft Excel بعد ذلك بحساب المجموع الإجمالي للمربعات (sstotal). إذا لم يتم تحديد const = TRUE أو لم يتم تحديد قيمة هذه الوسيطة، فسيكون مجموع المربعات الإجمالي مساويًا لمجموع مربعات الاختلافات بين قيم y الفعلية ومتوسط ​​قيم y. عندما تكون const = FALSE، سيكون مجموع المربعات الإجمالي مساويًا لمجموع مربعات قيم y الحقيقية (دون طرح متوسط ​​قيمة y من قيمة y الجزئية). يمكن بعد ذلك حساب مجموع انحدار المربعات على النحو التالي: ssreg = sstotal - ssresid. كلما كان مجموع المربعات المتبقية أصغر، زادت قيمة معامل التحديد r2، مما يوضح مدى جودة المعادلة التي تم الحصول عليها باستخدام تحليل الانحدار في تفسير العلاقات بين المتغيرات. المعامل r2 يساوي ssreg/sstotal.

في بعض الحالات، لا يحتوي عمود X واحد أو أكثر (دع قيم Y وX في أعمدة) على قيمة مسندية إضافية في أعمدة X الأخرى، وبعبارة أخرى، قد تؤدي إزالة عمود X واحد أو أكثر إلى حساب قيم Y بنفس الدقة. في هذه الحالة، سيتم استبعاد أعمدة X الزائدة من نموذج الانحدار. تسمى هذه الظاهرة "العلاقة الخطية المتداخلة" لأنه يمكن تمثيل الأعمدة الزائدة لـ X كمجموع عدة أعمدة غير زائدة عن الحاجة. تتحقق الدالة LINEST من العلاقة الخطية المتداخلة وتزيل أي أعمدة X زائدة عن الحاجة من نموذج الانحدار إذا اكتشفتها. يمكن تحديد أعمدة X التي تمت إزالتها في مخرجات LINEST بعامل 0 وقيمة se بقيمة 0. تؤدي إزالة عمود واحد أو أكثر كتكرار إلى تغيير قيمة df لأنها تعتمد على عدد أعمدة X المستخدمة فعليًا لأغراض تنبؤية. لمزيد من المعلومات حول حساب df، راجع المثال 4 أدناه. عندما يتغير df بسبب إزالة الأعمدة الزائدة، تتغير قيم sey وF أيضًا. لا ينصح باستخدام العلاقة الخطية المتداخلة في كثير من الأحيان. ومع ذلك، ينبغي استخدامه إذا كانت بعض أعمدة X تحتوي على 0 أو 1 كمؤشر يشير إلى ما إذا كان موضوع التجربة ينتمي إلى مجموعة منفصلة. إذا لم يتم تحديد const = TRUE أو لم يتم تحديد قيمة لهذه الوسيطة، فستقوم الدالة LINEST بإدراج عمود X إضافي لتكوين نموذج لنقطة التقاطع. إذا كان هناك عمود بقيم 1 للرجال و0 للنساء، وكان هناك عمود بقيم 1 للنساء و0 للرجال، فسيتم إزالة العمود الأخير لأنه يمكن الحصول على قيمه من عمود "مؤشر الذكور".

يتم حساب df للحالات التي لا تتم فيها إزالة أعمدة X من النموذج بسبب العلاقة الخطية المتداخلة كما يلي: إذا كان هناك أعمدة kknown_x وكانت القيمة const = TRUE أو غير محددة، فحينئذٍ df = n – k – 1. إذا const = خطأ، ثم df = n - k. في كلتا الحالتين، تؤدي إزالة الأعمدة X بسبب العلاقة الخطية المتداخلة إلى زيادة قيمة df بمقدار 1.

يجب إدخال الصيغ التي ترجع الصفائف كصيغ صفائف.

عند إدخال مصفوفة من الثوابت كوسيطة، على سبيل المثال،known_x_values، يجب عليك استخدام فاصلة منقوطة للفصل بين القيم الموجودة على نفس السطر ونقطتين للفصل بين الأسطر. قد تختلف الأحرف الفاصلة وفقًا للإعدادات الموجودة في نافذة اللغة والإعدادات في لوحة التحكم.

تجدر الإشارة إلى أن قيم y التي تنبأت بها معادلة الانحدار قد لا تكون صحيحة إذا كانت تقع خارج نطاق قيم y التي تم استخدامها لتحديد المعادلة.

الخوارزمية الأساسية المستخدمة في الوظيفة لاينست، يختلف عن خوارزمية الوظيفة الرئيسية يميلو القطعة المستقيمة. يمكن أن يؤدي الاختلاف بين الخوارزميات إلى نتائج مختلفة مع بيانات غير مؤكدة وخطية متداخلة. على سبيل المثال، إذا كانت نقاط بيانات وسيطةknown_y_values ​​​​تساوي 0 ونقاط بيانات وسيطةknown_x_values ​​​​تساوي 1، فحينئذٍ:

وظيفة لاينستتُرجع قيمة تساوي 0. خوارزمية الدالة لاينستيتم استخدامه لإرجاع قيم مناسبة للبيانات الخطية المتداخلة، وفي هذه الحالة يمكن العثور على إجابة واحدة على الأقل.

تقوم الدالتان SLOPE وLINE بإرجاع الخطأ #DIV/0! يتم استخدام خوارزمية الدالتين SLOPE و INTERCEPT للعثور على إجابة واحدة فقط، ولكن في هذه الحالة قد يكون هناك عدة إجابة.

بالإضافة إلى حساب الإحصائيات لأنواع أخرى من الانحدار، يمكن استخدام LINEST لحساب نطاقات لأنواع أخرى من الانحدار عن طريق إدخال وظائف متغيرات x وy كسلسلة من متغيرات x وy لـ LINEST. على سبيل المثال، الصيغة التالية:

LINEST(y_values, x_values^COLUMN($A:$C))

يعمل من خلال وجود عمود واحد من قيم Y وعمود واحد من قيم X لحساب تقريب مكعب (متعدد الحدود من الدرجة الثالثة) بالشكل التالي:

ص=م 1 س+م 2 × 2 +م 3 × 3 +ب

يمكن تعديل الصيغة لحساب أنواع أخرى من الانحدار، ولكن في بعض الحالات قد تحتاج قيم المخرجات والإحصائيات الأخرى إلى التعديل.

في المنشورات السابقة، ركز التحليل غالبًا على متغير رقمي واحد، مثل عوائد صناديق الاستثمار المشتركة، أو أوقات تحميل صفحة الويب، أو استهلاك المشروبات الغازية. في هذه الملاحظات والملاحظات اللاحقة، سنتناول طرق التنبؤ بقيم متغير رقمي اعتمادًا على قيم واحد أو أكثر من المتغيرات الرقمية الأخرى.

سيتم توضيح المادة بمثال شامل. التنبؤ بحجم المبيعات في متجر لبيع الملابس.تتوسع سلسلة متاجر الملابس المخفضة Sunflowers باستمرار منذ 25 عامًا. ومع ذلك، فإن الشركة حاليًا ليس لديها نهج منظم لاختيار منافذ البيع الجديدة. يتم تحديد الموقع الذي تنوي الشركة افتتاح متجر جديد فيه بناءً على اعتبارات ذاتية. معايير الاختيار هي شروط الإيجار المواتية أو فكرة المدير عن موقع المتجر المثالي. تخيل أنك رئيس قسم المشاريع الخاصة والتخطيط. لقد تم تكليفك بوضع خطة استراتيجية لفتح متاجر جديدة. يجب أن تتضمن هذه الخطة توقعات المبيعات السنوية للمتاجر المفتوحة حديثًا. أنت تعتقد أن مساحة البيع بالتجزئة ترتبط ارتباطًا مباشرًا بالإيرادات وتريد أن تأخذ ذلك في الاعتبار في عملية اتخاذ القرار. كيف يمكنك تطوير نموذج إحصائي للتنبؤ بالمبيعات السنوية بناءً على حجم المتجر الجديد؟

عادة، يتم استخدام تحليل الانحدار للتنبؤ بقيم المتغير. هدفها هو تطوير نموذج إحصائي يمكنه التنبؤ بقيم المتغير التابع، أو الاستجابة، من قيم متغير مستقل، أو توضيحي واحد على الأقل. في هذه المذكرة، سنلقي نظرة على الانحدار الخطي البسيط - وهي طريقة إحصائية تسمح لك بالتنبؤ بقيم المتغير التابع يبقيم المتغير المستقل X. سوف تصف الملاحظات اللاحقة نموذج الانحدار المتعدد المصمم للتنبؤ بقيم المتغير المستقل يبناءً على قيم عدة متغيرات تابعة ( × 1، × 2، …، × ك).

قم بتنزيل المذكرة بالتنسيق أو بالأمثلة بالتنسيق

أنواع نماذج الانحدار

أين ρ 1 - معامل الارتباط الذاتي؛ لو ρ 1 = 0 (لا يوجد ارتباط تلقائي)، د≈ 2؛ لو ρ 1 ≈ 1 (ارتباط تلقائي إيجابي)، د≈ 0; لو ρ 1 = -1 (الارتباط الذاتي السلبي)، د ≈ 4.

ومن الناحية العملية، يعتمد تطبيق معيار دوربين-واتسون على مقارنة القيمة دمع القيم النظرية الحرجة ديسيلترو د شلعدد معين من الملاحظات نعدد المتغيرات المستقلة للنموذج ك(للانحدار الخطي البسيط ك= 1) ومستوى الأهمية α. لو د< d L تم رفض الفرضية الخاصة باستقلال الانحرافات العشوائية (وبالتالي يوجد ارتباط ذاتي إيجابي)؛ لو د> دو، لم يتم رفض الفرضية (أي أنه لا يوجد ارتباط ذاتي)؛ لو ديسيلتر< D < d U ، لا توجد أسباب كافية لاتخاذ القرار. عندما القيمة المحسوبة ديتجاوز 2، ثم مع ديسيلترو د شوليس المعامل نفسه هو الذي تتم مقارنته دوالتعبير (4 - د).

لحساب إحصائيات Durbin-Watson في Excel، دعنا ننتقل إلى الجدول السفلي في الشكل. 14 سحب الرصيد. يتم حساب البسط في التعبير (10) باستخدام الدالة =SUMMAR(array1;array2) والمقام =SUMMAR(array) (الشكل 16).

أرز. 16. صيغ لحساب إحصائيات دوربين واتسون

في مثالنا د= 0.883. والسؤال الرئيسي هو: ما هي قيمة إحصائية دوربين-واتسون التي ينبغي اعتبارها صغيرة بما يكفي لاستنتاج وجود ارتباط ذاتي إيجابي؟ من الضروري ربط قيمة D بالقيم الحرجة ( ديسيلترو د ش)، اعتمادا على عدد الملاحظات نومستوى الأهمية α (الشكل 17).

أرز. 17. القيم الحرجة لإحصائيات دوربين واتسون (جزء من الجدول)

وبالتالي، في مشكلة حجم المبيعات في متجر يقوم بتوصيل البضائع إلى المنزل، يوجد متغير مستقل واحد ( ك= 1)، 15 ملاحظة ( ن= 15) ومستوى الأهمية α = 0.05. لذلك، ديسيلتر= 1.08 و دش= 1.36. بسبب ال د = 0,883 < ديسيلتر= 1.08، يوجد ارتباط ذاتي موجب بين القيم المتبقية، ولا يمكن استخدام طريقة المربعات الصغرى.

اختبار الفرضيات حول الميل ومعامل الارتباط

أعلاه، تم استخدام الانحدار فقط للتنبؤ. تحديد معاملات الانحدار والتنبؤ بقيمة المتغير يلقيمة متغيرة معينة Xتم استخدام طريقة المربعات الصغرى . بالإضافة إلى ذلك، قمنا بفحص جذر متوسط ​​مربع الخطأ للتقدير ومعامل الارتباط المختلط. إذا أكد تحليل البقايا عدم الإخلال بشروط تطبيق طريقة المربعات الصغرى، وأن نموذج الانحدار الخطي البسيط كافي، استنادا إلى بيانات العينة، فيمكن القول بوجود علاقة خطية بين المتغيرات في سكان.

طلبر -معايير المنحدر.ومن خلال اختبار ما إذا كان المنحدر السكاني β 1 يساوي صفرًا، يمكنك تحديد ما إذا كانت هناك علاقة ذات دلالة إحصائية بين المتغيرات Xو ي. وإذا تم رفض هذه الفرضية فيمكن القول بأنه بين المتغيرات Xو يهناك علاقة خطية. تمت صياغة الفرضيات الصفرية والبديلة على النحو التالي: H 0: β 1 = 0 (لا يوجد اعتماد خطي)، H1: β 1 ≠ 0 (يوجد اعتماد خطي). أ-بريوري ر- الإحصائية تساوي الفرق بين ميل العينة والقيمة الافتراضية لمنحدر السكان مقسومة على جذر متوسط ​​مربع الخطأ لتقدير الميل:

(11) ر = (ب 1 β 1 ) / س ب 1

أين ب 1 - ميل الانحدار المباشر على بيانات العينة، β1 - المنحدر الافتراضي للمجتمع المباشر، ، وإحصائيات الاختبار رلقد ر-التوزيع مع ن - 2درجات الحرية.

دعونا نتحقق مما إذا كانت هناك علاقة ذات دلالة إحصائية بين حجم المتجر والمبيعات السنوية عند α = 0.05. ر-يتم عرض المعيار مع المعلمات الأخرى عند استخدامه حزمة التحليل(خيار تراجع). تظهر النتائج الكاملة لحزمة التحليل في الشكل 1. 4، الجزء المتعلق بإحصائيات t - في الشكل. 18.

أرز. 18. نتائج التطبيق ر

منذ عدد المتاجر ن= 14 (انظر الشكل 3)، القيمة الحرجة ر-يمكن العثور على الإحصائيات عند مستوى دلالة α = 0.05 باستخدام الصيغة: ليرة تركية=STUDENT.ARV(0.025,12) = –2.1788، حيث 0.025 هو نصف مستوى الأهمية، و12 = ن – 2; تو=STUDENT.OBR(0.975,12) = +2.1788.

بسبب ال ر-الإحصائيات = 10.64> تو= 2.1788 (الشكل 19)، فرضية العدم ح 0مرفوض. على الجانب الآخر، ر-قيمة ل X= 10.6411، محسوبة بالصيغة =1-STUDENT.DIST(D3,12,TRUE)، تساوي تقريبًا الصفر، وبالتالي فإن الفرضية ح 0تم رفضه مرة أخرى. حقيقة ان ر-القيمة صفر تقريبًا تعني أنه إذا لم تكن هناك علاقة خطية حقيقية بين أحجام المتاجر والمبيعات السنوية، فسيكون من المستحيل تقريبًا اكتشافها باستخدام الانحدار الخطي. ولذلك توجد علاقة خطية ذات دلالة إحصائية بين متوسط ​​مبيعات المتجر السنوية وحجم المتجر.

أرز. 19. اختبار فرضية الميل السكاني عند مستوى دلالة 0.05 و12 درجة حرية

طلبF -معايير المنحدر.هناك طريقة بديلة لاختبار الفرضيات حول ميل الانحدار الخطي البسيط وهي الاستخدام F-معايير. دعونا نتذكر ذلك F-يستخدم الاختبار لاختبار العلاقة بين تباينين ​​(لمزيد من التفاصيل، راجع). عند اختبار فرضية الميل، يكون مقياس الأخطاء العشوائية هو تباين الخطأ (مجموع مربعات الأخطاء مقسومًا على عدد درجات الحرية)، لذلك F-يستخدم المعيار نسبة التباين الموضحة بالانحدار (أي القيمة إصلاحية القطاع الخاص، مقسوما على عدد المتغيرات المستقلة ك) ، إلى تباين الخطأ ( MSE = SYX 2 ).

أ-بريوري F-الإحصائيات تساوي متوسط ​​مربع الانحدار (MSR) مقسومًا على تباين الأخطاء (MSE): F = إم إس آر/ MSE، أين مسر=إصلاحية القطاع الخاص / ك، MSE =SSE/(ن– ك – 1)، ك- عدد المتغيرات المستقلة في نموذج الانحدار. إحصائيات الاختبار Fلقد F-التوزيع مع كو ن– ك – 1درجات الحرية.

بالنسبة لمستوى أهمية معين α، يتم صياغة قاعدة القرار على النحو التالي: إذا و>وش، تم رفض الفرضية الصفرية؛ وإلا فلا يتم رفضه. وتظهر النتائج، المعروضة في شكل جدول ملخص لتحليل التباين، في الشكل 1. 20.

أرز. 20. تحليل جدول التباين لاختبار الفرضية حول الأهمية الإحصائية لمعامل الانحدار

على نفس المنوال ر-معيار F- يتم عرض المعيار في الجدول عند استخدامه حزمة التحليل(خيار تراجع). النتائج الكاملة للعمل حزمة التحليلتظهر في الشكل. 4، جزء المتعلقة F– الإحصائيات – في الشكل. 21.

أرز. 21. نتائج التطبيق F-المعايير التي تم الحصول عليها باستخدام حزمة تحليل Excel

إحصائيات F هي 113.23 و ر- القيمة قريبة من الصفر (cell دلالةF). إذا كان مستوى الأهمية α هو 0.05، حدد القيمة الحرجة F-يمكن الحصول على التوزيعات بدرجة حرية واحدة و12 باستخدام الصيغة ف يو=F.OBR(1-0.05;1;12) = 4.7472 (الشكل 22). بسبب ال F = 113,23 > ف يو= 4.7472، و ر- القيمة قريبة من 0< 0,05, нулевая гипотеза ح 0مرفوض، أي. يرتبط حجم المتجر ارتباطًا وثيقًا بمبيعاته السنوية.

أرز. 22. اختبار فرضية المنحدر السكاني عند مستوى دلالة 0.05 وبدرجة حرية واحدة و12 درجة

فاصل الثقة الذي يحتوي على الميل β 1 .لاختبار فرضية وجود علاقة خطية بين المتغيرات، يمكنك إنشاء فاصل ثقة يحتوي على الميل β 1 والتحقق من أن القيمة الافتراضية β 1 = 0 تنتمي إلى هذا الفاصل. مركز فترة الثقة التي تحتوي على الميل β 1 هو ميل العينة ب 1 ، وحدودها هي الكميات ب 1 ±تينيسي –2 س ب 1

كما يظهر في الشكل. 18, ب 1 = +1,670, ن = 14, س ب 1 = 0,157. ر 12 =STUDENT.ARV(0.975,12) = 2.1788. لذلك، ب 1 ±تينيسي –2 س ب 1 = +1.670 ± 2.1788 * 0.157 = +1.670 ± 0.342، أو + 1.328 ≥ β 1 ≥ +2.012. وبالتالي، هناك احتمال قدره 0.95 أن يقع المنحدر السكاني بين +1.328 و+2.012 (أي 1,328,000 دولار إلى 2,012,000 دولار). وبما أن هذه القيم أكبر من الصفر، فإن هناك علاقة خطية ذات دلالة إحصائية بين المبيعات السنوية ومساحة المتجر. إذا كانت فترة الثقة تحتوي على صفر، فلن تكون هناك علاقة بين المتغيرات. بالإضافة إلى ذلك، يعني فاصل الثقة أن كل زيادة في مساحة المتجر بمقدار 1000 متر مربع. يؤدي القدم إلى زيادة في متوسط ​​حجم المبيعات يتراوح بين 1,328,000 دولار و2,012,000 دولار.

الاستخدامر -معايير معامل الارتباط.تم تقديم معامل الارتباط صوهو مقياس للعلاقة بين متغيرين رقميين. ويمكن استخدامه لتحديد ما إذا كانت هناك علاقة ذات دلالة إحصائية بين متغيرين. دعونا نشير إلى معامل الارتباط بين مجتمعات كلا المتغيرين بالرمز ρ. وتتم صياغة الفرضيتين الصفرية والبديلة على النحو التالي: ح 0: ρ = 0 (لا يوجد ارتباط)، ح 1: ρ ≠ 0 (هناك ارتباط). التحقق من وجود الارتباط:

أين ص = + ، لو ب 1 > 0, ص = – ، لو ب 1 < 0. Тестовая статистика رلقد ر-التوزيع مع ن - 2درجات الحرية.

في مشكلة سلسلة متاجر Sunflowers ص 2= 0.904، أ ب 1- +1.670 (انظر الشكل 4). بسبب ال ب 1> 0، معامل الارتباط بين المبيعات السنوية وحجم المتجر هو ص= +√0.904 = +0.951. دعونا نختبر الفرضية الصفرية القائلة بعدم وجود علاقة ارتباطية بين هذه المتغيرات باستخدام ر-إحصائيات:

عند مستوى دلالة α = 0.05، يجب رفض فرضية العدم بسبب ر= 10.64 > 2.1788. وبالتالي يمكن القول بأن هناك علاقة ذات دلالة إحصائية بين المبيعات السنوية وحجم المتجر.

عند مناقشة الاستنتاجات المتعلقة بالانحدار السكاني، يتم استخدام فترات الثقة واختبارات الفرضيات بالتبادل. ومع ذلك، تبين أن حساب فاصل الثقة الذي يحتوي على معامل الارتباط هو أكثر صعوبة، لأن نوع توزيع المعاينة للإحصائية صيعتمد على معامل الارتباط الحقيقي.

تقدير التوقعات الرياضية والتنبؤ بالقيم الفردية

يناقش هذا القسم طرق تقدير التوقع الرياضي للاستجابة يوالتنبؤات بالقيم الفردية يلقيم معينة للمتغير X.

بناء فاصل الثقة.في المثال 2 (انظر القسم أعلاه طريقة المربع الأصغر) مكنت معادلة الانحدار من التنبؤ بقيمة المتغير ي X. في مشكلة اختيار موقع لمنفذ البيع بالتجزئة، يبلغ متوسط ​​حجم المبيعات السنوية في متجر بمساحة 4000 متر مربع. قدم يساوي 7.644 مليون دولار، ومع ذلك، فإن هذا التقدير للتوقعات الرياضية لعامة السكان هو نقطة من الحكمة. لتقدير التوقعات الرياضية للسكان، تم اقتراح مفهوم فترة الثقة. وبالمثل، يمكننا تقديم هذا المفهوم فترة الثقة للتوقع الرياضي للاستجابةلقيمة متغيرة معينة X:

أين , = ب 0 + ب 1 العاشر ط- القيمة المتوقعة متغيرة يفي X = العاشر ط, S YX- جذر متوسط ​​مربع الخطأ، ن- حجم العينة، Xأنا- القيمة المحددة للمتغير X, µ ي|X = Xأنا– التوقع الرياضي للمتغير يفي X = شي، اس اس اكس =

يوضح تحليل الصيغة (13) أن عرض فاصل الثقة يعتمد على عدة عوامل. عند مستوى أهمية معين، تؤدي الزيادة في سعة التقلبات حول خط الانحدار، والتي يتم قياسها باستخدام جذر متوسط ​​مربع الخطأ، إلى زيادة في عرض الفاصل الزمني. ومن ناحية أخرى، وكما هو متوقع، فإن الزيادة في حجم العينة يصاحبها تضييق في الفاصل الزمني. بالإضافة إلى ذلك، يتغير عرض الفاصل الزمني اعتمادًا على القيم Xأنا. إذا كانت القيمة المتغيرة يالمتوقعة للكميات X، قريبة من القيمة المتوسطة ، تبين أن فاصل الثقة أضيق مما كان عليه عند توقع الاستجابة لقيم بعيدة عن المتوسط.

لنفترض أنه عند اختيار موقع متجر، نريد إنشاء فاصل ثقة بنسبة 95% لمتوسط ​​المبيعات السنوية لجميع المتاجر التي تبلغ مساحتها 4000 متر مربع. قدم:

ولذلك فإن متوسط ​​حجم المبيعات السنوية في جميع المتاجر التي تبلغ مساحتها 4000 متر مربع. قدم، مع احتمال 95٪ يكمن في النطاق من 6.971 إلى 8.317 مليون دولار.

احسب فاصل الثقة للقيمة المتوقعة.بالإضافة إلى فترة الثقة للتوقع الرياضي للاستجابة لقيمة معينة للمتغير Xغالبًا ما يكون من الضروري معرفة فترة الثقة للقيمة المتوقعة. على الرغم من أن صيغة حساب فاصل الثقة هذا تشبه إلى حد كبير الصيغة (13)، إلا أن هذا الفاصل الزمني يحتوي على القيمة المتوقعة بدلاً من تقدير المعلمة. الفاصل الزمني للاستجابة المتوقعة يX = شيلقيمة متغيرة محددة Xأناتحددها الصيغة:

لنفترض أنه عند اختيار موقع لمنفذ بيع بالتجزئة، نريد إنشاء فاصل ثقة بنسبة 95% لحجم المبيعات السنوية المتوقعة لمتجر تبلغ مساحته 4000 متر مربع. قدم:

وبالتالي فإن حجم المبيعات السنوية المتوقعة لمتجر بمساحة 4000 متر مربع. قدم، مع احتمال 95٪ يكمن في النطاق من 5.433 إلى 9.854 مليون دولار. كما نرى، فإن فاصل الثقة لقيمة الاستجابة المتوقعة أوسع بكثير من فاصل الثقة لتوقعاتها الرياضية. وذلك لأن التباين في التنبؤ بالقيم الفردية أكبر بكثير منه في تقدير التوقع الرياضي.

المزالق والقضايا الأخلاقية المرتبطة باستخدام الانحدار

الصعوبات المرتبطة بتحليل الانحدار:

  • تجاهل شروط تطبيق طريقة المربعات الصغرى.
  • التقييم الخاطئ لشروط تطبيق طريقة المربعات الصغرى.
  • الاختيار غير الصحيح للطرق البديلة عند انتهاك شروط تطبيق طريقة المربعات الصغرى.
  • تطبيق تحليل الانحدار دون معرفة عميقة بموضوع البحث.
  • استقراء الانحدار خارج نطاق المتغير التوضيحي.
  • الخلط بين العلاقات الإحصائية والسببية.

أدى الاستخدام الواسع النطاق لجداول البيانات والبرامج الإحصائية إلى القضاء على المشاكل الحسابية التي أعاقت استخدام تحليل الانحدار. ومع ذلك، أدى ذلك إلى حقيقة أن تحليل الانحدار تم استخدامه من قبل المستخدمين الذين ليس لديهم المؤهلات والمعرفة الكافية. كيف يمكن للمستخدمين معرفة الطرق البديلة إذا كان الكثير منهم ليس لديهم أي فكرة على الإطلاق عن شروط تطبيق طريقة المربعات الصغرى ولا يعرفون كيفية التحقق من تنفيذها؟

لا ينبغي للباحث أن ينجرف في معالجة الأرقام - حساب معامل التحول والانحدار ومعامل الارتباط المختلط. فهو يحتاج إلى معرفة أعمق. دعونا نوضح ذلك بمثال كلاسيكي مأخوذ من الكتب المدرسية. أظهر أنسكومب أن جميع مجموعات البيانات الأربع الموضحة في الشكل 1. 23، لها نفس معلمات الانحدار (الشكل 24).

أرز. 23. أربع مجموعات بيانات مصطنعة

أرز. 24. تحليل الانحدار لأربع مجموعات بيانات مصطنعة؛ فعلت مع حزمة التحليل(اضغط على الصورة لتكبير الصورة)

لذا، من وجهة نظر تحليل الانحدار، فإن جميع مجموعات البيانات هذه متطابقة تمامًا. إذا انتهى التحليل هناك، فسنفقد الكثير من المعلومات المفيدة. ويتجلى ذلك من خلال المخططات المبعثرة (الشكل 25) والمؤامرات المتبقية (الشكل 26) التي تم إنشاؤها لمجموعات البيانات هذه.

أرز. 25. مخططات مبعثرة لأربع مجموعات بيانات

تشير المخططات المبعثرة والمؤامرات المتبقية إلى أن هذه البيانات تختلف عن بعضها البعض. المجموعة الوحيدة الموزعة على طول خط مستقيم هي المجموعة A. ولا تحتوي مخططات البقايا المحسوبة من المجموعة A على أي نمط. لا يمكن قول هذا عن المجموعات B وC وD. فالمخطط المبعثر المرسوم للمجموعة B يُظهر نمطًا تربيعيًا واضحًا. يتم تأكيد هذا الاستنتاج من خلال المؤامرة المتبقية، والتي لها شكل مكافئ. يُظهر المخطط المبعثر والمؤامرة المتبقية أن مجموعة البيانات B تحتوي على قيمة خارجية. في هذه الحالة، من الضروري استبعاد القيم المتطرفة من مجموعة البيانات وتكرار التحليل. تسمى طريقة اكتشاف القيم المتطرفة والقضاء عليها في الملاحظات تحليل التأثير. وبعد إزالة القيمة المتطرفة، قد تكون نتيجة إعادة تقدير النموذج مختلفة تمامًا. يوضح مخطط التشتت المرسوم من البيانات من المجموعة G موقفًا غير عادي يعتمد فيه النموذج التجريبي بشكل كبير على الاستجابة الفردية ( × 8 = 19, ي 8 = 12.5). ويجب حساب نماذج الانحدار هذه بعناية خاصة. لذلك، تعد المخططات المبعثرة والمتبقية أداة أساسية لتحليل الانحدار ويجب أن تكون جزءًا لا يتجزأ منها. وبدونها، لا يكون تحليل الانحدار ذا مصداقية.

أرز. 26. قطع الأراضي المتبقية لأربع مجموعات من البيانات

كيفية تجنب المزالق في تحليل الانحدار:

  • تحليل العلاقات المحتملة بين المتغيرات Xو يابدأ دائمًا برسم مخطط مبعثر.
  • قبل تفسير نتائج تحليل الانحدار، تحقق من شروط قابليتها للتطبيق.
  • ارسم القيم المتبقية مقابل المتغير المستقل. وهذا سيجعل من الممكن تحديد مدى مطابقة النموذج التجريبي لنتائج المراقبة واكتشاف انتهاك ثبات التباين.
  • استخدم الرسوم البيانية، ومخططات الجذع والأوراق، ومخططات الصندوق، ومخططات التوزيع الطبيعي لاختبار افتراض توزيع الخطأ الطبيعي.
  • إذا لم يتم استيفاء شروط تطبيق طريقة المربعات الصغرى، استخدم طرق بديلة (على سبيل المثال، نماذج الانحدار التربيعية أو المتعددة).
  • في حالة استيفاء شروط تطبيق طريقة المربعات الصغرى، فمن الضروري اختبار الفرضية حول الأهمية الإحصائية لمعاملات الانحدار وبناء فترات ثقة تحتوي على التوقع الرياضي وقيمة الاستجابة المتوقعة.
  • تجنب التنبؤ بقيم المتغير التابع خارج نطاق المتغير المستقل.
  • ضع في اعتبارك أن العلاقات الإحصائية ليست دائمًا سببًا ونتيجة. تذكر أن الارتباط بين المتغيرات لا يعني وجود علاقة سبب ونتيجة بينهما.

ملخص.وكما هو موضح في الرسم التخطيطي (الشكل 27)، تصف الملاحظة نموذج الانحدار الخطي البسيط، وشروط إمكانية تطبيقه، وكيفية اختبار هذه الشروط. يعتبر ر-معيار لاختبار الدلالة الإحصائية لمنحدر الانحدار. تم استخدام نموذج الانحدار للتنبؤ بقيم المتغير التابع. يعتبر أحد الأمثلة متعلقًا باختيار الموقع لمنفذ البيع بالتجزئة، حيث يتم فحص اعتماد حجم المبيعات السنوية على مساحة المتجر. تتيح لك المعلومات التي تم الحصول عليها تحديد موقع المتجر بشكل أكثر دقة والتنبؤ بحجم مبيعاته السنوية. ستواصل الملاحظات التالية مناقشة تحليل الانحدار وستنظر أيضًا في نماذج الانحدار المتعددة.

أرز. 27. مخطط هيكل الملاحظة

يتم استخدام مواد من كتاب Levin et al. إحصائيات المديرين. – م: ويليامز، 2004. – ص. 792-872

إذا كان المتغير التابع قاطعا، فيجب استخدام الانحدار اللوجستي.

هذه هي الطريقة الأكثر شيوعا لإظهار اعتماد بعض المتغيرات على الآخرين، على سبيل المثال، كيف مستوى الناتج المحلي الإجماليمن الحجم الاستثمار الأجنبياو من سعر الإقراض من البنك الوطنياو من أسعار مصادر الطاقة الرئيسية.

تتيح لك النمذجة إظهار حجم هذا الاعتماد (المعاملات)، والتي بفضلها يمكنك إجراء تنبؤ مباشر وتنفيذ نوع من التخطيط بناءً على هذه التوقعات. أيضًا، بناءً على تحليل الانحدار، من الممكن اتخاذ قرارات إدارية تهدف إلى تحفيز الأسباب ذات الأولوية التي تؤثر على النتيجة النهائية؛ وسيساعد النموذج نفسه في تحديد عوامل الأولوية هذه.

نظرة عامة على نموذج الانحدار الخطي:

Y=أ 0 +أ 1 × 1 +...+أ ك × ك

أين أ - معلمات الانحدار (المعاملات)، س - العوامل المؤثرة، ك - عدد العوامل النموذجية.

البيانات الأولية

من بين البيانات الأولية، نحتاج إلى مجموعة معينة من البيانات التي من شأنها أن تمثل عدة قيم متتالية أو مترابطة للمعلمة النهائية Y (على سبيل المثال، الناتج المحلي الإجمالي) ونفس عدد قيم المؤشرات التي ندرس تأثيرها ( على سبيل المثال، الاستثمار الأجنبي).

يوضح الشكل أعلاه جدولاً يحتوي على نفس البيانات الأولية، Y هو مؤشر للسكان النشطين اقتصاديًا، وعدد المؤسسات، وحجم الاستثمار في رأس المال ودخل الأسرة هي عوامل مؤثرة، أي X's.

بناءً على هذا الشكل، يمكن للمرء أيضًا التوصل إلى نتيجة خاطئة مفادها أن النمذجة لا يمكن أن تكون إلا حول السلاسل الزمنية، أي السلاسل الزمنية المسجلة بشكل تسلسلي في الوقت المناسب، ولكن هذا ليس هو الحال بنفس النجاح، يمكن للمرء أن يصمم من حيث الهيكل على سبيل المثال، يمكن تقسيم القيم الموضحة في الجدول ليس حسب السنة، ولكن حسب المنطقة.

لبناء نماذج خطية مناسبة، من المستحسن ألا تحتوي البيانات المصدر على انخفاضات أو انهيارات قوية؛ وفي مثل هذه الحالات، يُنصح بإجراء التجانس، لكننا سنتحدث عن التجانس في المرة القادمة.

حزمة التحليل

يمكن أيضًا حساب معلمات نموذج الانحدار الخطي يدويًا باستخدام طريقة المربعات الصغرى العادية (OLS)، ولكن هذا يستغرق وقتًا طويلاً. يمكن حساب ذلك بشكل أسرع قليلاً باستخدام نفس الطريقة باستخدام الصيغ في Excel، حيث سيقوم البرنامج نفسه بإجراء الحسابات، ولكن لا يزال يتعين عليك إدخال الصيغ يدويًا.

يحتوي Excel على وظيفة إضافية حزمة التحليل، وهي أداة قوية جدًا لمساعدة المحلل. يمكن لمجموعة الأدوات هذه، من بين أشياء أخرى، حساب معلمات الانحدار باستخدام نفس طريقة المربعات الصغرى، ببضع نقرات فقط. في الواقع، سيتم مناقشة كيفية استخدام هذه الأداة بشكل أكبر.

تفعيل حزمة التحليل

بشكل افتراضي، يتم تعطيل هذه الوظيفة الإضافية ولن تجدها في قائمة علامات التبويب، لذلك سنلقي نظرة خطوة بخطوة على كيفية تنشيطها.

في Excel، في الجزء العلوي الأيسر، قم بتنشيط علامة التبويب ملف، في القائمة التي تفتح، ابحث عن العنصر خياراتوانقر عليه.

في النافذة التي تفتح، على اليسار، ابحث عن العنصر الإضافاتوقم بتنشيطها، في علامة التبويب هذه، ستكون هناك قائمة تحكم منسدلة بالأسفل، حيث سيتم كتابتها افتراضيًا الوظائف الإضافية لبرنامج Excel، سيكون هناك زر على يمين القائمة المنسدلة يذهب، تحتاج إلى النقر عليه.

ستطالبك النافذة المنبثقة بتحديد الوظائف الإضافية المتاحة، حيث تحتاج إلى تحديد المربع حزمة التحليلوفي نفس الوقت، فقط في حالة، إيجاد حل(شيء مفيد أيضًا)، ثم قم بتأكيد اختيارك بالضغط على الزر نعم.

تعليمات للعثور على معلمات الانحدار الخطي باستخدام حزمة التحليل

بعد تفعيل الوظيفة الإضافية Analysis Pack، ستكون متاحة دائمًا في علامة تبويب القائمة الرئيسية بياناتتحت الرابط تحليل البيانات

في نافذة الأداة النشطة تحليل البياناتمن قائمة الاحتمالات التي نبحث عنها ونختارها تراجع

بعد ذلك، سيتم فتح نافذة لإعداد واختيار البيانات المصدر لحساب معلمات نموذج الانحدار. هنا تحتاج إلى الإشارة إلى فترات البيانات الأولية، أي المعلمة الموصوفة (Y) والعوامل المؤثرة عليها (X)، كما هو موضح في الشكل أدناه، تعتبر المعلمات المتبقية اختيارية من حيث المبدأ للتكوين.

بعد تحديد البيانات المصدر والنقر فوق الزر "موافق"، يقوم Excel بإنشاء حسابات على ورقة جديدة من المصنف النشط (ما لم يتم تعيين خلاف ذلك في الإعدادات)، تبدو هذه الحسابات كما يلي:

تمتلئ الخلايا الرئيسية باللون الأصفر؛ وهذه هي الخلايا التي تحتاج إلى الاهتمام بها أولاً، كما أن المعلمات الأخرى ذات الأهمية مهمة أيضًا، ولكن تحليلها التفصيلي ربما يتطلب منشورًا منفصلاً.

لذا، 0,865 - هذا ص 2- معامل التحديد، يوضح أن 86.5% من المعلمات المحسوبة للنموذج، أي النموذج نفسه، تفسر التبعية والتغيرات في المعلمة قيد الدراسة - يمن العوامل المدروسة - X. إذا كان مبالغا فيه، ثم وهذا مؤشر على جودة النموذجوكلما كان ذلك أفضل. من الواضح أنه لا يمكن أن يكون أكثر من 1 ويعتبر جيدًا عندما يكون R 2 أعلى من 0.8، وإذا كان أقل من 0.5، فيمكن التشكيك بأمان في معقولية مثل هذا النموذج.

الآن دعنا ننتقل إلى معاملات النموذج:
2079,85 - هذا - معامل يوضح ما ستكون عليه Y إذا كانت جميع العوامل المستخدمة في النموذج تساوي 0، ومن المفهوم أن هذا يعتمد على عوامل أخرى غير موصوفة في النموذج؛
-0,0056 - أ 1- معامل يوضح وزن تأثير العامل x 1 على Y، أي أن عدد المؤسسات ضمن نموذج معين يؤثر على مؤشر السكان النشطين اقتصاديًا بوزن -0.0056 فقط (درجة تأثير صغيرة نوعًا ما) ). تشير علامة الطرح إلى أن هذا التأثير سلبي، أي أنه كلما زاد عدد المؤسسات، قل عدد السكان النشطين اقتصاديًا، بغض النظر عن مدى التناقض في المعنى؛
-0,0026 - 2- معامل تأثير حجم الاستثمارات في رأس المال على حجم السكان النشطين اقتصاديا وفقا للنموذج، وهذا التأثير سلبي أيضا؛
0,0028 - أ 3- معامل تأثير دخل السكان على حجم السكان النشطين اقتصاديا، وهنا يكون التأثير إيجابيا، أي أنه وفقا للنموذج فإن زيادة الدخل ستساهم في زيادة حجم السكان النشطين اقتصاديا.

لنجمع المعاملات المحسوبة في النموذج:

ص = 2079.85 - 0.0056x1 - 0.0026x2 + 0.0028x3

في الواقع، هذا هو نموذج الانحدار الخطي، والذي يبدو تمامًا مثل هذا بالنسبة للبيانات الأولية المستخدمة في المثال.

التقديرات النموذجية والتنبؤات

كما ناقشنا أعلاه، تم تصميم النموذج ليس فقط لإظهار حجم اعتماد المعلمة التي تتم دراستها على العوامل المؤثرة، ولكن أيضًا من أجل معرفة هذه العوامل المؤثرة، من الممكن إجراء توقعات. يعد إجراء هذا التنبؤ أمرًا بسيطًا للغاية؛ كل ما عليك فعله هو استبدال قيم العوامل المؤثرة بقيم X المقابلة في معادلة النموذج الناتجة. في الشكل أدناه، يتم إجراء هذه الحسابات في Excel في عمود منفصل.

يتم عرض القيم الفعلية (تلك التي حدثت في الواقع) والقيم المحسوبة حسب النموذج في نفس الشكل على شكل رسوم بيانية لتوضيح الفرق وبالتالي خطأ النموذج.

وأكرر مرة أخرى، من أجل إجراء تنبؤ باستخدام نموذج، من الضروري أن تكون هناك عوامل مؤثرة معروفة، وإذا كنا نتحدث عن سلسلة زمنية، وبالتالي توقعات للمستقبل، على سبيل المثال، للقادم سنة أو شهر، فليس من الممكن دائما معرفة العوامل المؤثرة في هذا المستقبل. في مثل هذه الحالات، من الضروري أيضًا إجراء توقعات للعوامل المؤثرة؛ ويتم ذلك في أغلب الأحيان باستخدام نموذج الانحدار الذاتي - وهو النموذج الذي تكون فيه العوامل المؤثرة هي الكائن قيد الدراسة والوقت، أي اعتماد المؤشر. على غرار ما كان عليه في الماضي.

سنتناول كيفية بناء نموذج الانحدار الذاتي في المقال القادم، لكن لنفترض الآن أننا نعرف ما ستكون عليه قيم العوامل المؤثرة في الفترة المقبلة (في المثال 2008)، وذلك عن طريق استبدال هذه القيم في الحسابات سوف نحصل على توقعاتنا لعام 2008.

تتيح لك حزمة MS Excel القيام بمعظم العمل بسرعة كبيرة عند إنشاء معادلة الانحدار الخطي. ومن المهم أن نفهم كيفية تفسير النتائج التي تم الحصول عليها. لإنشاء نموذج انحدار، يجب عليك تحديد Tools\Data Analysis\Regression (في Excel 2007، يوجد هذا الوضع في كتلة البيانات/تحليل البيانات/الانحدار). ثم انسخ النتائج إلى كتلة للتحليل.

البيانات الأولية:

تحليل النتائج

تضمين في التقرير
حساب معلمات معادلة الانحدار
المادة النظرية
معادلة الانحدار على المقياس القياسي
معامل الارتباط المتعدد (مؤشر الارتباط المتعدد)
معاملات المرونة الجزئية
تقييم مقارن لتأثير العوامل التي تم تحليلها على الخاصية الناتجة (د - معاملات التحديد المنفصل)

التحقق من جودة معادلة الانحدار المبنية
أهمية معاملات الانحدار b i (إحصائيات t. اختبار الطالب)
أهمية المعادلة ككل (إحصائيات F. اختبار فيشر). معامل التحديد
اختبارات F الجزئية

مستوى الأهمية 0.005 0.01 0.025 0.05 0.1 0.25 0.4

28 أكتوبر

مساء الخير عزيزي قراء المدونة! اليوم سنتحدث عن الانحدارات غير الخطية. يمكن الاطلاع على حل الانحدارات الخطية على الرابط.

وتستخدم هذه الطريقة بشكل رئيسي في النمذجة والتنبؤ الاقتصادي. هدفها هو مراقبة وتحديد التبعيات بين مؤشرين.

الأنواع الرئيسية للانحدارات غير الخطية هي:

  • كثير الحدود (تربيعي، مكعب)؛
  • القطعي؛
  • رزين؛
  • إيضاحي؛
  • لوغاريتمي

ويمكن أيضا استخدام مجموعات مختلفة. على سبيل المثال، بالنسبة لتحليلات السلاسل الزمنية في الأعمال المصرفية والتأمين والدراسات الديموغرافية، يتم استخدام منحنى جومبزر، وهو نوع من الانحدار اللوغاريتمي.

عند التنبؤ باستخدام الانحدارات غير الخطية، فإن الشيء الرئيسي هو معرفة معامل الارتباط، والذي سيوضح لنا ما إذا كانت هناك علاقة وثيقة بين معلمتين أم لا. كقاعدة عامة، إذا كان معامل الارتباط قريبًا من 1، فسيكون هناك اتصال، وستكون التوقعات دقيقة تمامًا. عنصر آخر مهم في الانحدارات غير الخطية هو متوسط ​​الخطأ النسبي ( أ )، إذا كان في الفاصل الزمني<8…10%, значит модель достаточно точна.

هذا هو المكان الذي سننهي فيه على الأرجح الكتلة النظرية وننتقل إلى الحسابات العملية.

لدينا جدول مبيعات السيارات على مدى 15 عامًا (دعنا نشير إليه X)، وسيكون عدد خطوات القياس هو الوسيط n، ولدينا أيضًا إيرادات لهذه الفترات (دعنا نشير إليه Y)، نحتاج إلى التنبؤ بما الإيرادات ستكون في المستقبل. لنقم ببناء الجدول التالي:

للدراسة سنحتاج إلى حل المعادلة (اعتماد Y على X): y=ax 2 +bx+c+e. هذا هو الانحدار التربيعي الزوجي. في هذه الحالة، نطبق طريقة المربعات الصغرى لمعرفة الوسائط غير المعروفة - a، b، c. وسوف يؤدي إلى نظام المعادلات الجبرية من النموذج:

لحل هذا النظام سنستخدم، على سبيل المثال، طريقة كرامر. نرى أن المجاميع المدرجة في النظام هي معاملات للمجهول. لحسابها، سنضيف عدة أعمدة إلى الجدول (D،E،F،G،H) ونوقع وفقًا لمعنى الحسابات - في العمود D سنقوم بتربيع x، في E سنقوم بتكعيبه، في F سنضرب الأسس x و y، وفي H نقوم بتربيع x ونضرب في y.

سوف تحصل على جدول من النموذج مملوء بالأشياء اللازمة لحل المعادلة.

دعونا نشكل مصفوفة أ نظام يتكون من معاملات المجهول على الجانب الأيسر من المعادلات. لنضعها في الخلية A22 ونسميها " أ=". نحن نتبع نظام المعادلات الذي اخترناه لحل الانحدار.

أي أنه في الخلية B21 يجب علينا وضع مجموع العمود الذي رفعنا فيه مؤشر X إلى القوة الرابعة - F17. دعنا نشير فقط إلى الخلية - "=F17". بعد ذلك، نحتاج إلى مجموع العمود الذي تم فيه تكعيب X - E17، ثم نتبع النظام بدقة. وبالتالي، سوف نحتاج إلى ملء المصفوفة بأكملها.

وفقًا لخوارزمية كريمر، سنكتب مصفوفة A1، مشابهة للمصفوفة A، حيث يجب وضع عناصر الجوانب اليمنى من معادلات النظام بدلاً من عناصر العمود الأول. أي أن مجموع العمود X تربيعه مضروبًا في Y ومجموع العمود XY ومجموع العمود Y.

سنحتاج أيضًا إلى مصفوفتين إضافيتين - لنسميهما A2 وA3 حيث يتكون العمودان الثاني والثالث من معاملات الطرف الأيمن من المعادلات. ستكون الصورة هكذا.

باتباع الخوارزمية المختارة، سنحتاج إلى حساب قيم المحددات (المحددات، D) للمصفوفات الناتجة. دعونا نستخدم صيغة MOPRED. سنضع النتائج في الخلايا J21:K24.

سنقوم بحساب معاملات المعادلة حسب كريمر في الخلايا المقابلة للمحددات المقابلة باستخدام الصيغة: أ(في الخلية M22) - "=K22/K21"؛ ب(في الخلية M23) - "=K23/K21"؛ مع(في الخلية M24) - "=K24/K21".

نحصل على المعادلة المطلوبة للانحدار التربيعي المقترن:

ص=-0.074س 2 +2.151س+6.523

دعونا نقيم مدى قرب العلاقة الخطية باستخدام مؤشر الارتباط.

لإجراء الحساب، أضف عمودًا إضافيًا J إلى الجدول (دعنا نسميه y*). وسيكون الحساب كالآتي (حسب معادلة الانحدار التي حصلنا عليها) - "=$m$22*B2*B2+$M$23*B2+$M$24."لنضعها في الخلية J2. كل ما تبقى هو سحب علامة الملء التلقائي إلى الخلية J16.

لحساب المجاميع (متوسط ​​Y-Y) 2، أضف العمودين K وL إلى الجدول الذي يحتوي على الصيغ المقابلة. نقوم بحساب المتوسط ​​للعمود Y باستخدام الدالة AVERAGE.

في الخلية K25، سنضع الصيغة لحساب مؤشر الارتباط - "=ROOT(1-(K17/L17))".

ونرى أن قيمة 0.959 قريبة جدًا من 1، مما يعني أن هناك علاقة غير خطية وثيقة بين المبيعات والسنوات.

يبقى تقييم جودة ملاءمة معادلة الانحدار التربيعي الناتجة (مؤشر التحديد). يتم حسابه باستخدام صيغة مؤشر الارتباط التربيعي. أي أن الصيغة الموجودة في الخلية K26 ستكون بسيطة جدًا - "=K25*K25".

معامل 0.920 قريب من 1، مما يدل على جودة عالية من الملاءمة.

الخطوة الأخيرة هي حساب الخطأ النسبي. لنقم بإضافة عمود وإدخال الصيغة هناك: "=ABS((C2-J2)/C2)، ABS - الوحدة النمطية، القيمة المطلقة. ارسم العلامة لأسفل وفي الخلية M18 اعرض القيمة المتوسطة (المتوسط)، وقم بتعيين تنسيق النسبة المئوية للخلايا. النتيجة التي تم الحصول عليها - 7.79% ضمن قيم الخطأ المقبولة<8…10%. Значит вычисления достаточно точны.

إذا دعت الحاجة، يمكننا بناء رسم بياني باستخدام القيم التي تم الحصول عليها.

تم إرفاق ملف مثال - الرابط!

فئات:// من 28/10/2017