مثير للإعجاب

تحليل الانحدار الخطي

تحليل الانحدار الخطي

الانحدار الخطي هو أسلوب إحصائي يستخدم لمعرفة المزيد حول العلاقة بين متغير مستقل (متنبئ) ومتغير تابع (قياسي). عندما يكون لديك أكثر من متغير مستقل واحد في تحليلك ، يشار إلى ذلك باسم الانحدار الخطي المتعدد. بشكل عام ، يسمح الانحدار للباحث بطرح السؤال العام "ما هو أفضل تنبؤ ...؟"

على سبيل المثال ، دعنا نقول إننا ندرس أسباب السمنة ، مقاسة بمؤشر كتلة الجسم (BMI). على وجه الخصوص ، أردنا معرفة ما إذا كانت المتغيرات التالية تنبئ بشكل كبير بمؤشر كتلة الجسم للشخص: عدد وجبات الوجبات السريعة التي يتم تناولها كل أسبوع ، وعدد ساعات المشاهدة التليفزيونية في الأسبوع ، وعدد الدقائق التي يقضيها التمرين في الأسبوع ، ومؤشر كتلة الجسم للوالدين . سيكون الانحدار الخطي طريقة جيدة لهذا التحليل

معادلة الانحدار

عندما تقوم بإجراء تحليل الانحدار باستخدام متغير مستقل واحد ، تكون معادلة الانحدار هي Y = a + b * X حيث Y هي المتغير التابع ، X هي المتغير المستقل ، وهو الثابت (أو التقاطع) ، و b هو الميل من خط الانحدار. على سبيل المثال ، دعنا نقول أن GPA هو أفضل توقع لمعادلة الانحدار 1 + 0.02 * IQ. إذا حصل الطالب على معدل ذكاء 130 ، فسيكون المعدل التراكمي 3.6 (1 + 0.02 * 130 = 3.6).

عندما تقوم بإجراء تحليل للانحدار يكون لديك فيه أكثر من متغير مستقل ، تكون معادلة الانحدار هي Y = a + b1 * X1 + b2 * X2 + ... + bp * Xp. على سبيل المثال ، إذا أردنا تضمين المزيد من المتغيرات في تحليل المعدل التراكمي الخاص بنا ، مثل مقاييس التحفيز والانضباط الذاتي ، فسنستخدم هذه المعادلة.

R-ساحة

R-square ، المعروف أيضًا باسم معامل التحديد ، هو إحصاء شائع الاستخدام لتقييم ملاءمة النموذج لمعادلة الانحدار. بمعنى ، ما مدى جودة جميع المتغيرات المستقلة في التنبؤ بالمتغير التابع لديك؟ تتراوح قيمة مربع R من 0.0 إلى 1.0 ويمكن ضربها في 100 للحصول على نسبة تباين موضحة. على سبيل المثال ، بالعودة إلى معادلة الانحدار المعدل التراكمي لدينا مع متغير مستقل واحد فقط (IQ) ... دعنا نقول أن مربعنا R للمعادلة كان 0.4. يمكننا تفسير هذا على أنه يعني أن 40٪ من التباين في المعدل التراكمي يتم تفسيره بواسطة IQ. إذا أضفنا متغيرين آخرين (الدافع والانضباط الذاتي) وزاد المربّع R إلى 0.6 ، فهذا يعني أن معدل الذكاء والتحفيز والانضباط الذاتي يفسران معًا 60٪ من التباين في درجات المعدل التراكمي.

تتم عادة تحليلات الانحدار باستخدام برنامج إحصائي ، مثل SPSS أو SAS ، وبالتالي يتم احتساب مربع R لك.

تفسير معاملات الانحدار (ب)

تمثل معاملات b من المعادلات أعلاه قوة واتجاه العلاقة بين المتغيرات المستقلة والمتغيرة. إذا نظرنا إلى معادلة معدل الذكاء ومعدل الذكاء ، 1 + 0.02 * 130 = 3.6 ، 0.02 هي معامل الانحدار لمتغير معدل الذكاء. هذا يخبرنا أن اتجاه العلاقة هو إيجابي بحيث يزيد معدل الذكاء ، ويزيد أيضا المعدل التراكمي. إذا كانت المعادلة 1 - 0.02 * 130 = Y ، فهذا يعني أن العلاقة بين IQ و GPA كانت سالبة.

الافتراضات

هناك العديد من الافتراضات حول البيانات التي يجب الوفاء بها من أجل إجراء تحليل الانحدار الخطي:

  • الخطي: من المفترض أن تكون العلاقة بين المتغيرات المستقلة والمستقلة التابعة خطية. على الرغم من أنه لا يمكن تأكيد هذا الافتراض تمامًا أبدًا ، إلا أن النظر إلى مجموعة من المتغيرات الخاصة بك يمكن أن يساعد في اتخاذ هذا القرار. في حالة وجود انحناء في العلاقة ، يمكنك التفكير في تحويل المتغيرات أو السماح صراحةً بالمكونات غير الخطية.
  • الوضع الطبيعي: من المفترض أن يتم توزيع المتبقي من المتغيرات الخاصة بك عادة. بمعنى ، يتم توزيع الأخطاء في التنبؤ بقيمة Y (المتغير التابع) بطريقة تقترب من المنحنى العادي. يمكنك إلقاء نظرة على الرسوم البيانية أو مخططات الاحتمالية الطبيعية لفحص توزيع المتغيرات الخاصة بك وقيمها المتبقية.
  • استقلال: من المفترض أن الأخطاء في التنبؤ بقيمة Y كلها مستقلة عن بعضها البعض (غير مرتبطة).
  • متماثل التفاوت: من المفترض أن يكون التباين حول خط الانحدار هو نفسه بالنسبة لجميع قيم المتغيرات المستقلة.

مصدر

  • StatSoft: كتاب الإحصاء الإلكتروني. (2011). //www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.