مثير للإعجاب

ما هو خط المربعات الصغرى؟

ما هو خط المربعات الصغرى؟

scatterplot هو نوع من الرسم البياني الذي يستخدم لتمثيل البيانات المقترنة. يتم رسم المتغير التوضيحي على طول المحور الأفقي ورسم متغير الاستجابة على طول المحور العمودي. أحد أسباب استخدام هذا النوع من الرسم البياني هو البحث عن العلاقات بين المتغيرات.

إن النمط الأساسي الذي يجب البحث عنه في مجموعة من البيانات المقترنة هو الخط المستقيم. من خلال أي نقطتين ، يمكننا رسم خط مستقيم. إذا كان هناك أكثر من نقطتين في scatterplot لدينا ، فمعظم الوقت لن نكون قادرين على رسم خط يمر بكل نقطة. بدلاً من ذلك ، سنرسم خطًا يمر عبر منتصف النقاط ويعرض الاتجاه العام الخطي للبيانات.

بينما ننظر إلى النقاط في الرسم البياني لدينا ونتمنى رسم خط من خلال هذه النقاط ، يطرح سؤال. أي خط يجب أن نرسم؟ هناك عدد لا حصر له من الخطوط التي يمكن رسمها. باستخدام أعيننا وحدها ، من الواضح أن كل شخص ينظر إلى scatterplot يمكن أن ينتج خطًا مختلفًا قليلاً. هذا الغموض مشكلة. نريد أن يكون لدينا طريقة محددة للجميع للحصول على نفس الخط. الهدف هو الحصول على وصف دقيق رياضي للخط الذي يجب رسمه. أقل خط انحدار المربعات هو أحد هذه الخطوط من خلال نقاط البيانات الخاصة بنا.

المربعات الصغرى

يوضح اسم خط المربعات الصغرى ما الذي يفعله. نبدأ مع مجموعة من النقاط مع الإحداثيات التي قدمها (سأنا, ذأنا). سوف يمر أي خط مستقيم بين هذه النقاط وسيتخطى أو يقل عن كل من هذه النقاط. يمكننا حساب المسافات من هذه النقاط إلى السطر عن طريق اختيار قيمة س ومن ثم طرح الملاحظة ذ تنسيق يتوافق مع هذا س من ذ تنسيق خطنا.

خطوط مختلفة خلال نفس مجموعة النقاط تعطي مجموعة مختلفة من المسافات. نريد أن تكون هذه المسافات صغيرة بقدر ما يمكننا صنعها. لكن هناك مشكلة. نظرًا لأن مسافاتنا يمكن أن تكون إما إيجابية أو سلبية ، فإن مجموع كل هذه المسافات سوف يلغي بعضها البعض. مجموع المسافات يساوي دائما صفر.

يكمن حل هذه المشكلة في إزالة جميع الأرقام السالبة عن طريق تربيع المسافات بين النقاط والخط. هذا يعطي مجموعة من الأرقام غير السالبة. الهدف الذي كان لدينا لإيجاد خط أفضل ملاءمة هو جعل مجموع هذه المسافات المربعة أصغر ما يمكن. حساب التفاضل والتكامل يأتي لانقاذ هنا. عملية التمييز في حساب التفاضل والتكامل تجعل من الممكن تقليل مجموع المسافات المربعة من خط معين. هذا ما يفسر عبارة "المربعات الصغرى" باسمنا لهذا السطر.

خط أفضل صالح

نظرًا لأن خط المربعات الصغرى يقلل المسافات المربعة بين الخط ونقاطنا ، يمكننا أن نفكر في هذا الخط باعتباره الخط الذي يناسب بياناتنا. هذا هو السبب في أن خط المربعات الصغرى يُعرف أيضًا باسم الخط الأنسب. من بين جميع الخطوط المحتملة التي يمكن رسمها ، يكون خط المربعات الصغرى هو الأقرب إلى مجموعة البيانات ككل. قد يعني هذا أن خطنا سيغيب عن الوصول إلى أي من النقاط في مجموعة البيانات الخاصة بنا.

ملامح خط المربعات الصغرى

هناك بعض الميزات التي يمتلكها كل خط مربعات على الأقل. البند الأول من الاهتمام يتعامل مع منحدر خطنا. المنحدر لديه اتصال بمعامل الارتباط لبياناتنا. في الواقع ، ميل الخط يساوي ص (قذ/ قس). هنا الصورة س يدل على الانحراف المعياري لل س ينسق و الصورة ذ الانحراف المعياري لل ذ إحداثيات البيانات الخاصة بنا. ترتبط علامة معامل الارتباط ارتباطًا مباشرًا بعلامة ميل خط المربعات الصغرى.

هناك ميزة أخرى لخط المربعات الصغرى تتعلق بنقطة يمر بها. بينما ال ذ اعتراض خط المربعات الصغرى قد لا يكون مثيراً للاهتمام من وجهة نظر إحصائية ، فهناك نقطة واحدة. كل سطر المربعات الصغرى يمر عبر نقطة منتصف البيانات. هذه النقطة الوسطى لديها س تنسيق هذا هو معنى س القيم و ذ تنسيق هذا هو معنى ذ القيم.