أين يتم تطبيق طريقة المربعات الصغرى؟ طريقة المربعات الصغرى في Excel. تحليل الانحدار انحدار المربعات الصغرى


اختيار نوع دالة الانحدار ، أي نوع النموذج المدروس لاعتماد Y على X (أو X على Y) ، على سبيل المثال ، نموذج خطي y x = a + bx ، من الضروري تحديد القيم المحددة لمعاملات النموذج.

لقيم مختلفة من a و b ، من الممكن بناء عدد لا حصر له من التبعيات بالشكل y x = a + bx ، أي ، هناك عدد لا حصر له من الأسطر على مستوى الإحداثيات ، لكننا بحاجة إلى مثل هذا الاعتماد الذي يتوافق مع القيم المرصودة بأفضل طريقة. وبالتالي ، يتم اختزال المشكلة في اختيار أفضل المعاملات.

نحن نبحث عن دالة خطية a + bx ، تعتمد فقط على عدد معين من الملاحظات المتاحة. للعثور على الوظيفة الأكثر ملاءمة للقيم الملاحظة ، نستخدم طريقة المربعات الصغرى.

دلالة: Y i - القيمة المحسوبة بالمعادلة Y i = a + bx i. y i - القيمة المقاسة ، ε i = y i -Y i - الفرق بين القيم المقاسة والمحسوبة ، ε i = y i -a-bx i.

تتطلب طريقة المربعات الصغرى أن يكون ε i ، الفرق بين y i المقاس وقيم Y i المحسوبة من المعادلة ، في حده الأدنى. لذلك ، نجد المعاملين a و b بحيث يكون مجموع الانحرافات التربيعية للقيم المرصودة من القيم الموجودة على خط الانحدار المستقيم هو الأصغر:

من خلال التحقيق في وظيفة الحجج هذه وبمساعدة المشتقات إلى أقصى حد ، يمكننا إثبات أن الدالة تأخذ قيمة دنيا إذا كان المعاملان a و b من حلول النظام:

(2)

إذا قسمنا طرفي المعادلات العادية على n ، نحصل على:

بشرط (3)

احصل على ، من هنا ، باستبدال قيمة a في المعادلة الأولى ، نحصل على:

في هذه الحالة ، يسمى b معامل الانحدار ؛ أ يسمى العضو الحر في معادلة الانحدار ويتم حسابه بواسطة الصيغة:

الخط المستقيم الناتج هو تقدير لخط الانحدار النظري. نملك:

لذا، هي معادلة انحدار خطي.

يمكن أن يكون الانحدار مباشرًا (b> 0) وعكسيًا (b مثال 1. نتائج قياس قيم X و Y معطاة في الجدول:

س ط -2 0 1 2 4
ذ أنا 0.5 1 1.5 2 3

بافتراض وجود علاقة خطية بين X و Y y = a + bx ، حدد المعاملين a و b باستخدام طريقة المربعات الصغرى.

المحلول. هنا ن = 5
س ط = -2 + 0 + 1 + 2 + 4 = 5 ؛
س ط 2 = 4 + 0 + 1 + 4 + 16 = 25
س ط ص ط = -2 0.5 + 0 1 + 1 1.5 + 2 2 + 4 3 = 16.5
ص أنا = 0.5 + 1 + 1.5 + 2 + 3 = 8

والنظام العادي (2) له الشكل

لحل هذا النظام ، نحصل على: ب = 0.425 ، أ = 1.175. لذلك ص = 1.175 + 0.425 س.

مثال 2. هناك عينة من 10 ملاحظات للمؤشرات الاقتصادية (X) و (Y).

س ط 180 172 173 169 175 170 179 170 167 174
ذ أنا 186 180 176 171 182 166 182 172 169 177

مطلوب العثور على نموذج معادلة انحدار Y على X. قم ببناء عينة لخط الانحدار Y على X.

المحلول. 1. لنفرز البيانات حسب القيمتين x i و y i. نحصل على طاولة جديدة:

س ط 167 169 170 170 172 173 174 175 179 180
ذ أنا 169 171 166 172 180 176 177 182 182 186

لتبسيط العمليات الحسابية ، سنقوم بتجميع جدول حساب ندخل فيه القيم العددية اللازمة.

س ط ذ أنا س ط 2 س ط ص ط
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x أنا = 1729 أنا أنا = 1761 ∑x ط 2 299105 ∑x i y i = 304696
س = 172.9 ص = 176.1 س ط 2 = 29910.5 س ص = 30469.6

وفقًا للصيغة (4) ، نحسب معامل الانحدار

وبالصيغة (5)

وبالتالي ، فإن معادلة انحدار العينة تبدو مثل y = -59.34 + 1.3804x.
دعنا نرسم النقاط (x i؛ y i) على مستوى الإحداثيات ونضع علامة على خط الانحدار.


الشكل 4

يوضح الشكل 4 كيف توجد القيم الملاحظة بالنسبة إلى خط الانحدار. لتقدير انحرافات y i عن Y i عدديًا ، حيث y i هي قيم ملحوظة ، و Y i هي قيم يتم تحديدها بواسطة الانحدار ، سنقوم بعمل جدول:

س ط ذ أنا نعم أنا Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

يتم حساب قيم Y i وفقًا لمعادلة الانحدار.

يتم تفسير الانحراف الملحوظ لبعض القيم المرصودة عن خط الانحدار من خلال العدد القليل من الملاحظات. عند دراسة درجة الاعتماد الخطي لـ Y على X ، يتم أخذ عدد الملاحظات في الاعتبار. يتم تحديد قوة الاعتماد من خلال قيمة معامل الارتباط.

طريقة المربعات الصغرى هي واحدة من أكثر الطرق شيوعًا والأكثر تطورًا بسببها بساطة وكفاءة طرق تقدير معاملات الخطية. في الوقت نفسه ، يجب توخي الحذر عند استخدامه ، لأن النماذج التي تم إنشاؤها باستخدامه قد لا تلبي عددًا من المتطلبات لجودة معلماتها ، ونتيجة لذلك ، لا تعكس "جيدًا" أنماط تطوير العملية.

دعونا نفكر في إجراء تقدير معلمات نموذج الاقتصاد القياسي الخطي باستخدام طريقة المربعات الصغرى بمزيد من التفصيل. يمكن تمثيل هذا النموذج بشكل عام بالمعادلة (1.2):

y t = a 0 + a 1 x 1 t + ... + a n x nt + t.

البيانات الأولية عند تقدير المعلمات a 0 ، a 1 ، ... ، a n هي متجه قيم المتغير التابع ذ= (y 1، y 2، ...، y T) "ومصفوفة قيم المتغيرات المستقلة

حيث يتوافق العمود الأول المكون من الآحاد مع معامل النموذج.

حصلت طريقة المربعات الصغرى على اسمها بناءً على المبدأ الأساسي الذي يجب أن تفي به تقديرات المعلمات التي تم الحصول عليها على أساسها: يجب أن يكون مجموع المربعات لخطأ النموذج ضئيلاً.

أمثلة على حل المشكلات بطريقة المربعات الصغرى

مثال 2.1.تمتلك المؤسسة التجارية شبكة تتكون من 12 متجرًا ، وترد معلومات عن أنشطتها في الجدول. 2.1.

تود إدارة الشركة معرفة كيف يعتمد الحجم السنوي على منطقة المبيعات بالمخزن.

الجدول 2.1

رقم المحل

حجم الأعمال السنوي ، مليون روبل

منطقة التجارة ألف م 2

حل المربعات الصغرى.دعونا نحدد - حجم المبيعات السنوي لمتجر -th ، مليون روبل ؛ - مساحة البيع بالمخزن - الالف م 2.

الشكل 2.1. مخطط مبعثر للمثال 2.1

لتحديد شكل العلاقة الوظيفية بين المتغيرات وبناء مخطط مبعثر (الشكل 2.1).

استنادًا إلى الرسم البياني المبعثر ، يمكننا أن نستنتج أن حجم المبيعات السنوي يعتمد بشكل إيجابي على منطقة البيع (أي أن y ستزداد مع نمو). أنسب شكل من أشكال الاتصال الوظيفي - خطي.

يتم عرض معلومات لمزيد من العمليات الحسابية في الجدول. 2.2. باستخدام طريقة المربعات الصغرى ، قمنا بتقدير معاملات النموذج الاقتصادي القياسي الخطي أحادي العامل

الجدول 2.2

في هذا الطريق،

لذلك ، مع زيادة مساحة التجارة بمقدار 1000 متر مربع ، مع تساوي الأشياء الأخرى ، يزداد متوسط ​​حجم التداول السنوي بمقدار 67.8871 مليون روبل.

مثال 2.2.لاحظت إدارة المؤسسة أن حجم المبيعات السنوي لا يعتمد فقط على منطقة مبيعات المتجر (انظر المثال 2.1) ، ولكن أيضًا على متوسط ​​عدد الزوار. المعلومات ذات الصلة معروضة في الجدول. 2.3

الجدول 2.3

المحلول.دلالة - متوسط ​​عدد زوار المتجر في اليوم ، ألف شخص.

لتحديد شكل العلاقة الوظيفية بين المتغيرات وبناء مخطط مبعثر (الشكل 2.2).

استنادًا إلى الرسم التخطيطي المبعثر ، يمكننا أن نستنتج أن معدل الدوران السنوي يرتبط ارتباطًا إيجابيًا بمتوسط ​​عدد الزوار يوميًا (أي أن y ستزداد مع نمو). شكل الاعتماد الوظيفي خطي.

أرز. 2.2. مخطط مبعثر على سبيل المثال 2.2

الجدول 2.4

بشكل عام ، من الضروري تحديد معلمات نموذج الاقتصاد القياسي ذي العاملين

y t \ u003d a 0 + a 1 x 1 t + a 2 x 2 t + t

يتم عرض المعلومات المطلوبة لمزيد من العمليات الحسابية في الجدول. 2.4

دعونا نقدر معلمات نموذج اقتصادي قياسي خطي من عاملين باستخدام طريقة المربعات الصغرى.

في هذا الطريق،

يُظهر تقييم المعامل = 61.6583 أنه ، مع تساوي الأشياء الأخرى ، مع زيادة منطقة التداول بمقدار 1000 م 2 ، سيزداد حجم التداول السنوي بمعدل 61.6583 مليون روبل.

الذي يجد أوسع تطبيق في مختلف مجالات العلم والممارسة. يمكن أن تكون الفيزياء والكيمياء والبيولوجيا والاقتصاد وعلم الاجتماع وعلم النفس وما إلى ذلك. بإرادة القدر ، غالبًا ما أتعامل مع الاقتصاد ، وبالتالي سأرتب لك اليوم تذكرة إلى بلد رائع يسمى الاقتصاد القياسي=) ... كيف لا تريد ذلك ؟! إنه جيد جدًا هناك - عليك فقط أن تقرر! … ولكن ما تريده بالتأكيد هو أن تتعلم كيفية حل المشكلات المربعات الصغرى. وعلى وجه الخصوص ، سيتعلم القراء المجتهدون حلها ليس فقط بدقة ، ولكن أيضًا بسرعة كبيرة ؛-) ولكن أولاً بيان عام للمشكلة+ مثال ذو صلة:

دع المؤشرات تدرس في بعض المجالات التي لها تعبير كمي. في الوقت نفسه ، هناك كل الأسباب للاعتقاد بأن المؤشر يعتمد على المؤشر. يمكن أن يكون هذا الافتراض فرضية علمية وقائمة على الفطرة السليمة. دعونا نترك العلم جانبًا ، ونستكشف المزيد من المجالات الشهية - مثل محلات البقالة. للدلالة به:

- مساحة البيع بالتجزئة لمتجر بقالة ، متر مربع ،
- حجم المبيعات السنوي لمتجر بقالة مليون روبل.

من الواضح تمامًا أنه كلما زادت مساحة المتجر ، زاد حجم مبيعاته في معظم الحالات.

افترض أنه بعد إجراء الملاحظات / التجارب / الحسابات / الرقص باستخدام الدف ، لدينا بيانات رقمية تحت تصرفنا:

مع متاجر البقالة ، أعتقد أن كل شيء واضح: - هذه هي منطقة المتجر الأول ، - حجم مبيعاتها السنوي ، - مساحة المتجر الثاني ، - حجم مبيعاتها السنوية ، إلخ. بالمناسبة ، ليس من الضروري على الإطلاق الوصول إلى المواد المصنفة - يمكن الحصول على تقييم دقيق إلى حد ما لدوران باستخدام الإحصاء الرياضي. ومع ذلك ، لا تشتت انتباهك ، مسار التجسس التجاري مدفوع بالفعل =)

يمكن أيضًا كتابة البيانات الجدولية في شكل نقاط وتصويرها بالطريقة المعتادة بالنسبة لنا. النظام الديكارتي .

دعنا نجيب على سؤال مهم: كم عدد النقاط اللازمة لدراسة نوعية؟

كلما كان ذلك أفضل ، كلما كان ذلك أفضل. الحد الأدنى المسموح به للمجموعة يتكون من 5-6 نقاط. بالإضافة إلى ذلك ، مع وجود كمية صغيرة من البيانات ، لا ينبغي تضمين النتائج "غير الطبيعية" في العينة. لذلك ، على سبيل المثال ، يمكن لمتجر النخبة الصغير أن يساعد في تنفيذ أوامر من حيث الحجم أكبر من "زملائهم" ، مما يؤدي إلى تشويه النمط العام الذي يجب العثور عليه!

إذا كان الأمر بسيطًا للغاية ، فنحن بحاجة إلى اختيار وظيفة ، برنامجالذي يمر أقرب ما يمكن من النقاط . تسمى هذه الوظيفة تقريبي (تقريب - تقريب)أو الوظيفة النظرية . بشكل عام ، يظهر هنا على الفور "متظاهر" واضح - متعدد الحدود من الدرجة العالية ، يمر الرسم البياني الخاص به عبر جميع النقاط. لكن هذا الخيار معقد ، وغالبًا ما يكون غير صحيح. (لأن الرسم البياني سوف "ينفخ" طوال الوقت ويعكس بشكل سيء الاتجاه الرئيسي).

وبالتالي ، يجب أن تكون الوظيفة المرغوبة بسيطة بما فيه الكفاية وتعكس في نفس الوقت التبعية بشكل كافٍ. كما قد تتخيل ، تسمى إحدى طرق العثور على هذه الوظائف المربعات الصغرى. أولاً ، دعنا نحلل جوهرها بطريقة عامة. دع بعض الوظائف تقرب البيانات التجريبية:


كيف تقيم دقة هذا التقريب؟ دعونا نحسب أيضًا الفروق (الانحرافات) بين القيم التجريبية والوظيفية (ندرس الرسم). الفكرة الأولى التي تتبادر إلى الذهن هي تقدير حجم المجموع ، لكن المشكلة هي أن الاختلافات يمكن أن تكون سلبية. (فمثلا، ) والانحرافات نتيجة لهذا الجمع تلغي بعضها البعض. لذلك ، كتقدير لدقة التقريب ، فإنه يقترح نفسه لأخذ المجموع الوحداتالانحرافات:

أو في شكل مطوي: (فجأة ، من لا يعرف: هو رمز الجمع ، وهو متغير مساعد - "عداد" ، يأخذ القيم من 1 إلى).

من خلال تقريب النقاط التجريبية بوظائف مختلفة ، سنحصل على قيم مختلفة لـ ، ومن الواضح أنه عندما يكون هذا المجموع أصغر ، تكون هذه الوظيفة أكثر دقة.

مثل هذا الأسلوب موجود ويسمى طريقة المعامل الأقل. ومع ذلك ، فقد أصبح من الناحية العملية أكثر انتشارًا. طريقة التربيع الصغرى، حيث يتم التخلص من القيم السلبية المحتملة ليس بواسطة المعامل ، ولكن عن طريق تربيع الانحرافات:

، وبعد ذلك يتم توجيه الجهود لاختيار مثل هذه الوظيفة التي مجموع الانحرافات التربيعية كانت صغيرة بقدر الإمكان. في الواقع ، ومن هنا جاء اسم الطريقة.

والآن نعود إلى نقطة مهمة أخرى: كما هو مذكور أعلاه ، يجب أن تكون الوظيفة المحددة بسيطة للغاية - ولكن هناك أيضًا العديد من هذه الوظائف: خطي , القطعي, متسارع, لوغاريتمي, من الدرجة الثانية إلخ. وبالطبع أود هنا على الفور "تقليص مجال النشاط". أي فئة من الوظائف تختار للبحث؟ تقنية بدائية لكنها فعالة:

- أسهل طريقة لرسم النقاط على الرسم وتحليل موقعهم. إذا كانت تميل إلى أن تكون في خط مستقيم ، فعليك البحث عنها معادلة الخط المستقيم مع القيم المثلى و. بعبارة أخرى ، تتمثل المهمة في العثور على هذه المعاملات - بحيث يكون مجموع الانحرافات التربيعية هو الأصغر.

إذا كانت النقاط موجودة ، على سبيل المثال ، على طول مقارنة مبالغ فيها، فمن الواضح أن الدالة الخطية ستعطي تقريبًا ضعيفًا. في هذه الحالة ، نبحث عن أكثر المعاملات "ملاءمة" لمعادلة القطع الزائد - تلك التي تعطي الحد الأدنى لمجموع المربعات .

لاحظ الآن أننا نتحدث في كلتا الحالتين وظائف متغيرين، الحجج التي البحث عن خيارات التبعية:

وفي جوهرها ، نحتاج إلى حل مشكلة معيارية - لإيجاد على الأقل دالة من متغيرين.

تذكر مثالنا: لنفترض أن نقاط "المتجر" تميل إلى أن تكون موجودة في خط مستقيم وأن هناك كل الأسباب للاعتقاد بوجود الاعتماد الخطيدوران من منطقة التجارة. دعنا نجد معاملي هذه "أ" و "تكون" بحيث يكون مجموع الانحرافات التربيعية كان الأصغر. كل شيء كالمعتاد - أولاً المشتقات الجزئية من الدرجة الأولى. وفق القاعدة الخطيةيمكنك التفريق أسفل رمز المجموع:

إذا كنت ترغب في استخدام هذه المعلومات لمقال أو ورقة بحثية ، فسأكون ممتنًا جدًا للرابط الموجود في قائمة المصادر ، فلن تجد مثل هذه الحسابات التفصيلية في أي مكان:

لنصنع نظامًا قياسيًا:

نقوم باختزال كل معادلة بـ "اثنين" ، بالإضافة إلى "تفكيك" المجاميع:

ملحوظة : تحليل بشكل مستقل لماذا يمكن حذف "a" و "be" من رمز المجموع. بالمناسبة ، رسميًا يمكن عمل ذلك بالمجموع

دعنا نعيد كتابة النظام في شكل "تطبيقي":

وبعد ذلك يبدأ رسم خوارزمية حل مشكلتنا:

هل نعرف إحداثيات النقاط؟ نعلم. مسائل حسابية ممكن نجد بسهولة. نحن نؤلف أبسط نظام من معادلتين خطيتين مع مجهولين("a" و "beh"). نحل النظام ، على سبيل المثال ، طريقة كرامر، مما أدى إلى نقطة ثابتة. تدقيق حالة كافية لأقصى حد، يمكننا التحقق من أن الوظيفة في هذه المرحلة تصل بدقة الحد الأدنى. يرتبط التحقق بحسابات إضافية ، وبالتالي سنتركه وراء الكواليس. (إذا لزم الأمر ، يمكن عرض الإطار المفقود). نستخلص الاستنتاج النهائي:

دور أفضل طريقة (على الأقل مقارنة بأي دالة خطية أخرى)تقرب النقاط التجريبية . بشكل تقريبي ، يمر الرسم البياني الخاص به في أقرب وقت ممكن من هذه النقاط. في التقاليد الاقتصاد القياسيتسمى أيضًا وظيفة التقريب الناتجة معادلة الانحدار الخطي المقترنة .

المشكلة قيد النظر لها أهمية عملية كبيرة. في الحالة مع مثالنا ، المعادلة يسمح لك بالتنبؤ بنوع دوران ("yig")سيكون في المتجر بقيمة أو أخرى من قيمة منطقة البيع (معنى واحد أو آخر لـ "س"). نعم ، ستكون التوقعات الناتجة مجرد توقع ، ولكن في كثير من الحالات ستصبح دقيقة تمامًا.

سوف أقوم بتحليل مشكلة واحدة فقط بالأرقام "الحقيقية" ، حيث لا توجد صعوبات فيها - كل الحسابات تتم على مستوى المناهج الدراسية في الصفوف من 7 إلى 8. في 95 بالمائة من الحالات ، سيُطلب منك العثور على دالة خطية فقط ، لكن في نهاية المقالة سأوضح أنه لم يعد من الصعب العثور على معادلات القطع الزائد الأمثل والأس وبعض الدوال الأخرى.

في الواقع ، يبقى توزيع الأشياء الجيدة الموعودة - حتى تتعلم كيفية حل مثل هذه الأمثلة ليس فقط بدقة ، ولكن أيضًا بسرعة. ندرس بعناية المعيار:

مهمة

نتيجة لدراسة العلاقة بين مؤشرين ، تم الحصول على أزواج الأرقام التالية:

باستخدام طريقة المربعات الصغرى ، أوجد الدالة الخطية التي تقترب بشكل أفضل من العملية التجريبية (يختبر)بيانات. ارسم رسمًا ، في نظام إحداثيات مستطيل ديكارتي ، يرسم نقاطًا تجريبية ورسمًا بيانيًا للوظيفة التقريبية . أوجد مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. اكتشف ما إذا كانت الوظيفة أفضل (من حيث طريقة المربعات الصغرى)نقاط تجريبية تقريبية.

لاحظ أن قيم "x" هي قيم طبيعية ، وهذا له معنى مميز وذا معنى ، والذي سأتحدث عنه بعد قليل ؛ لكنها بالطبع يمكن أن تكون كسرية. بالإضافة إلى ذلك ، اعتمادًا على محتوى مهمة معينة ، يمكن أن تكون قيمتا "X" و "G" سالبة كليًا أو جزئيًا. حسنًا ، لقد تم تكليفنا بمهمة "مجهولة الهوية" ، ونبدأها المحلول:

نجد معاملات الوظيفة المثلى كحل للنظام:

لأغراض تدوين أكثر إحكاما ، يمكن حذف متغير "العداد" ، لأنه من الواضح بالفعل أن الجمع يتم من 1 إلى.

من الأنسب حساب المبالغ المطلوبة في شكل جدول:


يمكن إجراء الحسابات باستخدام آلة حاسبة صغيرة ، ولكن من الأفضل استخدام برنامج Excel - سواء بشكل أسرع أو بدون أخطاء ؛ شاهد فيديو قصير:

وهكذا ، نحصل على ما يلي النظام:

هنا يمكنك ضرب المعادلة الثانية في 3 و اطرح الثاني من مصطلح المعادلة الأول حسب المصطلح. لكن هذا هو الحظ - في الممارسة العملية ، غالبًا ما تكون الأنظمة غير موهوبة ، وفي مثل هذه الحالات يتم حفظها طريقة كرامر:
، لذلك فإن النظام لديه حل فريد.

لنقم بفحص. أتفهم أنني لا أريد ذلك ، لكن لماذا تتخطى الأخطاء حيث لا يمكنك تفويتها مطلقًا؟ عوّض عن الحل الموجود في الجانب الأيسر من كل معادلة في النظام:

يتم الحصول على الأجزاء الصحيحة من المعادلات المقابلة ، مما يعني أن النظام قد تم حله بشكل صحيح.

وبالتالي ، فإن وظيفة التقريب المطلوبة: - from جميع الوظائف الخطيةمن الأفضل تقريب البيانات التجريبية بواسطتها.

على عكس مستقيم اعتماد دوران المتجر على منطقته ، والاعتماد الموجود هو يعكس (مبدأ "الأكثر - الأقل")، ويتم الكشف عن هذه الحقيقة على الفور من خلال السلبية معامل الزاوي. دور يخبرنا أنه مع زيادة مؤشر معين بمقدار وحدة واحدة ، تنخفض قيمة المؤشر التابع معدلبمقدار 0.65 وحدة. كما يقولون ، كلما ارتفع سعر الحنطة السوداء ، قل بيعها.

لرسم دالة التقريب ، نجد اثنين من قيمها:

وتنفيذ الرسم:


يسمى الخط الذي تم إنشاؤه خط الاتجاه (أي ، خط الاتجاه الخطي ، أي في الحالة العامة ، الاتجاه ليس بالضرورة خطًا مستقيمًا). الجميع على دراية بتعبير "أن نكون في الاتجاه" ، وأعتقد أن هذا المصطلح لا يحتاج إلى تعليقات إضافية.

احسب مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. هندسيًا ، هذا هو مجموع مربعات أطوال المقاطع "القرمزية" (اثنان منها صغيرتان جدًا ولا يمكنك حتى رؤيتهما).

دعونا نلخص العمليات الحسابية في جدول:


يمكن تنفيذها يدويًا مرة أخرى ، فقط في حالة ما إذا سأقدم مثالاً للنقطة الأولى:

ولكن من الأكثر فاعلية القيام بالطريقة المعروفة بالفعل:

دعنا نكرر: ما معنى النتيجة؟من جميع الوظائف الخطيةوظيفة الأس هو الأصغر ، أي أنه أفضل تقريب في عائلته. وهنا ، بالمناسبة ، السؤال الأخير للمشكلة ليس عرضيًا: ماذا لو الوظيفة الأسية المقترحة هل سيكون من الأفضل تقريب النقاط التجريبية؟

دعنا نجد المجموع المقابل للانحرافات التربيعية - لتمييزها ، سأقوم بتعيينها بالحرف "إبسيلون". التقنية هي نفسها تمامًا:


ومرة أخرى لكل حساب حريق للنقطة الأولى:

في Excel ، نستخدم الوظيفة القياسية EXP (يمكن العثور على بناء الجملة في تعليمات Excel).

استنتاج: ، لذا فإن الدالة الأسية تقترب من النقاط التجريبية أسوأ من الخط المستقيم .

ولكن تجدر الإشارة هنا إلى أن "الأسوأ" هو لا يعني بعد، ما المشكله. لقد قمت الآن ببناء رسم بياني لهذه الدالة الأسية - وهو أيضًا يمر بالقرب من النقاط - لدرجة أنه بدون دراسة تحليلية يصعب تحديد الوظيفة الأكثر دقة.

هذا يكمل الحل ، وأعود إلى مسألة القيم الطبيعية للحجة. في دراسات مختلفة ، كقاعدة عامة ، يتم ترقيم الأشهر أو السنوات أو الفترات الزمنية المتساوية الأخرى بعلامة "X" طبيعية أو اقتصادية أو اجتماعية. ضع في اعتبارك ، على سبيل المثال ، مثل هذه المشكلة.

تتيح لك طريقة المربعات الصغرى (LSM) تقدير كميات مختلفة باستخدام نتائج العديد من القياسات التي تحتوي على أخطاء عشوائية.

خاصية MNC

الفكرة الرئيسية لهذه الطريقة هي أن مجموع الأخطاء التربيعية يعتبر معيارًا لدقة حل المشكلة ، والذي يسعى إلى تصغيره. عند استخدام هذه الطريقة ، يمكن تطبيق النهجين العددي والتحليلي.

على وجه الخصوص ، كتطبيق عددي ، تتضمن طريقة المربعات الصغرى إجراء أكبر عدد ممكن من القياسات لمتغير عشوائي غير معروف. علاوة على ذلك ، كلما زادت العمليات الحسابية ، كان الحل أكثر دقة. في هذه المجموعة من الحسابات (البيانات الأولية) ، يتم الحصول على مجموعة أخرى من الحلول المقترحة ، والتي يتم بعد ذلك تحديد أفضلها. إذا كانت مجموعة الحلول ذات معلمات ، فسيتم تقليل طريقة المربعات الصغرى لإيجاد القيمة المثلى للمعلمات.

كنهج تحليلي لتنفيذ LSM على مجموعة البيانات الأولية (القياسات) ومجموعة الحلول المقترحة ، يتم تعريف البعض (الوظيفية) ، والتي يمكن التعبير عنها من خلال صيغة تم الحصول عليها كفرضية معينة تحتاج إلى تأكيد. في هذه الحالة ، يتم تقليل طريقة المربعات الصغرى لإيجاد الحد الأدنى من هذه الوظيفة في مجموعة الأخطاء التربيعية للبيانات الأولية.

لاحظ أنه ليس الأخطاء نفسها ، بل مربعات الأخطاء. لماذا ا؟ الحقيقة هي أنه غالبًا ما تكون انحرافات القياسات عن القيمة الدقيقة موجبة وسالبة. عند تحديد المتوسط ​​، يمكن أن يؤدي الجمع البسيط إلى استنتاج غير صحيح حول جودة التقدير ، لأن الإلغاء المتبادل للقيم الإيجابية والسلبية سيقلل من قوة أخذ العينات لمجموعة القياسات. وبالتالي دقة التقييم.

لمنع حدوث ذلك ، يتم تلخيص الانحرافات التربيعية. أكثر من ذلك ، من أجل معادلة أبعاد القيمة المقاسة والتقدير النهائي ، يتم استخدام مجموع الأخطاء التربيعية لاستخراج

بعض تطبيقات الشركات متعددة الجنسيات

يستخدم MNC على نطاق واسع في مختلف المجالات. على سبيل المثال ، في نظرية الاحتمالات والإحصاءات الرياضية ، تُستخدم الطريقة لتحديد خاصية متغير عشوائي مثل الانحراف المعياري ، الذي يحدد عرض نطاق قيم المتغير العشوائي.

بعد المحاذاة ، نحصل على دالة بالشكل التالي: g (x) = x + 1 3 + 1.

يمكننا تقريب هذه البيانات بعلاقة خطية y = a x + b بحساب المعلمات المناسبة. للقيام بذلك ، سنحتاج إلى تطبيق ما يسمى بطريقة المربعات الصغرى. ستحتاج أيضًا إلى عمل رسم للتحقق من الخط الذي سيعمل على محاذاة البيانات التجريبية بشكل أفضل.

ما هو بالضبط OLS (طريقة المربعات الصغرى)

الشيء الرئيسي الذي يتعين علينا القيام به هو إيجاد معاملات الاعتماد الخطي التي عندها تكون قيمة دالة متغيرين F ​​(a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ستكون هي أصغر. بمعنى آخر ، بالنسبة لقيم معينة من a و b ، سيكون لمجموع الانحرافات التربيعية للبيانات المقدمة من الخط المستقيم الناتج قيمة دنيا. هذا هو معنى طريقة المربعات الصغرى. كل ما علينا فعله لحل هذا المثال هو إيجاد الحد الأقصى لدالة متغيرين.

كيفية اشتقاق الصيغ لحساب المعاملات

من أجل اشتقاق الصيغ لحساب المعاملات ، من الضروري تكوين وحل نظام من المعادلات بمتغيرين. للقيام بذلك ، نحسب المشتقات الجزئية للتعبير F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 بالنسبة إلى a و b ونساويهما بـ 0.

δ F (a، b) δ a = 0 δ F (a، b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0-2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

لحل نظام المعادلات ، يمكنك استخدام أي طرق ، مثل الاستبدال أو طريقة كرامر. نتيجة لذلك ، يجب أن نحصل على الصيغ التي تحسب المعاملات باستخدام طريقة المربعات الصغرى.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

لقد قمنا بحساب قيم المتغيرات التي تعمل من أجلها
F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ستأخذ القيمة الصغرى. في الفقرة الثالثة ، سنثبت سبب ذلك.

هذا هو تطبيق طريقة المربعات الصغرى في الممارسة العملية. تتضمن صيغته ، التي تُستخدم للعثور على المعلمة a ، ∑ i = 1 n x i ، ∑ i = 1 n y i ، ∑ i = 1 n x i y i ، ∑ i = 1 n x i 2 ، والمعلمة
ن - تشير إلى كمية البيانات التجريبية. ننصحك بحساب كل مبلغ على حدة. يتم حساب قيمة المعامل ب مباشرة بعد أ.

دعنا نعود إلى المثال الأصلي.

مثال 1

لدينا هنا n يساوي خمسة. لتسهيل حساب الكميات المطلوبة المدرجة في صيغ المعامل ، نقوم بملء الجدول.

أنا = 1 أنا = 2 أنا = 3 أنا = 4 أنا = 5 ∑ أنا = 1 5
س ط 0 1 2 4 5 12
ذ أنا 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
س ط ص ط 0 2 , 4 5 , 2 11 , 2 15 33 , 8
س ط 2 0 1 4 16 25 46

المحلول

يحتوي الصف الرابع على البيانات التي تم الحصول عليها بضرب القيم من الصف الثاني في قيم الصف الثالث لكل فرد i. يحتوي السطر الخامس على البيانات من المربع الثاني. يُظهر العمود الأخير مجاميع قيم الصفوف الفردية.

دعنا نستخدم طريقة المربعات الصغرى لحساب المعاملين a و b اللذين نحتاجهما. للقيام بذلك ، استبدل القيم المرغوبة من العمود الأخير وحساب المجاميع:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33، 8 - 12 12، 9 5 46 - 12 2 ب = 12، 9 - أ 12 5 أ ≈ 0، 165 ب ≈ 2، 184

لقد توصلنا إلى أن الخط المستقيم التقريبي المطلوب سيبدو مثل y = 0 ، 165 x + 2 ، 184. نحتاج الآن إلى تحديد الخط الأفضل لتقريب البيانات - g (x) = x + 1 3 + 1 أو 0، 165 x + 2، 184. لنقم بتقدير باستخدام طريقة المربعات الصغرى.

لحساب الخطأ ، نحتاج إلى إيجاد مجموع الانحرافات التربيعية للبيانات من الخطوط σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 و σ 2 = ∑ i = 1 n (y i - g (x i)) 2 ، تتوافق القيمة الدنيا مع سطر أكثر ملاءمة.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0، 165 x i + 2، 184)) 2 ≈ 0، 019 σ 2 = i = 1 n (y i - g (x i)) 2 = = i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0، 096

إجابه:منذ σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
ص = 0 ، 165 س + 2 ، 184.

تظهر طريقة المربعات الصغرى بوضوح في الرسم التوضيحي الرسومي. يشير الخط الأحمر إلى الخط المستقيم g (x) = x + 1 3 + 1 ، والخط الأزرق يشير إلى y = 0 ، 165 x + 2 ، 184. يتم تمييز البيانات الأولية بنقاط وردية اللون.

دعونا نوضح سبب الحاجة إلى تقديرات تقريبية من هذا النوع بالضبط.

يمكن استخدامها في المشكلات التي تتطلب تجانس البيانات ، وكذلك في المشكلات التي تحتاج فيها البيانات إلى الاستيفاء أو الاستقراء. على سبيل المثال ، في المشكلة التي نوقشت أعلاه ، يمكن للمرء أن يجد قيمة الكمية المرصودة y عند x = 3 أو عند x = 6. لقد خصصنا مقالة منفصلة لمثل هذه الأمثلة.

دليل على طريقة LSM

لكي تأخذ الوظيفة الحد الأدنى للقيمة عند حساب a و b ، من الضروري عند نقطة معينة أن تكون مصفوفة الصيغة التربيعية لتفاضل دالة النموذج F (a ، b) = ∑ i = 1 n (y i - (a x i + b)) 2 يكون تعريفًا موجبًا. دعنا نريك كيف يجب أن تبدو.

مثال 2

لدينا فارق من الدرجة الثانية بالشكل التالي:

د 2 و (أ ؛ ب) = δ 2 ف (أ ؛ ب) δ أ 2 د 2 أ + 2 2 ف (أ ؛ ب) δ أ δ ب د أ د ب + 2 و (أ ؛ ب) ب 2 د 2 ب

المحلول

δ 2 F (a؛ b) δ a 2 = δ F (a؛ b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a؛ b) δ a δ b = δ δ F (a؛ b) δ a δ b = = - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a؛ b) δ b 2 = δ F (a؛ b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + ب)) δ ب = 2 ∑ أنا = 1 ن (1) = 2 ن

بمعنى آخر ، يمكن كتابتها على النحو التالي: d 2 F (a ؛ b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

لقد حصلنا على مصفوفة من الصيغة التربيعية M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n.

في هذه الحالة ، لن تتغير قيم العناصر الفردية اعتمادًا على أ و ب. هل هذه المصفوفة إيجابية محددة؟ للإجابة على هذا السؤال ، دعنا نتحقق مما إذا كانت الزوايا الصغرى موجبة.

احسب الدرجة الأولى الزاوية الصغرى: 2 ∑ i = 1 n (x i) 2> 0. بما أن النقطتين x i لا تتطابقان ، فإن المتباينة صارمة. سنضع هذا في الاعتبار في مزيد من الحسابات.

نحسب الزاوية الصغرى من الدرجة الثانية:

د e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

بعد ذلك ننتقل إلى إثبات المتباينة n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0 باستخدام الاستقراء الرياضي.

  1. دعنا نتحقق مما إذا كانت هذه المتباينة صالحة لـ n التعسفي. لنأخذ 2 ونحسب:

2 ∑ i = 1 2 (x i) 2 - i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = س 1 + س 2 2> 0

حصلنا على المساواة الصحيحة (إذا لم تتطابق القيمتان x 1 و x 2).

  1. لنفترض أن عدم المساواة هذه ستكون صحيحة لـ n ، أي n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0 - صحيح.
  2. الآن دعنا نثبت صحة n + 1 ، أي أن (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2> 0 إذا n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0.

نحسب:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + x n + 1 2 - 2 x n + 1 × 2 + × 2 2 +. . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + (x n + 1 - x 1) 2 + (x n + 1) - × 2) 2 +. . . + (x n - 1 - x n) 2> 0

سيكون التعبير المحاط بأقواس معقوفة أكبر من 0 (بناءً على ما افترضناه في الخطوة 2) ، وستكون بقية المصطلحات أكبر من 0 لأنها كلها مربعات من الأرقام. لقد أثبتنا عدم المساواة.

إجابه:سيتوافق الموجودان a و b مع أصغر قيمة للدالة F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ، مما يعني أنها المعلمات المرغوبة لطريقة المربعات الصغرى (LSM).

إذا لاحظت وجود خطأ في النص ، فيرجى تمييزه والضغط على Ctrl + Enter

اختيار المحرر
الصحة الجنسية هي مفتاح الحياة الكاملة والنشطة لأي فرد من الجنس الأقوى. عندما يسير كل شيء على ما يرام "في هذا" ، فعندئذٍ أي ...

بالنسبة للكثيرين منا ، مادة الكوليسترول هي العدو الأول تقريبًا. نحاول الحد من تناوله بالطعام ، مع الأخذ في الاعتبار ...

يمكن أن تسبب القطرات أو الخطوط أو الجلطات الدموية في براز الطفل حالة حقيقية من الصدمة لدى الوالدين. ومع ذلك ، التسرع ...

أتاح التطور الحديث لعلم التغذية إمكانية التنويع الكبير في جدول أولئك الذين يراقبون أوزانهم. النظام الغذائي لفصيلة الدم 1 ...
القراءة 8 دقائق. المشاهدات 1.3k. ESR هو مؤشر معملي يعكس معدل ترسيب خلايا الدم الحمراء (كريات الدم الحمراء) ....
نقص صوديوم الدم هو حالة تحدث عندما يكون هناك مستوى منخفض بشكل غير طبيعي من الصوديوم في الدم. الصوديوم هو إلكتروليت ...
الحمل هو وقت رائع ، ولكنه في نفس الوقت مسؤول للغاية بالنسبة للمرأة. الحد الأدنى من المخاوف والوجبات السريعة وكل ما ...
داء فورونكولوس هو مرض معدي يتطور عندما تدخل بكتيريا مثل المكورات العنقودية الذهبية إلى الجسم. حضورها ...
لكل شخص الحق في أن يقرر ما إذا كان سيشرب الكحول أو أن يعيش حياة صحية. طبعا تأثير المشروبات الكحولية على ...