أين يتم تطبيق طريقة المربعات الصغرى؟ طريقة المربعات الصغرى في Excel. تحليل الانحدار انحدار المربعات الصغرى
اختيار نوع دالة الانحدار ، أي نوع النموذج المدروس لاعتماد Y على X (أو X على Y) ، على سبيل المثال ، نموذج خطي y x = a + bx ، من الضروري تحديد القيم المحددة لمعاملات النموذج.
لقيم مختلفة من a و b ، من الممكن بناء عدد لا حصر له من التبعيات بالشكل y x = a + bx ، أي ، هناك عدد لا حصر له من الأسطر على مستوى الإحداثيات ، لكننا بحاجة إلى مثل هذا الاعتماد الذي يتوافق مع القيم المرصودة بأفضل طريقة. وبالتالي ، يتم اختزال المشكلة في اختيار أفضل المعاملات.
نحن نبحث عن دالة خطية a + bx ، تعتمد فقط على عدد معين من الملاحظات المتاحة. للعثور على الوظيفة الأكثر ملاءمة للقيم الملاحظة ، نستخدم طريقة المربعات الصغرى.
دلالة: Y i - القيمة المحسوبة بالمعادلة Y i = a + bx i. y i - القيمة المقاسة ، ε i = y i -Y i - الفرق بين القيم المقاسة والمحسوبة ، ε i = y i -a-bx i.
تتطلب طريقة المربعات الصغرى أن يكون ε i ، الفرق بين y i المقاس وقيم Y i المحسوبة من المعادلة ، في حده الأدنى. لذلك ، نجد المعاملين a و b بحيث يكون مجموع الانحرافات التربيعية للقيم المرصودة من القيم الموجودة على خط الانحدار المستقيم هو الأصغر:
من خلال التحقيق في وظيفة الحجج هذه وبمساعدة المشتقات إلى أقصى حد ، يمكننا إثبات أن الدالة تأخذ قيمة دنيا إذا كان المعاملان a و b من حلول النظام:
(2)
إذا قسمنا طرفي المعادلات العادية على n ، نحصل على:
بشرط (3)
احصل على ، من هنا ، باستبدال قيمة a في المعادلة الأولى ، نحصل على:
في هذه الحالة ، يسمى b معامل الانحدار ؛ أ يسمى العضو الحر في معادلة الانحدار ويتم حسابه بواسطة الصيغة:
الخط المستقيم الناتج هو تقدير لخط الانحدار النظري. نملك:
لذا، هي معادلة انحدار خطي.
يمكن أن يكون الانحدار مباشرًا (b> 0) وعكسيًا (b مثال 1. نتائج قياس قيم X و Y معطاة في الجدول:
س ط | -2 | 0 | 1 | 2 | 4 |
ذ أنا | 0.5 | 1 | 1.5 | 2 | 3 |
بافتراض وجود علاقة خطية بين X و Y y = a + bx ، حدد المعاملين a و b باستخدام طريقة المربعات الصغرى.
المحلول. هنا ن = 5
س ط = -2 + 0 + 1 + 2 + 4 = 5 ؛
س ط 2 = 4 + 0 + 1 + 4 + 16 = 25
س ط ص ط = -2 0.5 + 0 1 + 1 1.5 + 2 2 + 4 3 = 16.5
ص أنا = 0.5 + 1 + 1.5 + 2 + 3 = 8
والنظام العادي (2) له الشكل
لحل هذا النظام ، نحصل على: ب = 0.425 ، أ = 1.175. لذلك ص = 1.175 + 0.425 س.
مثال 2. هناك عينة من 10 ملاحظات للمؤشرات الاقتصادية (X) و (Y).
س ط | 180 | 172 | 173 | 169 | 175 | 170 | 179 | 170 | 167 | 174 |
ذ أنا | 186 | 180 | 176 | 171 | 182 | 166 | 182 | 172 | 169 | 177 |
مطلوب العثور على نموذج معادلة انحدار Y على X. قم ببناء عينة لخط الانحدار Y على X.
المحلول. 1. لنفرز البيانات حسب القيمتين x i و y i. نحصل على طاولة جديدة:
س ط | 167 | 169 | 170 | 170 | 172 | 173 | 174 | 175 | 179 | 180 |
ذ أنا | 169 | 171 | 166 | 172 | 180 | 176 | 177 | 182 | 182 | 186 |
لتبسيط العمليات الحسابية ، سنقوم بتجميع جدول حساب ندخل فيه القيم العددية اللازمة.
س ط | ذ أنا | س ط 2 | س ط ص ط |
167 | 169 | 27889 | 28223 |
169 | 171 | 28561 | 28899 |
170 | 166 | 28900 | 28220 |
170 | 172 | 28900 | 29240 |
172 | 180 | 29584 | 30960 |
173 | 176 | 29929 | 30448 |
174 | 177 | 30276 | 30798 |
175 | 182 | 30625 | 31850 |
179 | 182 | 32041 | 32578 |
180 | 186 | 32400 | 33480 |
∑x أنا = 1729 | أنا أنا = 1761 | ∑x ط 2 299105 | ∑x i y i = 304696 |
س = 172.9 | ص = 176.1 | س ط 2 = 29910.5 | س ص = 30469.6 |
وفقًا للصيغة (4) ، نحسب معامل الانحدار
وبالصيغة (5)
وبالتالي ، فإن معادلة انحدار العينة تبدو مثل y = -59.34 + 1.3804x.
دعنا نرسم النقاط (x i؛ y i) على مستوى الإحداثيات ونضع علامة على خط الانحدار.
الشكل 4
يوضح الشكل 4 كيف توجد القيم الملاحظة بالنسبة إلى خط الانحدار. لتقدير انحرافات y i عن Y i عدديًا ، حيث y i هي قيم ملحوظة ، و Y i هي قيم يتم تحديدها بواسطة الانحدار ، سنقوم بعمل جدول:
س ط | ذ أنا | نعم أنا | Y i -y i |
167 | 169 | 168.055 | -0.945 |
169 | 171 | 170.778 | -0.222 |
170 | 166 | 172.140 | 6.140 |
170 | 172 | 172.140 | 0.140 |
172 | 180 | 174.863 | -5.137 |
173 | 176 | 176.225 | 0.225 |
174 | 177 | 177.587 | 0.587 |
175 | 182 | 178.949 | -3.051 |
179 | 182 | 184.395 | 2.395 |
180 | 186 | 185.757 | -0.243 |
يتم حساب قيم Y i وفقًا لمعادلة الانحدار.
يتم تفسير الانحراف الملحوظ لبعض القيم المرصودة عن خط الانحدار من خلال العدد القليل من الملاحظات. عند دراسة درجة الاعتماد الخطي لـ Y على X ، يتم أخذ عدد الملاحظات في الاعتبار. يتم تحديد قوة الاعتماد من خلال قيمة معامل الارتباط.
طريقة المربعات الصغرى هي واحدة من أكثر الطرق شيوعًا والأكثر تطورًا بسببها بساطة وكفاءة طرق تقدير معاملات الخطية. في الوقت نفسه ، يجب توخي الحذر عند استخدامه ، لأن النماذج التي تم إنشاؤها باستخدامه قد لا تلبي عددًا من المتطلبات لجودة معلماتها ، ونتيجة لذلك ، لا تعكس "جيدًا" أنماط تطوير العملية.
دعونا نفكر في إجراء تقدير معلمات نموذج الاقتصاد القياسي الخطي باستخدام طريقة المربعات الصغرى بمزيد من التفصيل. يمكن تمثيل هذا النموذج بشكل عام بالمعادلة (1.2):
y t = a 0 + a 1 x 1 t + ... + a n x nt + t.
البيانات الأولية عند تقدير المعلمات a 0 ، a 1 ، ... ، a n هي متجه قيم المتغير التابع ذ= (y 1، y 2، ...، y T) "ومصفوفة قيم المتغيرات المستقلة
حيث يتوافق العمود الأول المكون من الآحاد مع معامل النموذج.
حصلت طريقة المربعات الصغرى على اسمها بناءً على المبدأ الأساسي الذي يجب أن تفي به تقديرات المعلمات التي تم الحصول عليها على أساسها: يجب أن يكون مجموع المربعات لخطأ النموذج ضئيلاً.
أمثلة على حل المشكلات بطريقة المربعات الصغرى
مثال 2.1.تمتلك المؤسسة التجارية شبكة تتكون من 12 متجرًا ، وترد معلومات عن أنشطتها في الجدول. 2.1.
تود إدارة الشركة معرفة كيف يعتمد الحجم السنوي على منطقة المبيعات بالمخزن.
الجدول 2.1
رقم المحل |
حجم الأعمال السنوي ، مليون روبل |
منطقة التجارة ألف م 2 |
حل المربعات الصغرى.دعونا نحدد - حجم المبيعات السنوي لمتجر -th ، مليون روبل ؛ - مساحة البيع بالمخزن - الالف م 2.
الشكل 2.1. مخطط مبعثر للمثال 2.1
لتحديد شكل العلاقة الوظيفية بين المتغيرات وبناء مخطط مبعثر (الشكل 2.1).
استنادًا إلى الرسم البياني المبعثر ، يمكننا أن نستنتج أن حجم المبيعات السنوي يعتمد بشكل إيجابي على منطقة البيع (أي أن y ستزداد مع نمو). أنسب شكل من أشكال الاتصال الوظيفي - خطي.
يتم عرض معلومات لمزيد من العمليات الحسابية في الجدول. 2.2. باستخدام طريقة المربعات الصغرى ، قمنا بتقدير معاملات النموذج الاقتصادي القياسي الخطي أحادي العامل
الجدول 2.2
في هذا الطريق،
لذلك ، مع زيادة مساحة التجارة بمقدار 1000 متر مربع ، مع تساوي الأشياء الأخرى ، يزداد متوسط حجم التداول السنوي بمقدار 67.8871 مليون روبل.
مثال 2.2.لاحظت إدارة المؤسسة أن حجم المبيعات السنوي لا يعتمد فقط على منطقة مبيعات المتجر (انظر المثال 2.1) ، ولكن أيضًا على متوسط عدد الزوار. المعلومات ذات الصلة معروضة في الجدول. 2.3
الجدول 2.3
المحلول.دلالة - متوسط عدد زوار المتجر في اليوم ، ألف شخص.
لتحديد شكل العلاقة الوظيفية بين المتغيرات وبناء مخطط مبعثر (الشكل 2.2).
استنادًا إلى الرسم التخطيطي المبعثر ، يمكننا أن نستنتج أن معدل الدوران السنوي يرتبط ارتباطًا إيجابيًا بمتوسط عدد الزوار يوميًا (أي أن y ستزداد مع نمو). شكل الاعتماد الوظيفي خطي.
أرز. 2.2. مخطط مبعثر على سبيل المثال 2.2
الجدول 2.4
بشكل عام ، من الضروري تحديد معلمات نموذج الاقتصاد القياسي ذي العاملين
y t \ u003d a 0 + a 1 x 1 t + a 2 x 2 t + t
يتم عرض المعلومات المطلوبة لمزيد من العمليات الحسابية في الجدول. 2.4
دعونا نقدر معلمات نموذج اقتصادي قياسي خطي من عاملين باستخدام طريقة المربعات الصغرى.
في هذا الطريق،
يُظهر تقييم المعامل = 61.6583 أنه ، مع تساوي الأشياء الأخرى ، مع زيادة منطقة التداول بمقدار 1000 م 2 ، سيزداد حجم التداول السنوي بمعدل 61.6583 مليون روبل.
الذي يجد أوسع تطبيق في مختلف مجالات العلم والممارسة. يمكن أن تكون الفيزياء والكيمياء والبيولوجيا والاقتصاد وعلم الاجتماع وعلم النفس وما إلى ذلك. بإرادة القدر ، غالبًا ما أتعامل مع الاقتصاد ، وبالتالي سأرتب لك اليوم تذكرة إلى بلد رائع يسمى الاقتصاد القياسي=) ... كيف لا تريد ذلك ؟! إنه جيد جدًا هناك - عليك فقط أن تقرر! … ولكن ما تريده بالتأكيد هو أن تتعلم كيفية حل المشكلات المربعات الصغرى. وعلى وجه الخصوص ، سيتعلم القراء المجتهدون حلها ليس فقط بدقة ، ولكن أيضًا بسرعة كبيرة ؛-) ولكن أولاً بيان عام للمشكلة+ مثال ذو صلة:
دع المؤشرات تدرس في بعض المجالات التي لها تعبير كمي. في الوقت نفسه ، هناك كل الأسباب للاعتقاد بأن المؤشر يعتمد على المؤشر. يمكن أن يكون هذا الافتراض فرضية علمية وقائمة على الفطرة السليمة. دعونا نترك العلم جانبًا ، ونستكشف المزيد من المجالات الشهية - مثل محلات البقالة. للدلالة به:
- مساحة البيع بالتجزئة لمتجر بقالة ، متر مربع ،
- حجم المبيعات السنوي لمتجر بقالة مليون روبل.
من الواضح تمامًا أنه كلما زادت مساحة المتجر ، زاد حجم مبيعاته في معظم الحالات.
افترض أنه بعد إجراء الملاحظات / التجارب / الحسابات / الرقص باستخدام الدف ، لدينا بيانات رقمية تحت تصرفنا:
مع متاجر البقالة ، أعتقد أن كل شيء واضح: - هذه هي منطقة المتجر الأول ، - حجم مبيعاتها السنوي ، - مساحة المتجر الثاني ، - حجم مبيعاتها السنوية ، إلخ. بالمناسبة ، ليس من الضروري على الإطلاق الوصول إلى المواد المصنفة - يمكن الحصول على تقييم دقيق إلى حد ما لدوران باستخدام الإحصاء الرياضي. ومع ذلك ، لا تشتت انتباهك ، مسار التجسس التجاري مدفوع بالفعل =)
يمكن أيضًا كتابة البيانات الجدولية في شكل نقاط وتصويرها بالطريقة المعتادة بالنسبة لنا. النظام الديكارتي .
دعنا نجيب على سؤال مهم: كم عدد النقاط اللازمة لدراسة نوعية؟
كلما كان ذلك أفضل ، كلما كان ذلك أفضل. الحد الأدنى المسموح به للمجموعة يتكون من 5-6 نقاط. بالإضافة إلى ذلك ، مع وجود كمية صغيرة من البيانات ، لا ينبغي تضمين النتائج "غير الطبيعية" في العينة. لذلك ، على سبيل المثال ، يمكن لمتجر النخبة الصغير أن يساعد في تنفيذ أوامر من حيث الحجم أكبر من "زملائهم" ، مما يؤدي إلى تشويه النمط العام الذي يجب العثور عليه!
إذا كان الأمر بسيطًا للغاية ، فنحن بحاجة إلى اختيار وظيفة ، برنامجالذي يمر أقرب ما يمكن من النقاط . تسمى هذه الوظيفة تقريبي (تقريب - تقريب)أو الوظيفة النظرية . بشكل عام ، يظهر هنا على الفور "متظاهر" واضح - متعدد الحدود من الدرجة العالية ، يمر الرسم البياني الخاص به عبر جميع النقاط. لكن هذا الخيار معقد ، وغالبًا ما يكون غير صحيح. (لأن الرسم البياني سوف "ينفخ" طوال الوقت ويعكس بشكل سيء الاتجاه الرئيسي).
وبالتالي ، يجب أن تكون الوظيفة المرغوبة بسيطة بما فيه الكفاية وتعكس في نفس الوقت التبعية بشكل كافٍ. كما قد تتخيل ، تسمى إحدى طرق العثور على هذه الوظائف المربعات الصغرى. أولاً ، دعنا نحلل جوهرها بطريقة عامة. دع بعض الوظائف تقرب البيانات التجريبية:
كيف تقيم دقة هذا التقريب؟ دعونا نحسب أيضًا الفروق (الانحرافات) بين القيم التجريبية والوظيفية (ندرس الرسم). الفكرة الأولى التي تتبادر إلى الذهن هي تقدير حجم المجموع ، لكن المشكلة هي أن الاختلافات يمكن أن تكون سلبية. (فمثلا، )
والانحرافات نتيجة لهذا الجمع تلغي بعضها البعض. لذلك ، كتقدير لدقة التقريب ، فإنه يقترح نفسه لأخذ المجموع الوحداتالانحرافات:
أو في شكل مطوي: (فجأة ، من لا يعرف: هو رمز الجمع ، وهو متغير مساعد - "عداد" ، يأخذ القيم من 1 إلى).
من خلال تقريب النقاط التجريبية بوظائف مختلفة ، سنحصل على قيم مختلفة لـ ، ومن الواضح أنه عندما يكون هذا المجموع أصغر ، تكون هذه الوظيفة أكثر دقة.
مثل هذا الأسلوب موجود ويسمى طريقة المعامل الأقل. ومع ذلك ، فقد أصبح من الناحية العملية أكثر انتشارًا. طريقة التربيع الصغرى، حيث يتم التخلص من القيم السلبية المحتملة ليس بواسطة المعامل ، ولكن عن طريق تربيع الانحرافات:
، وبعد ذلك يتم توجيه الجهود لاختيار مثل هذه الوظيفة التي مجموع الانحرافات التربيعية كانت صغيرة بقدر الإمكان. في الواقع ، ومن هنا جاء اسم الطريقة.
والآن نعود إلى نقطة مهمة أخرى: كما هو مذكور أعلاه ، يجب أن تكون الوظيفة المحددة بسيطة للغاية - ولكن هناك أيضًا العديد من هذه الوظائف: خطي , القطعي, متسارع, لوغاريتمي, من الدرجة الثانية إلخ. وبالطبع أود هنا على الفور "تقليص مجال النشاط". أي فئة من الوظائف تختار للبحث؟ تقنية بدائية لكنها فعالة:
- أسهل طريقة لرسم النقاط على الرسم وتحليل موقعهم. إذا كانت تميل إلى أن تكون في خط مستقيم ، فعليك البحث عنها معادلة الخط المستقيم مع القيم المثلى و. بعبارة أخرى ، تتمثل المهمة في العثور على هذه المعاملات - بحيث يكون مجموع الانحرافات التربيعية هو الأصغر.
إذا كانت النقاط موجودة ، على سبيل المثال ، على طول مقارنة مبالغ فيها، فمن الواضح أن الدالة الخطية ستعطي تقريبًا ضعيفًا. في هذه الحالة ، نبحث عن أكثر المعاملات "ملاءمة" لمعادلة القطع الزائد - تلك التي تعطي الحد الأدنى لمجموع المربعات .
لاحظ الآن أننا نتحدث في كلتا الحالتين وظائف متغيرين، الحجج التي البحث عن خيارات التبعية:
وفي جوهرها ، نحتاج إلى حل مشكلة معيارية - لإيجاد على الأقل دالة من متغيرين.
تذكر مثالنا: لنفترض أن نقاط "المتجر" تميل إلى أن تكون موجودة في خط مستقيم وأن هناك كل الأسباب للاعتقاد بوجود الاعتماد الخطيدوران من منطقة التجارة. دعنا نجد معاملي هذه "أ" و "تكون" بحيث يكون مجموع الانحرافات التربيعية كان الأصغر. كل شيء كالمعتاد - أولاً المشتقات الجزئية من الدرجة الأولى. وفق القاعدة الخطيةيمكنك التفريق أسفل رمز المجموع:
إذا كنت ترغب في استخدام هذه المعلومات لمقال أو ورقة بحثية ، فسأكون ممتنًا جدًا للرابط الموجود في قائمة المصادر ، فلن تجد مثل هذه الحسابات التفصيلية في أي مكان:
لنصنع نظامًا قياسيًا:
نقوم باختزال كل معادلة بـ "اثنين" ، بالإضافة إلى "تفكيك" المجاميع:
ملحوظة : تحليل بشكل مستقل لماذا يمكن حذف "a" و "be" من رمز المجموع. بالمناسبة ، رسميًا يمكن عمل ذلك بالمجموع
دعنا نعيد كتابة النظام في شكل "تطبيقي":
وبعد ذلك يبدأ رسم خوارزمية حل مشكلتنا:
هل نعرف إحداثيات النقاط؟ نعلم. مسائل حسابية ممكن نجد بسهولة. نحن نؤلف أبسط نظام من معادلتين خطيتين مع مجهولين("a" و "beh"). نحل النظام ، على سبيل المثال ، طريقة كرامر، مما أدى إلى نقطة ثابتة. تدقيق حالة كافية لأقصى حد، يمكننا التحقق من أن الوظيفة في هذه المرحلة تصل بدقة الحد الأدنى. يرتبط التحقق بحسابات إضافية ، وبالتالي سنتركه وراء الكواليس. (إذا لزم الأمر ، يمكن عرض الإطار المفقود). نستخلص الاستنتاج النهائي:
دور أفضل طريقة (على الأقل مقارنة بأي دالة خطية أخرى)تقرب النقاط التجريبية . بشكل تقريبي ، يمر الرسم البياني الخاص به في أقرب وقت ممكن من هذه النقاط. في التقاليد الاقتصاد القياسيتسمى أيضًا وظيفة التقريب الناتجة معادلة الانحدار الخطي المقترنة .
المشكلة قيد النظر لها أهمية عملية كبيرة. في الحالة مع مثالنا ، المعادلة يسمح لك بالتنبؤ بنوع دوران ("yig")سيكون في المتجر بقيمة أو أخرى من قيمة منطقة البيع (معنى واحد أو آخر لـ "س"). نعم ، ستكون التوقعات الناتجة مجرد توقع ، ولكن في كثير من الحالات ستصبح دقيقة تمامًا.
سوف أقوم بتحليل مشكلة واحدة فقط بالأرقام "الحقيقية" ، حيث لا توجد صعوبات فيها - كل الحسابات تتم على مستوى المناهج الدراسية في الصفوف من 7 إلى 8. في 95 بالمائة من الحالات ، سيُطلب منك العثور على دالة خطية فقط ، لكن في نهاية المقالة سأوضح أنه لم يعد من الصعب العثور على معادلات القطع الزائد الأمثل والأس وبعض الدوال الأخرى.
في الواقع ، يبقى توزيع الأشياء الجيدة الموعودة - حتى تتعلم كيفية حل مثل هذه الأمثلة ليس فقط بدقة ، ولكن أيضًا بسرعة. ندرس بعناية المعيار:
مهمة
نتيجة لدراسة العلاقة بين مؤشرين ، تم الحصول على أزواج الأرقام التالية:
باستخدام طريقة المربعات الصغرى ، أوجد الدالة الخطية التي تقترب بشكل أفضل من العملية التجريبية (يختبر)بيانات. ارسم رسمًا ، في نظام إحداثيات مستطيل ديكارتي ، يرسم نقاطًا تجريبية ورسمًا بيانيًا للوظيفة التقريبية . أوجد مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. اكتشف ما إذا كانت الوظيفة أفضل (من حيث طريقة المربعات الصغرى)نقاط تجريبية تقريبية.
لاحظ أن قيم "x" هي قيم طبيعية ، وهذا له معنى مميز وذا معنى ، والذي سأتحدث عنه بعد قليل ؛ لكنها بالطبع يمكن أن تكون كسرية. بالإضافة إلى ذلك ، اعتمادًا على محتوى مهمة معينة ، يمكن أن تكون قيمتا "X" و "G" سالبة كليًا أو جزئيًا. حسنًا ، لقد تم تكليفنا بمهمة "مجهولة الهوية" ، ونبدأها المحلول:
نجد معاملات الوظيفة المثلى كحل للنظام:
لأغراض تدوين أكثر إحكاما ، يمكن حذف متغير "العداد" ، لأنه من الواضح بالفعل أن الجمع يتم من 1 إلى.
من الأنسب حساب المبالغ المطلوبة في شكل جدول:
يمكن إجراء الحسابات باستخدام آلة حاسبة صغيرة ، ولكن من الأفضل استخدام برنامج Excel - سواء بشكل أسرع أو بدون أخطاء ؛ شاهد فيديو قصير:
وهكذا ، نحصل على ما يلي النظام:
هنا يمكنك ضرب المعادلة الثانية في 3 و اطرح الثاني من مصطلح المعادلة الأول حسب المصطلح. لكن هذا هو الحظ - في الممارسة العملية ، غالبًا ما تكون الأنظمة غير موهوبة ، وفي مثل هذه الحالات يتم حفظها طريقة كرامر:
، لذلك فإن النظام لديه حل فريد.
لنقم بفحص. أتفهم أنني لا أريد ذلك ، لكن لماذا تتخطى الأخطاء حيث لا يمكنك تفويتها مطلقًا؟ عوّض عن الحل الموجود في الجانب الأيسر من كل معادلة في النظام:
يتم الحصول على الأجزاء الصحيحة من المعادلات المقابلة ، مما يعني أن النظام قد تم حله بشكل صحيح.
وبالتالي ، فإن وظيفة التقريب المطلوبة: - from جميع الوظائف الخطيةمن الأفضل تقريب البيانات التجريبية بواسطتها.
على عكس مستقيم اعتماد دوران المتجر على منطقته ، والاعتماد الموجود هو يعكس (مبدأ "الأكثر - الأقل")، ويتم الكشف عن هذه الحقيقة على الفور من خلال السلبية معامل الزاوي. دور يخبرنا أنه مع زيادة مؤشر معين بمقدار وحدة واحدة ، تنخفض قيمة المؤشر التابع معدلبمقدار 0.65 وحدة. كما يقولون ، كلما ارتفع سعر الحنطة السوداء ، قل بيعها.
لرسم دالة التقريب ، نجد اثنين من قيمها:
وتنفيذ الرسم:
يسمى الخط الذي تم إنشاؤه خط الاتجاه
(أي ، خط الاتجاه الخطي ، أي في الحالة العامة ، الاتجاه ليس بالضرورة خطًا مستقيمًا). الجميع على دراية بتعبير "أن نكون في الاتجاه" ، وأعتقد أن هذا المصطلح لا يحتاج إلى تعليقات إضافية.
احسب مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. هندسيًا ، هذا هو مجموع مربعات أطوال المقاطع "القرمزية" (اثنان منها صغيرتان جدًا ولا يمكنك حتى رؤيتهما).
دعونا نلخص العمليات الحسابية في جدول:
يمكن تنفيذها يدويًا مرة أخرى ، فقط في حالة ما إذا سأقدم مثالاً للنقطة الأولى:
ولكن من الأكثر فاعلية القيام بالطريقة المعروفة بالفعل:
دعنا نكرر: ما معنى النتيجة؟من جميع الوظائف الخطيةوظيفة الأس هو الأصغر ، أي أنه أفضل تقريب في عائلته. وهنا ، بالمناسبة ، السؤال الأخير للمشكلة ليس عرضيًا: ماذا لو الوظيفة الأسية المقترحة هل سيكون من الأفضل تقريب النقاط التجريبية؟
دعنا نجد المجموع المقابل للانحرافات التربيعية - لتمييزها ، سأقوم بتعيينها بالحرف "إبسيلون". التقنية هي نفسها تمامًا:
ومرة أخرى لكل حساب حريق للنقطة الأولى:
في Excel ، نستخدم الوظيفة القياسية EXP (يمكن العثور على بناء الجملة في تعليمات Excel).
استنتاج: ، لذا فإن الدالة الأسية تقترب من النقاط التجريبية أسوأ من الخط المستقيم .
ولكن تجدر الإشارة هنا إلى أن "الأسوأ" هو لا يعني بعد، ما المشكله. لقد قمت الآن ببناء رسم بياني لهذه الدالة الأسية - وهو أيضًا يمر بالقرب من النقاط - لدرجة أنه بدون دراسة تحليلية يصعب تحديد الوظيفة الأكثر دقة.
هذا يكمل الحل ، وأعود إلى مسألة القيم الطبيعية للحجة. في دراسات مختلفة ، كقاعدة عامة ، يتم ترقيم الأشهر أو السنوات أو الفترات الزمنية المتساوية الأخرى بعلامة "X" طبيعية أو اقتصادية أو اجتماعية. ضع في اعتبارك ، على سبيل المثال ، مثل هذه المشكلة.
تتيح لك طريقة المربعات الصغرى (LSM) تقدير كميات مختلفة باستخدام نتائج العديد من القياسات التي تحتوي على أخطاء عشوائية.
خاصية MNC
الفكرة الرئيسية لهذه الطريقة هي أن مجموع الأخطاء التربيعية يعتبر معيارًا لدقة حل المشكلة ، والذي يسعى إلى تصغيره. عند استخدام هذه الطريقة ، يمكن تطبيق النهجين العددي والتحليلي.
على وجه الخصوص ، كتطبيق عددي ، تتضمن طريقة المربعات الصغرى إجراء أكبر عدد ممكن من القياسات لمتغير عشوائي غير معروف. علاوة على ذلك ، كلما زادت العمليات الحسابية ، كان الحل أكثر دقة. في هذه المجموعة من الحسابات (البيانات الأولية) ، يتم الحصول على مجموعة أخرى من الحلول المقترحة ، والتي يتم بعد ذلك تحديد أفضلها. إذا كانت مجموعة الحلول ذات معلمات ، فسيتم تقليل طريقة المربعات الصغرى لإيجاد القيمة المثلى للمعلمات.
كنهج تحليلي لتنفيذ LSM على مجموعة البيانات الأولية (القياسات) ومجموعة الحلول المقترحة ، يتم تعريف البعض (الوظيفية) ، والتي يمكن التعبير عنها من خلال صيغة تم الحصول عليها كفرضية معينة تحتاج إلى تأكيد. في هذه الحالة ، يتم تقليل طريقة المربعات الصغرى لإيجاد الحد الأدنى من هذه الوظيفة في مجموعة الأخطاء التربيعية للبيانات الأولية.
لاحظ أنه ليس الأخطاء نفسها ، بل مربعات الأخطاء. لماذا ا؟ الحقيقة هي أنه غالبًا ما تكون انحرافات القياسات عن القيمة الدقيقة موجبة وسالبة. عند تحديد المتوسط ، يمكن أن يؤدي الجمع البسيط إلى استنتاج غير صحيح حول جودة التقدير ، لأن الإلغاء المتبادل للقيم الإيجابية والسلبية سيقلل من قوة أخذ العينات لمجموعة القياسات. وبالتالي دقة التقييم.
لمنع حدوث ذلك ، يتم تلخيص الانحرافات التربيعية. أكثر من ذلك ، من أجل معادلة أبعاد القيمة المقاسة والتقدير النهائي ، يتم استخدام مجموع الأخطاء التربيعية لاستخراج
بعض تطبيقات الشركات متعددة الجنسيات
يستخدم MNC على نطاق واسع في مختلف المجالات. على سبيل المثال ، في نظرية الاحتمالات والإحصاءات الرياضية ، تُستخدم الطريقة لتحديد خاصية متغير عشوائي مثل الانحراف المعياري ، الذي يحدد عرض نطاق قيم المتغير العشوائي.
بعد المحاذاة ، نحصل على دالة بالشكل التالي: g (x) = x + 1 3 + 1.
يمكننا تقريب هذه البيانات بعلاقة خطية y = a x + b بحساب المعلمات المناسبة. للقيام بذلك ، سنحتاج إلى تطبيق ما يسمى بطريقة المربعات الصغرى. ستحتاج أيضًا إلى عمل رسم للتحقق من الخط الذي سيعمل على محاذاة البيانات التجريبية بشكل أفضل.
ما هو بالضبط OLS (طريقة المربعات الصغرى)
الشيء الرئيسي الذي يتعين علينا القيام به هو إيجاد معاملات الاعتماد الخطي التي عندها تكون قيمة دالة متغيرين F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ستكون هي أصغر. بمعنى آخر ، بالنسبة لقيم معينة من a و b ، سيكون لمجموع الانحرافات التربيعية للبيانات المقدمة من الخط المستقيم الناتج قيمة دنيا. هذا هو معنى طريقة المربعات الصغرى. كل ما علينا فعله لحل هذا المثال هو إيجاد الحد الأقصى لدالة متغيرين.
كيفية اشتقاق الصيغ لحساب المعاملات
من أجل اشتقاق الصيغ لحساب المعاملات ، من الضروري تكوين وحل نظام من المعادلات بمتغيرين. للقيام بذلك ، نحسب المشتقات الجزئية للتعبير F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 بالنسبة إلى a و b ونساويهما بـ 0.
δ F (a، b) δ a = 0 δ F (a، b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0-2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i
لحل نظام المعادلات ، يمكنك استخدام أي طرق ، مثل الاستبدال أو طريقة كرامر. نتيجة لذلك ، يجب أن نحصل على الصيغ التي تحسب المعاملات باستخدام طريقة المربعات الصغرى.
n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n
لقد قمنا بحساب قيم المتغيرات التي تعمل من أجلها
F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ستأخذ القيمة الصغرى. في الفقرة الثالثة ، سنثبت سبب ذلك.
هذا هو تطبيق طريقة المربعات الصغرى في الممارسة العملية. تتضمن صيغته ، التي تُستخدم للعثور على المعلمة a ، ∑ i = 1 n x i ، ∑ i = 1 n y i ، ∑ i = 1 n x i y i ، ∑ i = 1 n x i 2 ، والمعلمة
ن - تشير إلى كمية البيانات التجريبية. ننصحك بحساب كل مبلغ على حدة. يتم حساب قيمة المعامل ب مباشرة بعد أ.
دعنا نعود إلى المثال الأصلي.
مثال 1
لدينا هنا n يساوي خمسة. لتسهيل حساب الكميات المطلوبة المدرجة في صيغ المعامل ، نقوم بملء الجدول.
أنا = 1 | أنا = 2 | أنا = 3 | أنا = 4 | أنا = 5 | ∑ أنا = 1 5 | |
س ط | 0 | 1 | 2 | 4 | 5 | 12 |
ذ أنا | 2 , 1 | 2 , 4 | 2 , 6 | 2 , 8 | 3 | 12 , 9 |
س ط ص ط | 0 | 2 , 4 | 5 , 2 | 11 , 2 | 15 | 33 , 8 |
س ط 2 | 0 | 1 | 4 | 16 | 25 | 46 |
المحلول
يحتوي الصف الرابع على البيانات التي تم الحصول عليها بضرب القيم من الصف الثاني في قيم الصف الثالث لكل فرد i. يحتوي السطر الخامس على البيانات من المربع الثاني. يُظهر العمود الأخير مجاميع قيم الصفوف الفردية.
دعنا نستخدم طريقة المربعات الصغرى لحساب المعاملين a و b اللذين نحتاجهما. للقيام بذلك ، استبدل القيم المرغوبة من العمود الأخير وحساب المجاميع:
n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33، 8 - 12 12، 9 5 46 - 12 2 ب = 12، 9 - أ 12 5 أ ≈ 0، 165 ب ≈ 2، 184
لقد توصلنا إلى أن الخط المستقيم التقريبي المطلوب سيبدو مثل y = 0 ، 165 x + 2 ، 184. نحتاج الآن إلى تحديد الخط الأفضل لتقريب البيانات - g (x) = x + 1 3 + 1 أو 0، 165 x + 2، 184. لنقم بتقدير باستخدام طريقة المربعات الصغرى.
لحساب الخطأ ، نحتاج إلى إيجاد مجموع الانحرافات التربيعية للبيانات من الخطوط σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 و σ 2 = ∑ i = 1 n (y i - g (x i)) 2 ، تتوافق القيمة الدنيا مع سطر أكثر ملاءمة.
σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0، 165 x i + 2، 184)) 2 ≈ 0، 019 σ 2 = i = 1 n (y i - g (x i)) 2 = = i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0، 096
إجابه:منذ σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
ص = 0 ، 165 س + 2 ، 184.
تظهر طريقة المربعات الصغرى بوضوح في الرسم التوضيحي الرسومي. يشير الخط الأحمر إلى الخط المستقيم g (x) = x + 1 3 + 1 ، والخط الأزرق يشير إلى y = 0 ، 165 x + 2 ، 184. يتم تمييز البيانات الأولية بنقاط وردية اللون.
دعونا نوضح سبب الحاجة إلى تقديرات تقريبية من هذا النوع بالضبط.
يمكن استخدامها في المشكلات التي تتطلب تجانس البيانات ، وكذلك في المشكلات التي تحتاج فيها البيانات إلى الاستيفاء أو الاستقراء. على سبيل المثال ، في المشكلة التي نوقشت أعلاه ، يمكن للمرء أن يجد قيمة الكمية المرصودة y عند x = 3 أو عند x = 6. لقد خصصنا مقالة منفصلة لمثل هذه الأمثلة.
دليل على طريقة LSM
لكي تأخذ الوظيفة الحد الأدنى للقيمة عند حساب a و b ، من الضروري عند نقطة معينة أن تكون مصفوفة الصيغة التربيعية لتفاضل دالة النموذج F (a ، b) = ∑ i = 1 n (y i - (a x i + b)) 2 يكون تعريفًا موجبًا. دعنا نريك كيف يجب أن تبدو.
مثال 2
لدينا فارق من الدرجة الثانية بالشكل التالي:
د 2 و (أ ؛ ب) = δ 2 ف (أ ؛ ب) δ أ 2 د 2 أ + 2 2 ف (أ ؛ ب) δ أ δ ب د أ د ب + 2 و (أ ؛ ب) ب 2 د 2 ب
المحلول
δ 2 F (a؛ b) δ a 2 = δ F (a؛ b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a؛ b) δ a δ b = δ δ F (a؛ b) δ a δ b = = - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a؛ b) δ b 2 = δ F (a؛ b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + ب)) δ ب = 2 ∑ أنا = 1 ن (1) = 2 ن
بمعنى آخر ، يمكن كتابتها على النحو التالي: d 2 F (a ؛ b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.
لقد حصلنا على مصفوفة من الصيغة التربيعية M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n.
في هذه الحالة ، لن تتغير قيم العناصر الفردية اعتمادًا على أ و ب. هل هذه المصفوفة إيجابية محددة؟ للإجابة على هذا السؤال ، دعنا نتحقق مما إذا كانت الزوايا الصغرى موجبة.
احسب الدرجة الأولى الزاوية الصغرى: 2 ∑ i = 1 n (x i) 2> 0. بما أن النقطتين x i لا تتطابقان ، فإن المتباينة صارمة. سنضع هذا في الاعتبار في مزيد من الحسابات.
نحسب الزاوية الصغرى من الدرجة الثانية:
د e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2
بعد ذلك ننتقل إلى إثبات المتباينة n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0 باستخدام الاستقراء الرياضي.
- دعنا نتحقق مما إذا كانت هذه المتباينة صالحة لـ n التعسفي. لنأخذ 2 ونحسب:
2 ∑ i = 1 2 (x i) 2 - i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = س 1 + س 2 2> 0
حصلنا على المساواة الصحيحة (إذا لم تتطابق القيمتان x 1 و x 2).
- لنفترض أن عدم المساواة هذه ستكون صحيحة لـ n ، أي n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0 - صحيح.
- الآن دعنا نثبت صحة n + 1 ، أي أن (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2> 0 إذا n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2> 0.
نحسب:
(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + x n + 1 2 - 2 x n + 1 × 2 + × 2 2 +. . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + (x n + 1 - x 1) 2 + (x n + 1) - × 2) 2 +. . . + (x n - 1 - x n) 2> 0
سيكون التعبير المحاط بأقواس معقوفة أكبر من 0 (بناءً على ما افترضناه في الخطوة 2) ، وستكون بقية المصطلحات أكبر من 0 لأنها كلها مربعات من الأرقام. لقد أثبتنا عدم المساواة.
إجابه:سيتوافق الموجودان a و b مع أصغر قيمة للدالة F (a، b) = ∑ i = 1 n (y i - (a x i + b)) 2 ، مما يعني أنها المعلمات المرغوبة لطريقة المربعات الصغرى (LSM).
إذا لاحظت وجود خطأ في النص ، فيرجى تمييزه والضغط على Ctrl + Enter
- هل تعلم ما هو معيار الهيموجلوبين عند الرجال؟
- الوصفات الشعبية ضد قلة الصفيحات
- لماذا لا يجب التبرع بالدم لمرضى ارتفاع ضغط الدم
- نقص حجم الدم - الأسباب والأعراض والعلاج
- ما هي نوبة نقص السكر في الدم Hypoglycemia and cell hyperplasia عند الرضع
- عامل ويلبراند. المهام. ما هو مرض فون ويلبراند وعامله ، وكيف يتم علاجه ومقدار تكلفته ، والتنبؤ بالحياة ، وأعراض المرحلة الخفيفة من المرض.
- ماذا يظهر تحليل PSA وكيفية فك النتائج؟
- الهيموجلوبين: ما هو المعيار عند الرجال
- علاج التهاب البروستاتا بجذر أحمر: الوصف والعمل وطريقة التطبيق الجذر الأحمر للورم الحميد في البروستاتا
- فوائد الهيماتوجين وأضرارها وتكوينها ومكوناتها
- تنظير الرحم وعواقبه كم من الوقت تؤلم المعدة بعد تنظير الرحم
- الدم الغليظ: الأعراض ، الأسباب والعلاج ، ما يجب القيام به وكيفية النحافة
- فصيلة الدم الثالثة إيجابية - الخصائص والتوافق ماذا يعني 3 إيجابية
- قيمة أنتيستربتوليسين (ASL-O) في الدم وأسباب الزيادة
- طرق ميسورة التكلفة لخفض نسبة السكر في الدم
- طرق لخفض سكر الدم بسرعة وأمان
- علامة على أمراض خطيرة - كثرة الوحيدات عند الأطفال
- معدل ترسيب كرات الدم الحمراء (ESR) عند النساء والرجال لماذا ينخفض ESR
- تحليل علامة ورم PSA - خاصة بالنسبة لعلامة ورم البروستاتا Psa هو القاعدة
- النزيف عند الحامل: الأسباب والأعراض