روش حداقل مربعات مثال های حل مسئله. توسعه پیش بینی با استفاده از روش حداقل مربعات. مثالی از حل مسئله حل سیستم معادلات به روش حداقل مربعات


تابع را با یک چند جمله ای درجه 2 تقریب می کنیم. برای انجام این کار، ضرایب سیستم نرمال معادلات را محاسبه می کنیم:

, ,

اجازه دهید یک سیستم معمولی از حداقل مربعات بسازیم که به شکل زیر است:

راه حل سیستم به راحتی پیدا می شود:،، .

بنابراین، چند جمله ای درجه 2 یافت می شود: .

پیش زمینه نظری

بازگشت به صفحه<Введение в вычислительную математику. Примеры>

مثال 2. یافتن درجه بهینه یک چند جمله ای

بازگشت به صفحه<Введение в вычислительную математику. Примеры>

مثال 3. استخراج یک سیستم نرمال معادلات برای یافتن پارامترهای یک وابستگی تجربی.

اجازه دهید سیستمی از معادلات را برای تعیین ضرایب و توابع استخراج کنیم ، که تقریب ریشه میانگین مربع تابع داده شده را با توجه به نقاط انجام می دهد. یک تابع بنویسید و شرط اکستریم لازم برای آن را بنویسید:

سپس سیستم عادی به شکل زیر در می آید:

ما یک سیستم خطی معادلات برای پارامترهای مجهول به دست آورده ایم که به راحتی قابل حل است.

پیش زمینه نظری

بازگشت به صفحه<Введение в вычислительную математику. Примеры>

مثال.

داده های تجربی در مورد مقادیر متغیرها ایکسو دردر جدول آورده شده است.

در نتیجه تراز آنها، تابع

استفاده كردن روش حداقل مربع، این داده ها را با یک وابستگی خطی تقریبی کنید y=ax+b(پیدا کردن پارامترها آو ب). دریابید که کدام یک از دو خط بهتر است (به معنای روش حداقل مربعات) داده های تجربی را تراز می کند. یک نقاشی بکشید.

ماهیت روش حداقل مربعات (LSM).

مشکل پیدا کردن ضرایب وابستگی خطی است که برای آنها تابع دو متغیر است آو بکمترین مقدار را می گیرد. یعنی با توجه به داده ها آو بمجموع انحرافات مجذور داده های تجربی از خط مستقیم یافت شده کوچکترین خواهد بود. این نکته کل روش حداقل مربعات است.

بنابراین، حل مثال به یافتن حد فاصل یک تابع از دو متغیر خلاصه می شود.

استخراج فرمول برای یافتن ضرایب.

یک سیستم دو معادله با دو مجهول گردآوری و حل می شود. یافتن مشتقات جزئی توابع توسط متغیرها آو ب، این مشتقات را با صفر برابر می کنیم.

ما سیستم معادلات حاصل را با هر روشی حل می کنیم (مثلا روش جایگزینییا روش کرامر) و فرمول های یافتن ضرایب را با استفاده از روش حداقل مربعات (LSM) بدست آورید.

با داده آو بعملکرد کمترین مقدار را می گیرد. اثبات این حقیقت در زیر در متن انتهای صفحه آورده شده است.

این کل روش حداقل مربعات است. فرمول برای یافتن پارامتر آشامل مجموع ، ، ، و پارامتر است nمقدار داده های تجربی است. مقادیر این مبالغ توصیه می شود به طور جداگانه محاسبه شوند.

ضریب ببعد از محاسبه پیدا شد آ.

وقت آن است که نمونه اصلی را به خاطر بسپارید.

راه حل.

در مثال ما n=5. برای راحتی محاسبه مقادیری که در فرمول های ضرایب مورد نیاز گنجانده شده است، جدول را پر می کنیم.

مقادیر سطر چهارم جدول با ضرب مقادیر سطر دوم در مقادیر سطر 3 برای هر عدد به دست می آید. من.

مقادیر ردیف پنجم جدول با مربع کردن مقادیر سطر دوم برای هر عدد به دست می آید. من.

مقادیر آخرین ستون جدول مجموع مقادیر در سراسر سطرها است.

برای یافتن ضرایب از فرمول روش حداقل مربعات استفاده می کنیم آو ب. ما مقادیر مربوطه را از آخرین ستون جدول در آنها جایگزین می کنیم:

در نتیجه، y=0.165x+2.184خط مستقیم تقریبی مورد نظر است.

باقی مانده است که بفهمیم کدام یک از خطوط y=0.165x+2.184یا داده های اصلی را بهتر تقریب می کند، یعنی تخمینی را با استفاده از روش حداقل مربعات انجام می دهد.

برآورد خطای روش حداقل مربعات.

برای انجام این کار، باید مجموع انحرافات مجذور داده های اصلی را از این خطوط محاسبه کنید و ، مقدار کوچکتر مربوط به خطی است که به بهترین وجه داده های اصلی را از نظر روش حداقل مربعات تقریب می کند.

از آن زمان، پس از آن خط y=0.165x+2.184داده های اصلی را بهتر تقریب می کند.

تصویر گرافیکی روش حداقل مربعات (LSM).

همه چیز در نمودارها عالی به نظر می رسد. خط قرمز همان خط یافت شده است y=0.165x+2.184، خط آبی است ، نقاط صورتی داده های اصلی هستند.

برای چیست، این همه تقریب برای چیست؟

من شخصاً برای حل مسائل هموارسازی داده ها، مسائل درون یابی و برون یابی استفاده می کنم (در مثال اصلی، می توان از شما درخواست کرد که مقدار مقدار مشاهده شده را پیدا کنید. yدر x=3یا چه زمانی x=6طبق روش MNC). اما در ادامه در بخش دیگری از سایت در این مورد بیشتر صحبت خواهیم کرد.

بالای صفحه

اثبات

به طوری که وقتی پیدا شد آو بتابع کوچکترین مقدار را می گیرد، لازم است که در این مرحله ماتریس شکل درجه دوم دیفرانسیل مرتبه دوم برای تابع باشد. مثبت قطعی بود بیایید آن را نشان دهیم.

دیفرانسیل مرتبه دوم به شکل زیر است:

به این معنا که

بنابراین، ماتریس فرم درجه دوم دارای فرم است

و مقادیر عناصر به آن بستگی ندارد آو ب.

اجازه دهید نشان دهیم که ماتریس مثبت قطعی است. این مستلزم آن است که مینورهای زاویه مثبت باشند.

مینور زاویه ای مرتبه اول . نابرابری سخت است، زیرا نقاط بر هم منطبق نیستند. این امر در مواردی که در ادامه خواهد آمد به طور ضمنی مشخص خواهد شد.

مینور زاویه ای مرتبه دوم

این را ثابت کنیم روش استقراء ریاضی

نتیجه: مقادیر یافت شده آو ببا کوچکترین مقدار تابع مطابقت دارد بنابراین، پارامترهای مورد نظر برای روش حداقل مربعات هستند.

تا حالا فهمیدی؟
یک راه حل سفارش دهید

بالای صفحه

توسعه پیش بینی با استفاده از روش حداقل مربعات. مثال حل مسئله

برون یابی - این یک روش تحقیق علمی است که مبتنی بر انتشار روندهای گذشته و حال، الگوها، روابط با توسعه آینده موضوع پیش بینی است. روش های برون یابی شامل روش میانگین متحرک، روش هموارسازی نمایی، روش حداقل مربعات.

ذات روش حداقل مربعات شامل به حداقل رساندن مجموع انحرافات مربع بین مقادیر مشاهده شده و محاسبه شده است. مقادیر محاسبه شده با توجه به معادله انتخاب شده - معادله رگرسیون پیدا می شود. هرچه فاصله بین مقادیر واقعی و مقادیر محاسبه شده کمتر باشد، پیش بینی بر اساس معادله رگرسیون دقیق تر است.

تجزیه و تحلیل نظری ماهیت پدیده مورد مطالعه، تغییری که در آن توسط یک سری زمانی نمایش داده می شود، به عنوان مبنایی برای انتخاب یک منحنی عمل می کند. ملاحظاتی در مورد ماهیت رشد سطوح سریال گاهی مورد توجه قرار می گیرد. بنابراین، اگر رشد خروجی در یک تصاعد حسابی انتظار می رود، هموارسازی در یک خط مستقیم انجام می شود. اگر معلوم شد که رشد نمایی است، صاف کردن باید مطابق تابع نمایی انجام شود.

فرمول کار روش حداقل مربعات : Y t+1 = a*X + b، جایی که t + 1 دوره پیش بینی است. Уt+1 - شاخص پیش بینی شده. a و b ضرایب هستند. X نماد زمان است.

ضرایب a و b بر اساس فرمول زیر محاسبه می شود:

جایی که، Uf - مقادیر واقعی سری دینامیک؛ n تعداد سطوح در سری زمانی است.

هموارسازی سری های زمانی با روش حداقل مربعات در خدمت منعکس کننده الگوهای توسعه پدیده مورد مطالعه است. در بیان تحلیلی یک روند، زمان به عنوان یک متغیر مستقل در نظر گرفته می شود و سطوح سری تابعی از این متغیر مستقل عمل می کنند.

توسعه یک پدیده به این بستگی ندارد که چند سال از نقطه شروع آن گذشته باشد، بلکه به این بستگی دارد که چه عواملی بر توسعه آن تأثیر گذاشته اند، در چه جهتی و با چه شدتی. از اینجا مشخص می شود که توسعه یک پدیده در زمان در نتیجه عمل این عوامل ظاهر می شود.

تنظیم صحیح نوع منحنی، نوع وابستگی تحلیلی به زمان یکی از دشوارترین وظایف تحلیل پیش پیش بینی است. .

انتخاب نوع تابعی که روند را توصیف می کند، که پارامترهای آن با روش حداقل مربعات تعیین می شود، در بیشتر موارد تجربی با ساخت تعدادی تابع و مقایسه آنها با یکدیگر بر اساس مقدار ریشه است. خطای میانگین مربع، با فرمول محاسبه می شود:

جایی که Uf - مقادیر واقعی سری دینامیک؛ Ur - مقادیر محاسبه شده (هموار) سری های زمانی؛ n تعداد سطوح در سری زمانی است. p تعداد پارامترهای تعریف شده در فرمول های توصیف کننده روند (روند توسعه) است.

معایب روش حداقل مربعات :

  • هنگام تلاش برای توصیف پدیده اقتصادی مورد مطالعه با استفاده از یک معادله ریاضی، پیش‌بینی برای مدت کوتاهی دقیق خواهد بود و معادله رگرسیون باید با دستیابی به اطلاعات جدید مجدداً محاسبه شود.
  • پیچیدگی انتخاب معادله رگرسیون که با استفاده از برنامه های کامپیوتری استاندارد قابل حل است.

نمونه ای از استفاده از روش حداقل مربعات برای توسعه پیش بینی

یک وظیفه . داده هایی وجود دارد که سطح بیکاری در منطقه را مشخص می کند، %

  • با استفاده از روش‌های میانگین متحرک، هموارسازی نمایی، حداقل مربعات، پیش‌بینی نرخ بیکاری در منطقه را برای ماه‌های نوامبر، دسامبر، ژانویه بسازید.
  • با استفاده از هر روش، خطاهای پیش بینی های حاصل را محاسبه کنید.
  • نتایج به دست آمده را مقایسه کنید، نتیجه گیری کنید.

راه حل حداقل مربعات

برای حل، جدولی را تهیه می کنیم که در آن محاسبات لازم را انجام می دهیم:

ε = 28.63/10 = 2.86٪ دقت پیش بینیبالا

نتیجه : مقایسه نتایج به دست آمده در محاسبات روش میانگین متحرک , هموارسازی نمایی و روش حداقل مربعات، می توان گفت که میانگین خطای نسبی در محاسبات با روش هموارسازی نمایی در محدوده 20-50٪ قرار می گیرد. این بدان معنی است که دقت پیش بینی در این مورد فقط رضایت بخش است.

در حالت اول و سوم، دقت پیش‌بینی بالا است، زیرا میانگین خطای نسبی کمتر از 10٪ است. اما روش میانگین متحرک امکان دستیابی به نتایج قابل اعتماد تری را فراهم کرد (پیش بینی برای نوامبر - 1.52٪ ، پیش بینی برای دسامبر - 1.53٪ ، پیش بینی ژانویه - 1.49٪) ، زیرا میانگین خطای نسبی هنگام استفاده از این روش کوچکترین است - 1 13 درصد.

روش حداقل مربعات

سایر مقالات مرتبط:

فهرست منابع استفاده شده

  1. توصیه های علمی و روش شناختی در مورد مسائل تشخیص خطرات اجتماعی و پیش بینی چالش ها، تهدیدها و پیامدهای اجتماعی. دانشگاه دولتی اجتماعی روسیه مسکو. 2010;
  2. ولادیمیروا L.P. پیش بینی و برنامه ریزی در شرایط بازار: Proc. کمک هزینه M .: انتشارات داشکوف و شرکت، 2001؛
  3. نوویکووا N.V.، Pozdeeva O.G. پیش بینی اقتصاد ملی: راهنمای آموزشی و روش شناختی. یکاترینبورگ: انتشارات اورال. حالت اقتصاد دانشگاه، 1386;
  4. Slutskin L.N. دوره MBA در پیش بینی کسب و کار. مسکو: کتاب های تجاری آلپینا، 2006.

برنامه MNE

داده ها را وارد کنید

داده ها و تقریب y = a + b x

من- تعداد نقطه آزمایشی؛
x i- مقدار پارامتر ثابت در نقطه من;
y من- مقدار پارامتر اندازه گیری شده در نقطه من;
ω من- اندازه گیری وزن در نقطه من;
y i، محاسبه- تفاوت بین مقدار اندازه گیری شده و مقدار محاسبه شده از رگرسیون yدر نقطه من;
S x i (x i)- برآورد خطا x iهنگام اندازه گیری yدر نقطه من.

داده ها و تقریب y = kx

من x i y من ω من y i، محاسبه Δy i S x i (x i)

روی نمودار کلیک کنید

راهنمای کاربر برای برنامه آنلاین MNC.

در قسمت داده، در هر خط جداگانه، مقادیر «x» و «y» را در یک نقطه آزمایشی وارد کنید. مقادیر باید با فضای خالی (فضا یا تب) از هم جدا شوند.

مقدار سوم می تواند وزن نقطه «w» باشد. اگر وزن نقطه مشخص نشده باشد، برابر با یک است. در اکثریت قریب به اتفاق موارد، وزن نقاط تجربی ناشناخته یا محاسبه نشده است. تمام داده های تجربی معادل در نظر گرفته می شوند. گاهی اوقات وزن ها در محدوده مقادیر مورد مطالعه قطعاً معادل نیستند و حتی می توان آنها را به صورت تئوری محاسبه کرد. به عنوان مثال، در اسپکتروفتومتری، وزن ها را می توان با استفاده از فرمول های ساده محاسبه کرد، اگرچه اساساً همه برای کاهش هزینه های نیروی کار از این امر غفلت می کنند.

داده ها را می توان از طریق کلیپ بورد از صفحه گسترده مجموعه آفیس، مانند Excel از Microsoft Office یا Calc از Open Office، جایگذاری کرد. برای انجام این کار، در صفحه گسترده، محدوده داده را برای کپی انتخاب کنید، در کلیپ بورد کپی کنید و داده ها را در فیلد داده در این صفحه جای گذاری کنید.

برای محاسبه با روش حداقل مربعات، حداقل دو نقطه برای تعیین دو ضریب «b» مورد نیاز است - مماس زاویه میل خط مستقیم و «a» - مقدار قطع شده توسط خط مستقیم روی «y» محور.

برای تخمین خطای ضرایب رگرسیون محاسبه شده، باید تعداد نقاط آزمایشی را بیش از دو قرار داد.

روش حداقل مربعات (LSM).

هر چه تعداد امتیازات تجربی بیشتر باشد، تخمین آماری ضرایب (به دلیل کاهش ضریب دانشجویی) دقیقتر و تخمین به برآورد نمونه عمومی نزدیکتر است.

به دست آوردن مقادیر در هر نقطه آزمایشی اغلب با هزینه های نیروی کار قابل توجهی همراه است، بنابراین، اغلب آزمایش های توافقی انجام می شود که تخمین قابل هضمی را ارائه می دهد و منجر به هزینه های نیروی کار بیش از حد نمی شود. به عنوان یک قاعده، تعداد نقاط آزمایشی برای وابستگی حداقل مربعات خطی با دو ضریب در منطقه 5-7 امتیاز انتخاب می شود.

نظریه مختصری از حداقل مربعات برای وابستگی خطی

فرض کنید مجموعه ای از داده های تجربی به شکل جفت مقادیر [`y_i`، `x_i`] داریم که در آن `i` تعداد یک اندازه گیری آزمایشی از 1 تا n است. "y_i" - مقدار مقدار اندازه گیری شده در نقطه "i"؛ "x_i" - مقدار پارامتری که در نقطه "i" تنظیم می کنیم.

یک مثال اجرای قانون اهم است. با تغییر ولتاژ (اختلاف پتانسیل) بین مقاطع مدار الکتریکی، مقدار جریان عبوری از این قسمت را اندازه گیری می کنیم. فیزیک به ما این وابستگی را می دهد که به طور تجربی یافت می شود:

«I=U/R»،
جایی که "I" - قدرت فعلی؛ `R` - مقاومت؛ "U" - ولتاژ.

در این حالت، «y_i» مقدار جریان اندازه‌گیری شده و «x_i» مقدار ولتاژ است.

به عنوان مثال دیگر، جذب نور توسط محلول یک ماده در محلول را در نظر بگیرید. شیمی این فرمول را به ما می دهد:

"A = εl C"،
که در آن "A" چگالی نوری محلول است. `ε` - انتقال املاح. `l` - طول مسیر هنگامی که نور از یک کووت با محلول عبور می کند. "C" غلظت املاح است.

در این مورد، «y_i» چگالی نوری اندازه‌گیری شده «A» است و «x_i» غلظت ماده‌ای است که ما تنظیم می‌کنیم.

ما موردی را در نظر خواهیم گرفت که خطای نسبی در تنظیم `x_i` بسیار کمتر از خطای نسبی در اندازه گیری `y_i` باشد. همچنین فرض می‌کنیم که تمام مقادیر اندازه‌گیری‌شده «y_i» تصادفی و به طور معمول توزیع شده‌اند، یعنی. از قانون توزیع نرمال پیروی کنید.

در مورد وابستگی خطی «y» به «x»، می‌توانیم وابستگی نظری را بنویسیم:
`y = a + bx`.

از نقطه نظر هندسی، ضریب «b» مماس شیب خط بر محور «x» را نشان می‌دهد و ضریب «a» مقدار «y» را در نقطه تلاقی خط با «خ» نشان می‌دهد. محور y (با `x = 0`).

یافتن پارامترهای خط رگرسیون

در یک آزمایش، مقادیر اندازه‌گیری شده «y_i» به دلیل خطاهای اندازه‌گیری، که همیشه در زندگی واقعی ذاتی هستند، نمی‌توانند دقیقاً روی خط نظری قرار بگیرند. بنابراین، یک معادله خطی باید با یک سیستم معادلات نشان داده شود:
`y_i = a + b x_i + ε_i` (1)،
که در آن «ε_i» خطای اندازه‌گیری ناشناخته «y» در آزمایش «i» است.

وابستگی (1) نیز نامیده می شود پسرفت، یعنی وابستگی دو کمیت به یکدیگر با اهمیت آماری.

وظیفه بازگرداندن وابستگی یافتن ضرایب «a» و «b» از نقاط آزمایشی [`y_i`، `x_i`] است.

برای یافتن ضرایب معمولاً از «a» و «b» استفاده می شود روش حداقل مربع(MNK). این یک مورد خاص از اصل حداکثر احتمال است.

بیایید (1) را به صورت «ε_i = y_i - a - b x_i» بازنویسی کنیم.

سپس مجموع مربعات خطاها خواهد بود
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

اصل روش حداقل مربعات به حداقل رساندن مجموع (2) با توجه به پارامترهای "a" و "b" است..

حداقل زمانی حاصل می شود که مشتقات جزئی جمع (2) با توجه به ضرایب «a» و «b» برابر با صفر باشد:
`frac(ف جزئی)(جزئی a) = frac(جمع جزئی_(i=1)^(n) (y_i - a - b x_i)^2)(جزئی a) = 0`
`frac(ف جزئی)(ب جزئی) = frac(جمع جزئی_(i=1)^(n) (y_i - a - b x_i)^2)(b جزئی) = 0`

با گسترش مشتقات، سیستمی متشکل از دو معادله با دو مجهول به دست می آوریم:
`sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

براکت ها را باز می کنیم و مجموع را مستقل از ضرایب مورد نظر به نیمه دیگر منتقل می کنیم، یک سیستم معادلات خطی به دست می آوریم:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

با حل سیستم به دست آمده، فرمول هایی برای ضرایب «a» و «b» پیدا می کنیم:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 - (جمع_(i=1)^(n) x_i)^2)` (3.2)

این فرمول‌ها وقتی راه‌حل‌هایی دارند که «n> 1» (خط را می‌توان با حداقل 2 نقطه رسم کرد) و زمانی که تعیین‌کننده «D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1) )^(n) x_i)^2 != 0`، یعنی. هنگامی که نقاط "x_i" در آزمایش متفاوت است (یعنی زمانی که خط عمودی نیست).

برآورد خطا در ضرایب خط رگرسیون

برای برآورد دقیق‌تر خطا در محاسبه ضرایب «a» و «b»، تعداد زیادی از نقاط آزمایشی مطلوب است. وقتی n=2 باشد، تخمین خطای ضرایب غیرممکن است، زیرا خط تقریبی به طور منحصر به فرد از دو نقطه عبور می کند.

خطای متغیر تصادفی "V" مشخص می شود قانون انباشت خطا
`S_V^2 = sum_(i=1)^p (frac(f جزئی)(جزئی z_i))^2 S_(z_i)^2`,
که در آن «p» تعداد پارامترهای «z_i» با خطای «S_(z_i)» است که بر خطای «S_V» تأثیر می‌گذارد.
"f" تابع وابستگی "V" به "z_i" است.

بیایید قانون انباشت خطاها را برای خطای ضرایب «a» و «b» بنویسیم.
`S_a^2 = sum_(i=1)^(n)(frac(جزئی a)(جزئی y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(جزئی a )(x_i جزئی))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(جزئی a)(جزئی y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(جزئی b)(جزئی y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(b جزئی )(x_i جزئی))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(جزئی b)(جزئی y_i))^2 `,
زیرا `S_(x_i)^2 = 0` (ما قبلاً رزرو کردیم که خطای `x` ناچیز است).

`S_y^2 = S_(y_i)^2` - خطا (واریانس، مجذور انحراف استاندارد) در بعد `y`، با فرض اینکه خطا برای همه مقادیر `y` یکنواخت است.

با جایگزینی فرمول های محاسبه «a» و «b» در عبارات به دست آمده، دریافت می کنیم

`S_a^2 = S_y^2 فرک(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 فراک (جمع_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 فرک(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

در بیشتر آزمایش‌های واقعی، مقدار «Sy» اندازه‌گیری نمی‌شود. برای انجام این کار، انجام چندین اندازه گیری موازی (آزمایش) در یک یا چند نقطه از طرح ضروری است که باعث افزایش زمان (و احتمالاً هزینه) آزمایش می شود. بنابراین، معمولاً فرض می‌شود که انحراف «y» از خط رگرسیون را می‌توان تصادفی در نظر گرفت. برآورد واریانس `y` در این مورد با فرمول محاسبه می شود.

`S_y^2 = S_(y، استراحت)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

مقسوم‌کننده «n-2» به این دلیل ظاهر می‌شود که به دلیل محاسبه دو ضریب برای یک نمونه از داده‌های تجربی، تعداد درجات آزادی را کاهش داده‌ایم.

به این تخمین، واریانس باقیمانده نسبت به خط رگرسیون S_(y، استراحت)^2 نیز گفته می شود.

ارزیابی اهمیت ضرایب بر اساس معیار دانشجو انجام می شود

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

اگر معیارهای محاسبه‌شده «t_a»، «t_b» کمتر از معیارهای جدول «t(P, n-2)» باشد، در نظر گرفته می‌شود که ضریب مربوطه تفاوت معنی‌داری با صفر با احتمال داده شده «P» ندارد.

برای ارزیابی کیفیت توصیف یک رابطه خطی، می‌توانید «S_(y، استراحت)^2» و «S_(bar y)» را نسبت به میانگین با استفاده از معیار فیشر مقایسه کنید.

`S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i= 1)^n y_i) /n)^2) (n-1)` - برآورد نمونه از واریانس `y` نسبت به میانگین.

برای ارزیابی اثربخشی معادله رگرسیون برای توصیف وابستگی، ضریب فیشر محاسبه شده است.
`F = S_(نوار y) / S_(y، استراحت)^2`،
که با ضریب فیشر جدولی "F(p، n-1، n-2)" مقایسه شده است.

اگر «F > F(P، n-1، n-2)»، تفاوت بین توصیف وابستگی `y = f(x)` با استفاده از معادله رگرسیون و توصیف با استفاده از میانگین از نظر آماری با احتمال معنی دار در نظر گرفته می شود. "P". آن ها رگرسیون وابستگی را بهتر از گسترش «y» حول میانگین توصیف می کند.

روی نمودار کلیک کنید
برای اضافه کردن مقادیر به جدول

روش حداقل مربعات روش حداقل مربعات به معنای تعیین پارامترهای مجهول a، b، c، وابستگی تابعی پذیرفته شده است.

روش حداقل مربعات به معنای تعیین پارامترهای مجهول است الف، ب، ج، …وابستگی عملکردی پذیرفته شده

y = f(x,a,b,c,…),

که حداقل میانگین مربع (واریانس) خطا را فراهم می کند

, (24)

که در آن x i، y i - مجموعه ای از جفت اعداد به دست آمده از آزمایش.

از آنجایی که شرط حداکثر بودن یک تابع از چندین متغیر شرطی است که مشتقات جزئی آن برابر با صفر باشند، پس پارامترها الف، ب، ج، …از سیستم معادلات تعیین می شود:

; ; ; … (25)

باید به خاطر داشت که از روش حداقل مربعات برای انتخاب پارامترهای بعد از فرم تابع استفاده می شود y = f(x)تعریف شده است.

اگر از ملاحظات نظری نتوان نتیجه‌گیری در مورد اینکه فرمول تجربی چگونه باید باشد، نتیجه‌گیری کرد، باید با بازنمایی‌های بصری هدایت شود، در درجه اول یک نمایش گرافیکی از داده‌های مشاهده‌شده.

در عمل، اغلب به انواع توابع زیر محدود می شود:

1) خطی ;

2) درجه دوم الف.

(تصویر را ببینید). برای یافتن معادله یک خط مستقیم لازم است

هرچه عدد در مقدار مطلق کوچکتر باشد، خط مستقیم (2) بهتر انتخاب می شود. به عنوان مشخصه دقت انتخاب یک خط مستقیم (2) می توانیم مجموع مربع ها را در نظر بگیریم.

حداقل شرایط برای S خواهد بود

(6)
(7)

معادلات (6) و (7) را می توان به شکل زیر نوشت:

(8)
(9)

از معادلات (8) و (9) به راحتی می توان a و b را از مقادیر تجربی x i و y i پیدا کرد. خط (2) تعریف شده با معادلات (8) و (9) خطی است که با روش حداقل مربعات به دست می آید (این نام تأکید می کند که مجموع مربعات S دارای حداقل است). معادلات (8) و (9) که خط مستقیم (2) از آنها مشخص می شود، معادلات عادی نامیده می شوند.

می توان یک روش ساده و کلی برای جمع آوری معادلات عادی نشان داد. با استفاده از نقاط تجربی (1) و معادله (2) می‌توان سیستم معادلات a و b را یادداشت کرد.

y 1 \u003d تبر 1 +b،
y 2 \u003dax 2 +b،
...
(10)
yn=axn+b،

قسمت چپ و راست هر یک از این معادلات را در ضریب مجهول اول a ضرب کنید (یعنی x 1 , x 2 , ..., x n) و معادلات حاصل را با هم جمع کنید و اولین معادله نرمال (8) به دست می آید.

سمت چپ و راست هر یک از این معادلات را در ضریب مجهول دوم b ضرب می کنیم، یعنی. با 1، و معادلات به دست آمده را اضافه کنید و معادله نرمال دوم (9) را به دست آورید.

این روش برای بدست آوردن معادلات عادی کلی است: برای مثال برای تابع مناسب است

یک مقدار ثابت است و باید از داده های تجربی تعیین شود (1).

سیستم معادلات k را می توان نوشت:

خط (2) را با استفاده از روش حداقل مربعات پیدا کنید.

راه حل.ما پیدا می کنیم:

x i = 21، y i = 46.3، x i 2 = 91، x i y i = 179.1.

معادلات (8) و (9) را می نویسیم.

از اینجا پیدا می کنیم

تخمین دقت روش حداقل مربعات

اجازه دهید تخمینی از دقت روش برای حالت خطی زمانی که معادله (2) رخ می دهد، ارائه دهیم.

بگذارید مقادیر آزمایشی x i دقیق باشند و مقادیر آزمایشی y i دارای خطاهای تصادفی با واریانس یکسان برای همه i هستند.

نماد را معرفی می کنیم

(16)

سپس جواب های معادلات (8) و (9) را می توان به صورت نمایش داد

(17)
(18)
جایی که
(19)
از معادله (17) به دست می آوریم
(20)
به همین ترتیب از رابطه (18) بدست می آوریم

(21)
زیرا
(22)
از معادلات (21) و (22) پیدا می کنیم
(23)

معادلات (20) و (23) تخمینی از دقت ضرایب تعیین شده توسط معادلات (8) و (9) ارائه می دهند.

توجه داشته باشید که ضرایب a و b همبستگی دارند. با تبدیل های ساده، لحظه همبستگی آنها را پیدا می کنیم.

از اینجا پیدا می کنیم

0.072 در x=1 و 6،

0.041 در x=3.5.

ادبیات

ساحل. بله ب. روشهای آماری تجزیه و تحلیل و کنترل کیفیت و پایایی. M.: Gosenergoizdat، 1962، ص. 552، ص 92-98.

این کتاب برای طیف وسیعی از مهندسین (موسسات تحقیقاتی، دفاتر طراحی، سایت‌های آزمایش و کارخانه‌ها) درگیر در تعیین کیفیت و قابلیت اطمینان تجهیزات الکترونیکی و سایر محصولات صنعتی انبوه (ماشین‌سازی، ابزارسازی، توپخانه و غیره) در نظر گرفته شده است.

این کتاب کاربرد روش های آمار ریاضی را برای پردازش و ارزیابی نتایج آزمون ارائه می دهد که در آن کیفیت و قابلیت اطمینان محصولات آزمایش شده تعیین می شود. برای راحتی خوانندگان، اطلاعات لازم از آمار ریاضی و همچنین تعداد زیادی جداول کمکی ریاضی ارائه شده است که محاسبات لازم را تسهیل می کند.

ارائه با تعداد زیادی نمونه برگرفته از حوزه الکترونیک رادیویی و فناوری توپخانه نشان داده شده است.

روش حداقل مربعات یکی از رایج ترین و پیشرفته ترین روش ها به دلیل داشتن آن است سادگی و کارایی روش‌ها برای تخمین پارامترهای خطی. در عین حال، هنگام استفاده از آن باید احتیاط کرد، زیرا مدل های ساخته شده با استفاده از آن ممکن است تعدادی از الزامات کیفیت پارامترهای خود را برآورده نکنند و در نتیجه، الگوهای توسعه فرآیند را "به خوبی" منعکس نکنند.

اجازه دهید روند تخمین پارامترهای یک مدل اقتصاد سنجی خطی با استفاده از روش حداقل مربعات را با جزئیات بیشتری در نظر بگیریم. چنین مدلی را می توان به صورت کلی با معادله (1.2) نشان داد:

y t = a 0 + a 1 x 1 t +...+ a n x nt + ε t .

داده های اولیه هنگام تخمین پارامترهای a 0, a 1,..., a n بردار مقادیر متغیر وابسته است. y= (y 1 , y 2 , ... , y T)" و ماتریس مقادیر متغیرهای مستقل

که در آن ستون اول، متشکل از یکی، با ضریب مدل مطابقت دارد.

روش حداقل مربعات نام خود را بر اساس این اصل اساسی گرفته است که تخمین پارامترهای بدست آمده بر اساس آن باید برآورده شود: مجموع مربعات خطای مدل باید حداقل باشد.

نمونه هایی از حل مسائل به روش حداقل مربعات

مثال 2.1.شرکت تجاری دارای شبکه ای متشکل از 12 فروشگاه است که اطلاعات فعالیت های آن در جدول ارائه شده است. 2.1.

مدیریت شرکت مایل است بداند که اندازه سالانه چقدر به منطقه فروش فروشگاه بستگی دارد.

جدول 2.1

شماره مغازه

گردش مالی سالانه، میلیون روبل

منطقه تجاری، هزار متر مربع

راه حل حداقل مربعاتاجازه دهید تعیین کنیم - گردش مالی سالانه فروشگاه -میلیون روبل. - متراژ فروش فروشگاه هزار متر مربع.

شکل 2.1. Scatterplot برای مثال 2.1

برای تعیین شکل رابطه عملکردی بین متغیرها و ساختن نمودار پراکندگی (شکل 2.1).

بر اساس نمودار پراکندگی، می‌توان نتیجه گرفت که گردش مالی سالانه به طور مثبت به منطقه فروش وابسته است (یعنی با رشد y افزایش می‌یابد). مناسب ترین شکل اتصال عملکردی - است خطی.

اطلاعات برای محاسبات بیشتر در جدول ارائه شده است. 2.2. با استفاده از روش حداقل مربعات، پارامترهای مدل اقتصادسنجی خطی تک عاملی را تخمین می زنیم

جدول 2.2

به این ترتیب،

بنابراین، با افزایش 1000 متر مربع در منطقه تجاری، با مساوی بودن سایر موارد، میانگین گردش مالی سالانه 67.8871 میلیون روبل افزایش می یابد.

مثال 2.2.مدیریت شرکت متوجه شد که گردش مالی سالانه نه تنها به منطقه فروش فروشگاه (نگاه کنید به مثال 2.1)، بلکه به میانگین تعداد بازدیدکنندگان نیز بستگی دارد. اطلاعات مربوطه در جدول ارائه شده است. 2.3.

جدول 2.3

راه حل.نشان می دهد - میانگین تعداد بازدیدکنندگان از فروشگاه هفتم در روز، هزار نفر.

برای تعیین شکل رابطه عملکردی بین متغیرها و ساختن یک نمودار پراکندگی (شکل 2.2).

بر اساس نمودار پراکندگی، می‌توان نتیجه گرفت که گردش مالی سالانه با میانگین تعداد بازدیدکنندگان در روز رابطه مثبت دارد (یعنی با رشد y افزایش می‌یابد). شکل وابستگی عملکردی خطی است.

برنج. 2.2. Scatterplot برای مثال 2.2

جدول 2.4

به طور کلی تعیین پارامترهای مدل اقتصادسنجی دو عاملی ضروری است

y t \u003d a 0 + a 1 x 1 t + a 2 x 2 t + ε t

اطلاعات مورد نیاز برای محاسبات بیشتر در جدول ارائه شده است. 2.4.

اجازه دهید پارامترهای یک مدل اقتصادسنجی خطی دو عاملی را با استفاده از روش حداقل مربعات تخمین بزنیم.

به این ترتیب،

ارزیابی ضریب = 61.6583 نشان می دهد که با وجود مساوی بودن سایر موارد، با افزایش منطقه تجاری به میزان 1 هزار متر مربع، گردش مالی سالانه به طور متوسط ​​61.6583 میلیون روبل افزایش می یابد.

  • درس مقدماتی رایگان است;
  • تعداد زیادی معلم با تجربه (بومی و روسی زبان)؛
  • دوره ها نه برای یک دوره خاص (ماه، شش ماه، سال)، بلکه برای تعداد خاصی از درس ها (5، 10، 20، 50).
  • بیش از 10000 مشتری راضی
  • هزینه یک درس با معلم روسی زبان - از 600 روبلبا یک زبان مادری - از 1500 روبل

ماهیت روش حداقل مربعات این است در یافتن پارامترهای مدل روند که به بهترین شکل روند توسعه هر پدیده تصادفی را در زمان یا مکان توصیف می کند (روند خطی است که روند این توسعه را مشخص می کند). وظیفه روش حداقل مربعات (OLS) یافتن نه تنها مدل روند، بلکه یافتن بهترین یا بهینه مدل است. اگر مجموع انحرافات مجذور بین مقادیر واقعی مشاهده شده و مقادیر روند محاسبه شده مربوطه حداقل (کوچکترین) باشد، این مدل بهینه خواهد بود:

انحراف استاندارد بین مقدار واقعی مشاهده شده کجاست

و مقدار روند محاسبه شده مربوطه،

ارزش واقعی (مشاهده شده) پدیده مورد مطالعه،

ارزش تخمینی مدل روند،

تعداد مشاهدات پدیده مورد مطالعه.

MNC به ندرت به تنهایی استفاده می شود. به عنوان یک قاعده، اغلب از آن فقط به عنوان یک تکنیک ضروری در مطالعات همبستگی استفاده می شود. لازم به یادآوری است که اساس اطلاعات LSM فقط می تواند یک سری آماری قابل اعتماد باشد و تعداد مشاهدات نباید کمتر از 4 باشد، در غیر این صورت، رویه های هموارسازی LSM ممکن است حس مشترک خود را از دست بدهند.

جعبه ابزار OLS به رویه های زیر کاهش می یابد:

روش اول معلوم می شود که آیا اصلاً تمایلی برای تغییر ویژگی حاصل در هنگام تغییر عامل-استدلال انتخابی وجود دارد یا به عبارت دیگر، آیا ارتباطی بین " در "و" ایکس ».

رویه دوم مشخص می شود که کدام خط (مسیر) بهتر می تواند این روند را توصیف یا توصیف کند.

رویه سوم.

مثال. فرض کنید اطلاعاتی در مورد میانگین عملکرد آفتابگردان برای مزرعه مورد مطالعه داریم (جدول 9.1).

جدول 9.1

شماره مشاهده

بهره وری، c/ha

از آنجایی که سطح فناوری تولید آفتابگردان در کشور ما طی 10 سال گذشته تغییر چندانی نکرده است، به این معنی است که به احتمال زیاد، نوسانات عملکرد در دوره مورد تجزیه و تحلیل بستگی زیادی به نوسانات آب و هوا و شرایط آب و هوایی دارد. آیا حقیقت دارد؟

اولین روش MNC فرضیه وجود یک روند در تغییر عملکرد آفتابگردان بسته به تغییرات آب و هوا و شرایط آب و هوایی در طی 10 سال مورد تجزیه و تحلیل در حال آزمایش است.

در این مثال، برای " y توصیه می شود محصول آفتابگردان را مصرف کنید و برای « ایکس » تعداد سال مشاهده شده در دوره مورد تجزیه و تحلیل است. آزمون فرضیه وجود هر گونه رابطه بین " ایکس "و" y » به دو صورت دستی و با کمک برنامه های کامپیوتری قابل انجام است. البته با در دسترس بودن تکنولوژی کامپیوتری این مشکل خود به خود حل می شود. اما برای درک بهتر ابزار OLS، توصیه می شود فرضیه وجود رابطه بین " ایکس "و" y » به صورت دستی، زمانی که فقط یک خودکار و یک ماشین حساب معمولی در دسترس باشد. در چنین مواردی، فرضیه وجود یک روند به بهترین وجه از طریق مکان تصویر گرافیکی سری زمانی تحلیل شده - میدان همبستگی، بررسی می شود:

میدان همبستگی در مثال ما در اطراف یک خط به آرامی در حال افزایش قرار دارد. این خود نشان دهنده وجود روند خاصی در تغییر عملکرد آفتابگردان است. صحبت در مورد وجود هر روندی فقط زمانی غیرممکن است که میدان همبستگی شبیه یک دایره، یک دایره، یک ابر کاملاً عمودی یا کاملا افقی باشد یا از نقاط پراکنده تصادفی تشکیل شده باشد. در سایر موارد، تأیید فرضیه وجود رابطه بین ایکس "و" y و تحقیقات را ادامه دهید.

روش دوم MNC. مشخص می‌شود که کدام خط (مسیر) بهتر می‌تواند روند تغییرات عملکرد آفتابگردان را برای دوره مورد تجزیه و تحلیل توصیف یا توصیف کند.

با در دسترس بودن فناوری رایانه، انتخاب روند بهینه به طور خودکار اتفاق می افتد. با پردازش "دستی"، انتخاب تابع بهینه، به عنوان یک قاعده، به صورت بصری - با محل میدان همبستگی انجام می شود. یعنی با توجه به نوع نمودار، معادله خط انتخاب می شود که به بهترین وجه برای روند تجربی (به مسیر واقعی) مناسب است.

همانطور که می دانید، در طبیعت تنوع زیادی از وابستگی های عملکردی وجود دارد، بنابراین تجزیه و تحلیل بصری حتی قسمت کوچکی از آنها بسیار دشوار است. خوشبختانه، در عمل اقتصادی واقعی، بیشتر روابط را می توان با دقت یا با سهمی یا هذلولی یا یک خط مستقیم توصیف کرد. در این راستا، با گزینه «دستی» برای انتخاب بهترین عملکرد، می توانید خود را تنها به این سه مدل محدود کنید.

هذلولی:

سهمی مرتبه دوم: :

به راحتی می توان دید که در مثال ما، روند تغییرات عملکرد آفتابگردان در طول 10 سال تجزیه و تحلیل شده به بهترین وجه با یک خط مستقیم مشخص می شود، بنابراین معادله رگرسیون یک معادله خط مستقیم خواهد بود.

رویه سوم. پارامترهای معادله رگرسیون که این خط را مشخص می کند محاسبه می شود یا به عبارت دیگر یک فرمول تحلیلی تعیین می شود که بهترین مدل روند را توصیف می کند.

یافتن مقادیر پارامترهای معادله رگرسیون، در مورد ما، پارامترها و هسته LSM است. این فرآیند به حل یک سیستم معادلات عادی کاهش می یابد.

(9.2)

این سیستم معادلات به راحتی با روش گاوس حل می شود. به یاد بیاورید که در نتیجه راه حل، در مثال ما، مقادیر پارامترها و یافت می شوند. بنابراین، معادله رگرسیون یافت شده به شکل زیر خواهد بود:

این به طور گسترده در اقتصاد سنجی در قالب یک تفسیر اقتصادی روشن از پارامترهای آن استفاده می شود.

رگرسیون خطی به یافتن معادله شکل کاهش می یابد

یا

معادله نوع اجازه می دهد برای مقادیر پارامتر داده شده ایکسدارای مقادیر نظری ویژگی مؤثر است و مقادیر واقعی عامل را جایگزین آن می کند ایکس.

ساخت یک رگرسیون خطی به تخمین پارامترهای آن ختم می شود - آو که در.تخمین پارامترهای رگرسیون خطی را می توان با روش های مختلف یافت.

رویکرد کلاسیک برای برآورد پارامترهای رگرسیون خطی بر اساس است کمترین مربعات(MNK).

LSM به شخص اجازه می دهد تا چنین تخمین های پارامتری را بدست آورد آو که در،که تحت آن مجموع مجذور انحرافات مقادیر واقعی صفت حاصل است (y)از محاسبه شده (نظری) حداقل حداقل:

برای یافتن حداقل یک تابع، باید مشتقات جزئی را با توجه به هر یک از پارامترها محاسبه کرد. آو بو آنها را با صفر برابر کنید.

با S نشان دهید، سپس:

با تبدیل فرمول، سیستم معادلات عادی زیر را برای تخمین پارامترها به دست می آوریم آو که در:

با حل سیستم معادلات نرمال (3.5) یا به روش حذف متوالی متغیرها یا با روش تعیین کننده ها، تخمین پارامترهای مورد نظر را پیدا می کنیم. آو که در.

پارامتر که درضریب رگرسیون نامیده می شود. مقدار آن میانگین تغییر در نتیجه را با تغییر ضریب یک واحد نشان می دهد.

معادله رگرسیون همیشه با نشانگر تنگ بودن رابطه تکمیل می شود. هنگام استفاده از رگرسیون خطی، ضریب همبستگی خطی به عنوان چنین شاخصی عمل می کند. تغییرات مختلفی در فرمول ضریب همبستگی خطی وجود دارد. برخی از آنها به شرح زیر است:

همانطور که می دانید ضریب همبستگی خطی در حدود: -1 است 1.

برای ارزیابی کیفیت انتخاب یک تابع خطی، مربع محاسبه می شود

یک ضریب همبستگی خطی نامیده می شود ضریب تعیین .ضریب تعیین، نسبت واریانس ویژگی مؤثر را مشخص می کند با رگرسیون، در کل واریانس صفت حاصل توضیح داده می شود:

بر این اساس، مقدار 1 - نسبت پراکندگی را مشخص می کند ناشی از تأثیر عوامل دیگری است که در مدل در نظر گرفته نشده اند.

سوالاتی برای خودکنترلی

1. ماهیت روش حداقل مربعات؟

2. چند متغیر یک رگرسیون زوجی ارائه می دهند؟

3. سفتی اتصال بین تغییرات را چه ضریبی تعیین می کند؟

4. ضریب تعیین در چه حدودی تعیین می شود؟

5. برآورد پارامتر b در تحلیل همبستگی-رگرسیون؟

1. کریستوفر دوگرتی. مقدمه ای بر اقتصاد سنجی. - M.: INFRA - M، 2001 - 402 p.

2. س.ا. بورودیچ. اقتصاد سنجی. Minsk LLC "دانش جدید" 2001.


3. R.U. Rakhmetova دوره کوتاه در اقتصاد سنجی. آموزش. آلماتی 2004. -78s.

4. I.I. Eliseeva. اقتصاد سنجی. - م.: "مالی و آمار"، 2002

5. ماهنامه اطلاعات و تحلیلی.

مدل های اقتصادی غیرخطی مدل های رگرسیون غیرخطی تبدیل متغیر

مدل های اقتصادی غیرخطی..

تبدیل متغیر

ضریب کشش

اگر روابط غیر خطی بین پدیده های اقتصادی وجود داشته باشد، آنها با استفاده از توابع غیر خطی مربوطه بیان می شوند: به عنوان مثال، هذلولی متساوی الاضلاع , سهمی های درجه دوم و غیره

دو دسته از رگرسیون های غیر خطی وجود دارد:

1. رگرسیون هایی که با توجه به متغیرهای توضیحی موجود در تحلیل غیرخطی هستند، اما با توجه به پارامترهای برآورد شده خطی هستند، به عنوان مثال:

چند جمله ای درجات مختلف - , ;

هذلولی متساوی الاضلاع - ;

تابع نیمه لگاریتمی - .

2. رگرسیون هایی که در پارامترهای برآورد شده غیرخطی هستند، به عنوان مثال:

قدرت - ؛

نمایشی -;

نمایی - .

مجموع مجذور انحرافات مقادیر فردی مشخصه حاصل دراز مقدار متوسط ​​توسط تأثیر عوامل بسیاری ایجاد می شود. ما به طور مشروط کل مجموعه دلایل را به دو گروه تقسیم می کنیم: فاکتور x را مطالعه کردو عوامل دیگر

اگر ضریب بر نتیجه تأثیر نگذارد، خط رگرسیون در نمودار موازی با محور است. اوهو

سپس کل پراکندگی صفت حاصل به دلیل تأثیر عوامل دیگر است و مجموع مجذور انحرافات با باقیمانده منطبق خواهد شد. اگر عوامل دیگر بر نتیجه تأثیر نمی گذارد، پس گره خوردیبا ایکساز نظر عملکردی، و مجموع مربعات باقیمانده صفر است. در این حالت، مجموع انحرافات مجذور تبیین شده توسط رگرسیون با مجموع مجذورات یکسان است.

از آنجایی که همه نقاط میدان همبستگی روی خط رگرسیون قرار ندارند، پراکندگی آنها همیشه به دلیل تأثیر عامل رخ می دهد. ایکس، یعنی رگرسیون دربر ایکس،و ناشی از عمل علل دیگر (تغییر غیر قابل توضیح). مناسب بودن خط رگرسیون برای پیش بینی بستگی به این دارد که چه بخشی از تغییرات کل صفت درتغییرات توضیح داده شده را به حساب می آورد

بدیهی است که اگر مجذور انحرافات ناشی از رگرسیون بیشتر از مجموع مجذور باقیمانده باشد، معادله رگرسیون از نظر آماری معنادار است و عامل ایکستاثیر بسزایی در نتیجه دارد. y

, یعنی با تعداد آزادی تنوع مستقل از ویژگی. تعداد درجات آزادی مربوط به تعداد واحدهای جمعیت n و تعداد ثابت های تعیین شده از آن است. در رابطه با مسئله مورد مطالعه، تعداد درجات آزادی باید نشان دهد که چه تعداد انحراف مستقل از آن وجود دارد پ

ارزیابی اهمیت معادله رگرسیون به عنوان یک کل با کمک داده می شود اف- معیار فیشر. در این مورد، یک فرضیه صفر مطرح می شود که ضریب رگرسیون برابر با صفر است، یعنی. b= 0، و از این رو عامل ایکسبر نتیجه تأثیر نمی گذارد y

محاسبه مستقیم معیار F با تجزیه و تحلیل واریانس انجام می شود. مرکز آن بسط مجموع مجذور انحرافات متغیر است دراز مقدار متوسط دربه دو بخش - "توضیح" و "غیر قابل توضیح":

مجموع مجذور انحرافات.

مجموع مربعات انحراف که با رگرسیون توضیح داده شده است.

مجموع باقیمانده مجذور انحراف.

هر مجموع انحرافات مجذور مربوط به تعداد درجات آزادی است , یعنی با تعداد آزادی تنوع مستقل از ویژگی. تعداد درجات آزادی با تعداد واحدهای جمعیتی مرتبط است nو با تعداد ثابت های تعیین شده از آن. در رابطه با مسئله مورد مطالعه، تعداد درجات آزادی باید نشان دهد که چه تعداد انحراف مستقل از آن وجود دارد پممکن است برای تشکیل مجموع مربعات معینی لازم است.

پراکندگی به ازای درجه آزادیD.

نسبت های F (معیار F):

اگر فرضیه صفر درست باشد، سپس واریانس عامل و باقیمانده با یکدیگر تفاوتی ندارند. برای H 0، یک ابطال ضروری است تا واریانس عامل چندین برابر از باقیمانده بیشتر شود. Snedecor آماردان انگلیسی جداول مقادیر بحرانی را تهیه کرد اف-روابط در سطوح مختلف اهمیت فرضیه صفر و تعداد متفاوتی از درجات آزادی. مقدار جدول افمعیار حداکثر مقدار نسبت واریانس است که در صورت واگرایی تصادفی برای سطح معینی از احتمال وجود یک فرضیه صفر می تواند رخ دهد. مقدار محاسبه شده اف-رابطه در صورتی قابل اعتماد شناخته می شود که o بزرگتر از رابطه جدولی باشد.

در این حالت، فرضیه صفر در مورد عدم وجود رابطه ویژگی ها رد می شود و در مورد اهمیت این رابطه نتیجه گیری می شود: F fact > جدول F H 0 رد می شود.

اگر مقدار کمتر از جدول باشد F fact ‹، F جدول، پس احتمال فرضیه صفر بالاتر از سطح معین است و نمی توان آن را بدون خطر جدی نتیجه گیری اشتباه در مورد وجود یک رابطه رد کرد. در این حالت معادله رگرسیون از نظر آماری ناچیز در نظر گرفته می شود. N o منحرف نمی شود.

خطای استاندارد ضریب رگرسیون

برای ارزیابی اهمیت ضریب رگرسیون، مقدار آن با خطای استاندارد آن مقایسه می شود، یعنی مقدار واقعی تعیین می شود. تی-آزمون دانش آموز: که سپس با مقدار جدول در سطح معینی از اهمیت و تعداد درجات آزادی مقایسه می شود. n- 2).

خطای استاندارد پارامتر آ:

اهمیت ضریب همبستگی خطی بر اساس بزرگی خطا بررسی می شود. ضریب همبستگی r:

واریانس کل یک ویژگی ایکس:

رگرسیون خطی چندگانه

ساختمان نمونه

رگرسیون چندگانهرگرسیون یک ویژگی مؤثر با دو یا چند عامل، یعنی مدلی از فرم است

در صورتی که بتوان از تأثیر سایر عوامل مؤثر بر موضوع مطالعه چشم پوشی کرد، رگرسیون می تواند نتیجه خوبی در مدل سازی به همراه داشته باشد. رفتار تک تک متغیرهای اقتصادی را نمی توان کنترل کرد، یعنی نمی توان از برابری سایر شرایط برای ارزیابی تأثیر یک عامل مورد مطالعه اطمینان حاصل کرد. در این مورد، باید سعی کنید با وارد کردن آنها به مدل، تأثیر عوامل دیگر را شناسایی کنید، یعنی یک معادله رگرسیون چندگانه بسازید: y = a+b 1 x 1 +b 2 +…+b p x p + .

هدف اصلی رگرسیون چندگانه، ساخت مدلی با تعداد زیادی از عوامل و در عین حال تعیین تأثیر هر یک از آنها به صورت جداگانه و همچنین تأثیر تجمعی آنها بر شاخص مدل شده است. مشخصات مدل شامل دو حوزه سوال است: انتخاب عوامل و انتخاب نوع معادله رگرسیون.

انتخاب سردبیر
توسط یادداشت های یک معشوقه وحشی گل های زیادی وجود دارد زیبا، مراقب باشید. اما من همه چنار معمولی را دوست دارم. شاید برایش سخت تر باشد...

) یک گروه کند انبوه. در پیش بینی تور ماه مه در کشور، حزب از رهبر خود سوالاتی در مورد خلاقیت و نه تنها پرسید. تور از...

رئیس جمهور بلاروس پیشنهاد کرد که موضوع شروع کلاس های مدرسه نه در ساعت 8 صبح، بلکه در ساعت 9 صبح در پارلمان بررسی شود.

برای هر والدینی که فرزندشان به مدرسه رفته است ، مهم است که بدانند مؤسسه آموزشی هنگام انتخاب بار از چه قوانینی هدایت می شود ...
پاسخ: خداوند متعال فرمود: «إِنَّ اللَّهُ أَعْلَى الْعَظیم». نساء، 34. «إِنَّ اللَّهُ بَصِیرٌ عَلِیمٌ».
در 12 اکتبر، اسکناس های جدید 200 و 2000 روبلی در روسیه به گردش در آمد. شهرهایی که بر روی آنها تصویر شده است سواستوپل و ...
نمایندگان برخی از گونه های غیر معمول قورباغه ها و وزغ ها در اینجا جمع آوری می شوند.دوزیستان مهره دارانی هستند که هم در آب و هم در ...
تعریف. به یک نقطه منفرد از یک تابع گفته می شود که در برخی از همسایگی های این نقطه، یک تابع تحلیلی باشد (یعنی ...
در تعدادی از موارد با بررسی ضرایب سری های فرم (C) یا می توان دریافت که این سری ها همگرا هستند (شاید بدون احتساب نقاط منفرد) ...