Problemų sprendimo mažiausių kvadratų pavyzdžių metodas. Prognozės rengimas naudojant mažiausių kvadratų metodą. Uždavinio sprendimo pavyzdys Lygčių sistemos sprendimas mažiausių kvadratų metodu


Funkciją aproksimuojame 2-ojo laipsnio daugianario. Norėdami tai padaryti, apskaičiuojame normalios lygčių sistemos koeficientus:

, ,

Sudarykime įprastą mažiausių kvadratų sistemą, kurios forma:

Sistemos sprendimą lengva rasti:, , .

Taigi randamas 2-ojo laipsnio daugianario: .

Teorinė nuoroda

Atgal į puslapį<Введение в вычислительную математику. Примеры>

2 pavyzdys. Optimalaus daugianario laipsnio radimas.

Atgal į puslapį<Введение в вычислительную математику. Примеры>

3 pavyzdys. Normalios lygčių sistemos išvedimas empirinės priklausomybės parametrams rasti.

Išveskime lygčių sistemą koeficientams ir funkcijoms nustatyti , kuris atlieka nurodytos funkcijos vidurkio kvadrato aproksimaciją taškų atžvilgiu. Sukurkite funkciją ir parašykite jam būtiną ekstremalią sąlygą:

Tada įprasta sistema bus tokia:

Gavome tiesinę lygčių sistemą nežinomiems parametrams ir kurią lengva išspręsti.

Teorinė nuoroda

Atgal į puslapį<Введение в вычислительную математику. Примеры>

Pavyzdys.

Eksperimentiniai duomenys apie kintamųjų reikšmes X ir adresu pateikiami lentelėje.

Dėl jų išlyginimo funkcija

Naudojant mažiausių kvadratų metodas, apytiksliai apskaičiuokite šiuos duomenis tiesine priklausomybe y=kirvis+b(raskite parinktis a ir b). Sužinokite, kuri iš dviejų eilučių yra geresnė (mažiausių kvadratų metodo prasme) sulygina eksperimentinius duomenis. Padarykite piešinį.

Mažiausių kvadratų metodo (LSM) esmė.

Užduotis yra rasti tiesinės priklausomybės koeficientus, kuriems yra dviejų kintamųjų funkcija a ir bužima mažiausią vertę. Tai yra, atsižvelgiant į duomenis a ir b eksperimentinių duomenų nuokrypių kvadratu suma nuo rastos tiesės bus mažiausia. Tai yra mažiausių kvadratų metodo esmė.

Taigi pavyzdžio sprendimas sumažinamas iki dviejų kintamųjų funkcijos ekstremumo radimo.

Koeficientų radimo formulių išvedimas.

Sudaroma ir išsprendžiama dviejų lygčių su dviem nežinomaisiais sistema. Funkcijų dalinių išvestinių radimas pagal kintamuosius a ir b, šias išvestines prilyginsime nuliui.

Gautą lygčių sistemą išsprendžiame bet kokiu metodu (pvz pakeitimo metodas arba Cramerio metodu) ir gauti koeficientų radimo formules naudojant mažiausių kvadratų metodą (LSM).

Su duomenimis a ir b funkcija užima mažiausią vertę. Šio fakto įrodymas pateiktas žemiau esančiame tekste puslapio pabaigoje.

Tai visas mažiausių kvadratų metodas. Parametrų radimo formulė a yra sumos , , , ir parametras n yra eksperimentinių duomenų kiekis. Šių sumų vertes rekomenduojama skaičiuoti atskirai.

Koeficientas b rasta po skaičiavimo a.

Atėjo laikas prisiminti originalų pavyzdį.

Sprendimas.

Mūsų pavyzdyje n=5. Lentelę užpildome, kad būtų patogiau apskaičiuoti sumas, kurios yra įtrauktos į reikalingų koeficientų formules.

Ketvirtoje lentelės eilutėje esančios reikšmės gaunamos 2-os eilutės reikšmes padauginus iš 3-osios kiekvieno skaičiaus reikšmių i.

Penktoje lentelės eilutėje esančios reikšmės gaunamos 2-os eilutės reikšmes padalijus į kvadratą kiekvienam skaičiui i.

Paskutinio lentelės stulpelio reikšmės yra reikšmių visose eilutėse sumos.

Koeficientams rasti naudojame mažiausių kvadratų metodo formules a ir b. Juose pakeičiame atitinkamas vertes iš paskutinio lentelės stulpelio:

Vadinasi, y=0,165x+2,184 yra norima apytikslė tiesi linija.

Belieka išsiaiškinti, kuri iš eilučių y=0,165x+2,184 arba geriau apytiksliai atitinka pirminius duomenis, t. y. atlikti įvertinimą naudojant mažiausių kvadratų metodą.

Mažiausių kvadratų metodo paklaidos įvertinimas.

Norėdami tai padaryti, turite apskaičiuoti pirminių duomenų kvadratinių nuokrypių nuo šių eilučių sumas ir , mažesnė reikšmė atitinka liniją, kuri geriau apytiksliai atitinka pradinius duomenis mažiausiųjų kvadratų metodu.

Nuo tada linija y=0,165x+2,184 geriau apytiksliai atitinka pradinius duomenis.

Mažiausių kvadratų metodo (LSM) grafinė iliustracija.

Viskas puikiai atrodo diagramose. Raudona linija yra rasta linija y=0,165x+2,184, mėlyna linija yra , rožiniai taškai yra pirminiai duomenys.

Kam jis skirtas, kam skirti visi šie apytiksliai?

Aš asmeniškai naudoju duomenų išlyginimo, interpoliacijos ir ekstrapoliacijos problemoms spręsti (pradiniame pavyzdyje jūsų gali būti paprašyta rasti stebimos reikšmės reikšmę y adresu x=3 arba kada x=6 pagal MNC metodą). Tačiau daugiau apie tai kalbėsime vėliau kitoje svetainės dalyje.

Puslapio viršuje

Įrodymas.

Taip kad radus a ir b funkcija įgauna mažiausią reikšmę, būtina, kad šioje vietoje funkcijos antros eilės diferencialo kvadratinės formos matrica buvo teigiamas. Parodykime.

Antrosios eilės diferencialas turi tokią formą:

Tai yra

Todėl kvadratinės formos matrica turi formą

o elementų reikšmės nepriklauso a ir b.

Parodykime, kad matrica yra teigiama apibrėžtoji. Tam reikia, kad kampas minoras būtų teigiamas.

Pirmos eilės kampinis minoras . Nelygybė yra griežta, nes taškai nesutampa. Tai bus nurodyta toliau.

Antros eilės kampinis minoras

Įrodykime tai matematinės indukcijos metodas.

Išvada: rastos vertės a ir b atitinka mažiausią funkcijos reikšmę , todėl yra pageidaujami mažiausių kvadratų metodo parametrai.

Kada nors supranti?
Užsisakykite sprendimą

Puslapio viršuje

Prognozės rengimas naudojant mažiausių kvadratų metodą. Problemos sprendimo pavyzdys

Ekstrapoliacija - tai mokslinio tyrimo metodas, pagrįstas praeities ir dabarties tendencijų, dėsningumų, ryšių su prognozavimo objekto ateities raida sklaida. Ekstrapoliacijos metodai apima slankiojo vidurkio metodas, eksponentinis išlyginimo metodas, mažiausių kvadratų metodas.

Esmė mažiausių kvadratų metodas susideda iš kvadratinių nuokrypių tarp stebimų ir apskaičiuotų verčių sumos sumažinimo. Apskaičiuotos reikšmės randamos pagal pasirinktą lygtį – regresijos lygtį. Kuo mažesnis atstumas tarp faktinių ir apskaičiuotų verčių, tuo tikslesnė prognozė, pagrįsta regresijos lygtimi.

Kreivės pasirinkimo pagrindas yra teorinė tiriamo reiškinio, kurio kitimą atvaizduoja laiko eilutė, esmės analizė. Kartais atsižvelgiama į svarstymus apie serijos lygių augimo pobūdį. Taigi, jei tikimasi produkcijos augimo aritmetine progresija, tada išlyginimas atliekamas tiesia linija. Jei paaiškėja, kad augimas yra eksponentinis, tada išlyginimas turėtų būti atliekamas pagal eksponentinę funkciją.

Mažiausių kvadratų metodo darbo formulė : Y t+1 = a*X + b, kur t + 1 yra prognozuojamas laikotarpis; Уt+1 – prognozuojamas rodiklis; a ir b yra koeficientai; X yra laiko simbolis.

Koeficientai a ir b apskaičiuojami pagal šias formules:

kur, Uf - faktinės dinamikos serijos vertės; n yra lygių skaičius laiko eilutėje;

Laiko eilučių išlyginimas mažiausių kvadratų metodu padeda atspindėti tiriamo reiškinio raidos modelius. Analitinėje tendencijos išraiškoje laikas laikomas nepriklausomu kintamuoju, o eilučių lygiai veikia kaip šio nepriklausomo kintamojo funkcija.

Reiškinio raida priklauso ne nuo to, kiek metų praėjo nuo pradžios taško, o nuo to, kokie veiksniai turėjo įtakos jo raidai, kokia kryptimi ir kokiu intensyvumu. Iš to aišku, kad reiškinio raida laike atsiranda dėl šių veiksnių veikimo.

Teisingai nustatyti kreivės tipą, analitinės priklausomybės nuo laiko tipą yra viena iš sunkiausių išankstinės prognozės analizės užduočių. .

Trendą apibūdinančios funkcijos, kurios parametrai nustatomi mažiausių kvadratų metodu, tipo parinkimas dažniausiai yra empirinis, sukonstruojant daugybę funkcijų ir lyginant jas tarpusavyje pagal vidutinę kvadratinę paklaidą. apskaičiuojamas pagal formulę:

kur Uf - faktinės dinamikos serijos vertės; Ur – apskaičiuotos (išlygintos) laiko eilutės reikšmės; n yra lygių skaičius laiko eilutėje; p – tendenciją (plėtros tendenciją) apibūdinančiose formulėse apibrėžtų parametrų skaičius.

Mažiausių kvadratų metodo trūkumai :

  • bandant apibūdinti tiriamą ekonominį reiškinį naudojant matematinę lygtį, prognozė bus tiksli trumpą laiką ir regresijos lygtis turėtų būti perskaičiuojama, kai atsiranda naujos informacijos;
  • regresijos lygties pasirinkimo sudėtingumas, kuris išsprendžiamas naudojant standartines kompiuterines programas.

Mažiausių kvadratų metodo naudojimo prognozei sudaryti pavyzdys

Užduotis . Yra duomenų, apibūdinančių nedarbo lygį regione, proc.

  • Sudarykite nedarbo lygio regione prognozę lapkričio, gruodžio, sausio mėnesiams, naudodami metodus: slankusis vidurkis, eksponentinis išlyginimas, mažiausi kvadratai.
  • Apskaičiuokite gautų prognozių klaidas naudodami kiekvieną metodą.
  • Palyginkite gautus rezultatus, padarykite išvadas.

Mažiausių kvadratų sprendimas

Sprendimui sudarysime lentelę, kurioje atliksime reikiamus skaičiavimus:

ε = 28,63/10 = 2,86 % prognozės tikslumas aukštas.

Išvada : Skaičiavimų metu gautų rezultatų palyginimas slankiojo vidurkio metodas , eksponentinis išlyginimas ir mažiausių kvadratų metodą, galime teigti, kad vidutinė santykinė paklaida skaičiavimuose eksponentinės išlyginimo metodu patenka į 20-50%. Tai reiškia, kad prognozės tikslumas šiuo atveju yra tik patenkinamas.

Pirmuoju ir trečiuoju atveju prognozės tikslumas yra didelis, nes vidutinė santykinė paklaida yra mažesnė nei 10%. Tačiau slankiojo vidurkio metodas leido gauti patikimesnius rezultatus (lapkričio prognozė - 1,52%, gruodžio mėnesio prognozė - 1,53%, sausio mėnesio prognozė - 1,49%), nes vidutinė santykinė paklaida naudojant šį metodą yra mažiausia - 1 ,13 proc.

Mažiausio kvadrato metodas

Kiti susiję straipsniai:

Naudotų šaltinių sąrašas

  1. Mokslinės ir metodinės rekomendacijos socialinių rizikų diagnostikos ir iššūkių, grėsmių ir socialinių pasekmių prognozavimo klausimais. Rusijos valstybinis socialinis universitetas. Maskva. 2010 m.;
  2. Vladimirova L.P. Prognozavimas ir planavimas rinkos sąlygomis: Proc. pašalpa. M .: leidykla "Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Liaudies ūkio prognozavimas: edukacinis ir metodinis vadovas. Jekaterinburgas: leidykla „Ural“. valstybė. ekonomika universitetas, 2007;
  4. Slutskin L.N. Verslo prognozavimo MBA kursas. Maskva: „Alpina Business Books“, 2006 m.

MNE programa

Įveskite duomenis

Duomenys ir aproksimacija y = a + b x

i- eksperimentinio taško numeris;
x i- fiksuoto parametro reikšmė taške i;
y i- išmatuoto parametro vertė taške i;
ω i- matavimo svoris taške i;
y i, skaičiuok.- skirtumas tarp išmatuotos vertės ir vertės, apskaičiuotos pagal regresiją y taške i;
S x i (x i)- klaidų įvertinimas x i matuojant y taške i.

Duomenys ir aproksimacija y = kx

i x i y i ω i y i, skaičiuok. y i S x i (x i)

Spustelėkite diagramą

MNC internetinės programos vartotojo vadovas.

Duomenų lauke kiekvienoje atskiroje eilutėje įveskite „x“ ir „y“ reikšmes viename eksperimentiniame taške. Reikšmės turi būti atskirtos tarpais (tarpu arba tabuliavimu).

Trečioji reikšmė gali būti „w“ taško svoris. Jei taško svoris nenurodytas, tada jis yra lygus vienetui. Daugeliu atvejų eksperimentinių taškų svoriai nežinomi arba neapskaičiuoti; visi eksperimentiniai duomenys laikomi lygiaverčiais. Kartais tiriamo verčių diapazono svoriai tikrai nėra lygiaverčiai ir netgi gali būti apskaičiuoti teoriškai. Pavyzdžiui, spektrofotometrijoje svoriai gali būti apskaičiuojami naudojant paprastas formules, nors iš esmės visi to nepaiso, kad sumažintų darbo sąnaudas.

Duomenis per mainų sritį galima įklijuoti iš biuro paketo skaičiuoklės, pvz., „Excel“ iš „Microsoft Office“ arba „Calc“ iš „Open Office“. Norėdami tai padaryti, skaičiuoklėje pasirinkite duomenų diapazoną, kurį norite kopijuoti, nukopijuokite į mainų sritį ir įklijuokite duomenis į šio puslapio duomenų lauką.

Norint apskaičiuoti mažiausiųjų kvadratų metodą, reikia bent dviejų taškų, kad būtų galima nustatyti du koeficientus "b" - tiesės polinkio kampo liestinę ir "a" - vertę, kurią atskiria tiesė ant "y". ` ašis.

Norint įvertinti apskaičiuotų regresijos koeficientų paklaidą, reikia nustatyti daugiau nei du eksperimentinių taškų skaičių.

Mažiausių kvadratų metodas (LSM).

Kuo didesnis eksperimentinių taškų skaičius, tuo tikslesnis statistinis koeficientų įvertis (dėl Stjudento koeficiento sumažėjimo) ir tuo įvertis artimesnis bendrosios imties įverčiui.

Vertybių gavimas kiekviename eksperimentiniame taške dažnai yra susijęs su didelėmis darbo sąnaudomis, todėl dažnai atliekamas kompromisinis eksperimentų skaičius, kuris suteikia lengvai suprantamą įvertinimą ir nesukelia pernelyg didelių darbo sąnaudų. Paprastai eksperimentinių taškų skaičius tiesinei mažiausiųjų kvadratų priklausomybei su dviem koeficientais pasirenkamas 5-7 taškų srityje.

Trumpa tiesinės priklausomybės mažiausių kvadratų teorija

Tarkime, kad turime eksperimentinių duomenų rinkinį reikšmių porų pavidalu [`y_i`, `x_i`], kur i yra vieno eksperimentinio matavimo skaičius nuo 1 iki n; „y_i“ – išmatuotos vertės taške „i“ reikšmė; „x_i“ – parametro, kurį nustatome taške „i“, reikšmė.

Pavyzdys yra Ohmo dėsnio veikimas. Keisdami įtampą (potencialų skirtumą) tarp elektros grandinės sekcijų, išmatuojame per šią sekciją einančios srovės kiekį. Fizika suteikia mums eksperimentiškai nustatytą priklausomybę:

„I=U/R“,
kur "I" - srovės stiprumas; `R` - pasipriešinimas; "U" - įtampa.

Šiuo atveju „y_i“ yra išmatuota srovės vertė, o „x_i“ yra įtampos vertė.

Kaip kitą pavyzdį apsvarstykite šviesos sugertį medžiagos tirpale. Chemija suteikia mums formulę:

"A = εl C",
čia "A" yra tirpalo optinis tankis; `ε` – tirpios medžiagos pralaidumas; `l` - kelio ilgis, kai šviesa praeina pro kiuvetę su tirpalu; "C" yra ištirpusios medžiagos koncentracija.

Šiuo atveju „y_i“ yra išmatuotas optinis tankis „A“, o „x_i“ yra mūsų nustatyta medžiagos koncentracija.

Apsvarstysime atvejį, kai santykinė paklaida nustatant „x_i“ yra daug mažesnė nei santykinė paklaida matuojant „y_i“. Taip pat manysime, kad visos išmatuotos y_i reikšmės yra atsitiktinės ir normaliai paskirstytos, t.y. laikytis normalaus paskirstymo įstatymo.

Esant tiesinei „y“ priklausomybei nuo „x“, galime parašyti teorinę priklausomybę:
y = a + bx.

Geometriniu požiūriu koeficientas „b“ reiškia linijos polinkio kampo liestinę su „x“ ašimi, o koeficientas „a“ – „y“ reikšmę linijos susikirtimo taške. linija su „y“ ašimi (jei „x = 0“).

Regresijos tiesės parametrų radimas.

Eksperimento metu išmatuotos „y_i“ vertės negali būti tiksliai teorinėje linijoje dėl matavimo klaidų, kurios visada būdingos realiame gyvenime. Todėl tiesinė lygtis turi būti pavaizduota lygčių sistema:
„y_i = a + b x_i + ε_i“ (1),
kur „ε_i“ yra nežinoma „y“ matavimo paklaida „i“ eksperimente.

Priklausomybė (1) taip pat vadinama regresija, t.y. dviejų dydžių priklausomybę vienas nuo kito, turinčią statistinę reikšmę.

Priklausomybės atkūrimo užduotis – iš eksperimentinių taškų [`y_i`, `x_i`] rasti koeficientus `a` ir `b`.

Koeficientams rasti paprastai naudojami „a“ ir „b“. mažiausių kvadratų metodas(MNK). Tai ypatingas didžiausios tikimybės principo atvejis.

Perrašykime (1) kaip „ε_i = y_i - a - b x_i“.

Tada klaidų kvadratų suma bus tokia
„Φ = suma_(i=1)^(n) ε_i^2 = suma_(i=1)^(n) (y_i – a – b x_i)^2“. (2)

Mažiausių kvadratų metodo principas yra sumažinti sumą (2) atsižvelgiant į parametrus "a" ir "b"..

Minimalus dydis pasiekiamas, kai sumos (2) dalinės išvestinės koeficientų „a“ ir „b“ atžvilgiu yra lygios nuliui:
`frac(dalinė Φ)(dalinė a) = trupmena(dalinė suma_(i=1)^(n) (y_i - a - b x_i)^2)(dalinė a) = 0
„frac(dalinis Φ)(dalinis b) = trupmenas(dalinė suma_(i=1)^(n) (y_i - a - b x_i)^2)(dalinė b) = 0"

Išplėsdami išvestines, gauname dviejų lygčių sistemą su dviem nežinomaisiais:
„suma_(i=1)^(n) (2a + 2bx_i – 2y_i) = suma_(i=1)^(n) (a + bx_i – y_i) = 0“
„suma_(i=1)^(n) (2bx_i^2 + 2ax_i – 2x_iy_i) = suma_(i=1)^(n) (bx_i^2 + ax_i – x_iy_i) = 0“

Atsidarome skliausteliuose ir sumas, nepriklausomas nuo norimų koeficientų, perkeliame į kitą pusę, gauname tiesinių lygčių sistemą:
„suma_(i=1)^(n) y_i = a n + b suma_(i=1)^(n) bx_i“
„suma_(i=1)^(n) x_iy_i = a suma_(i=1)^(n) x_i + b suma_(i=1)^(n) x_i^2“

Išspręsdami gautą sistemą, randame koeficientų "a" ir "b" formules:

`a = frac(sum_(i=1)^(n) y_i suma_(i=1)^(n) x_i^2 - suma_(i=1)^(n) x_i suma_(i=1)^(n ) x_iy_i) (n suma_(i=1)^(n) x_i^2 — (suma_(i=1)^(n) x_i)^2)" (3.1)

`b = frac(n suma_(i=1)^(n) x_iy_i - suma_(i=1)^(n) x_i suma_(i=1)^(n) y_i) (n suma_(i=1)^ (n) x_i^2 – (suma_(i=1)^(n) x_i)^2)“ (3.2)

Šios formulės turi sprendinius, kai `n > 1` (liniją galima nubrėžti naudojant bent 2 taškus) ir kai determinantas `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1) )^(n) x_i)^2 != 0`, t.y. kai eksperimento „x_i“ taškai yra skirtingi (t. y. kai linija nėra vertikali).

Regresijos tiesės koeficientų paklaidų įvertinimas

Norint tiksliau įvertinti koeficientų „a“ ir „b“ apskaičiavimo klaidą, pageidautina daug eksperimentinių taškų. Kai `n = 2`, neįmanoma įvertinti koeficientų paklaidos, nes apytikslė tiesė vienareikšmiškai eis per du taškus.

Nustatoma atsitiktinio dydžio `V` paklaida klaidų kaupimo įstatymas
„S_V^2 = suma_(i=1)^p (frac(dalinis f)(dalinis z_i))^2 S_(z_i)^2“,
kur „p“ yra „z_i“ parametrų su „S_(z_i)“ klaida, turinčių įtakos „S_V“ klaidai, skaičius;
„f“ yra „V“ priklausomybės funkcija nuo „z_i“.

Parašykime klaidų kaupimosi dėsnį koeficientų `a` ir `b` paklaidai
`S_a^2 = suma_(i=1)^(n)(trupinis(dalinis a)(dalinis y_i))^2 S_(y_i)^2 + suma_(i=1)^(n)(frac(dalinis a) )(dalinis x_i))^2 S_(x_i)^2 = S_y^2 suma_(i=1)^(n)(frac(dalinis a)(dalinis y_i))^2`,
`S_b^2 = suma_(i=1)^(n)(trupinis(dalinis b)(dalinis y_i))^2 S_(y_i)^2 + suma_(i=1)^(n)(trupinis(dalinis b) )(dalinis x_i))^2 S_(x_i)^2 = S_y^2 suma_(i=1)^(n)(frac(dalinis b)(dalinis y_i))^2`,
nes „S_(x_i)^2 = 0“ (anksčiau padarėme išlygą, kad „x“ klaida yra nereikšminga).

„S_y^2 = S_(y_i)^2“ – paklaida (dispersija, standartinis nuokrypis kvadratu) matmenyje „y“, darant prielaidą, kad klaida yra vienoda visoms „y“ reikšmėms.

Pakeisdami formules, skirtas „a“ ir „b“ apskaičiavimui gautose išraiškose, gauname

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i suma_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n suma_(i=1)^(n) x_i^2 - (suma_(i=1)^(n) x_i)^2) suma_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)" (4.1)

`S_b^2 = S_y^2 kadras(suma_(i=1)^(n) (n x_i - suma_(i=1)^(n) x_i)^2) (D^2) = S_y^2 kadras( n (n suma_(i=1)^(n) x_i^2 - (suma_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) (4.2)

Daugumoje tikrų eksperimentų „Sy“ reikšmė nėra matuojama. Tam reikia atlikti kelis lygiagrečius matavimus (eksperimentus) viename ar keliuose plano taškuose, o tai padidina eksperimento laiką (ir galbūt ir kainą). Todėl paprastai daroma prielaida, kad "y" nuokrypis nuo regresijos linijos gali būti laikomas atsitiktiniu. Sklaidos įvertis „y“ šiuo atveju apskaičiuojamas pagal formulę.

„S_y^2 = S_(y, poilsis)^2 = frac(suma_(i=1)^n (y_i - a - b x_i)^2) (n-2)".

Daliklis „n-2“ atsiranda todėl, kad sumažinome laisvės laipsnių skaičių, nes apskaičiavome du koeficientus tai pačiai eksperimentinių duomenų imčiai.

Šis įvertinimas taip pat vadinamas likutine dispersija, palyginti su regresijos linija „S_(y, rest)^2“.

Koeficientų reikšmingumo vertinimas atliekamas pagal Studento kriterijų

"t_a = frac(|a|) (S_a)", "t_b = frac(|b|) (S_b)"

Jei apskaičiuoti kriterijai `t_a`, `t_b` yra mažesni už lentelės kriterijus `t(P, n-2)`, tai laikoma, kad atitinkamas koeficientas reikšmingai nesiskiria nuo nulio esant nurodytai tikimybei `P`.

Norėdami įvertinti tiesinio ryšio aprašymo kokybę, galite palyginti `S_(y, rest)^2` ir `S_(bar y)`, palyginti su vidurkiu, naudodami Fišerio kriterijų.

`S_(y juosta) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i=) 1)^n y_i) /n)^2) (n-1)“ – „y“ dispersijos, palyginti su vidurkiu, imties įvertinimas.

Norint įvertinti priklausomybės apibūdinimo regresijos lygties efektyvumą, apskaičiuojamas Fišerio koeficientas
„F = S_(y juosta) / S_(y, poilsis)^2“,
kuris lyginamas su lentelės Fišerio koeficientu „F(p, n-1, n-2)“.

Jei „F > F(P, n-1, n-2)“, skirtumas tarp priklausomybės aprašymo „y = f(x)“ naudojant regresijos lygtį ir aprašymo naudojant vidurkį, laikomas statistiškai reikšmingu su tikimybe. "P". Tie. regresija geriau apibūdina priklausomybę nei „y“ sklaida aplink vidurkį.

Spustelėkite diagramą
pridėti vertes į lentelę

Mažiausio kvadrato metodas. Mažiausių kvadratų metodas reiškia nežinomų parametrų a, b, c, priimtos funkcinės priklausomybės nustatymą

Mažiausių kvadratų metodas reiškia nežinomų parametrų nustatymą a, b, c,… priimta funkcinė priklausomybė

y = f(x,a,b,c,…),

kuri duotų paklaidos vidutinio kvadrato (dispersijos) minimumą

, (24)

čia x i , y i - skaičių porų rinkinys, gautas iš eksperimento.

Kadangi kelių kintamųjų funkcijos ekstremumo sąlyga yra sąlyga, kad jos dalinės išvestinės yra lygios nuliui, tada parametrai a, b, c,… nustatomi iš lygčių sistemos:

; ; ; … (25)

Reikia atsiminti, kad parametrams parinkti po funkcijos formos naudojamas mažiausių kvadratų metodas y = f(x) apibrėžta.

Jei iš teorinių samprotavimų neįmanoma padaryti išvadų, kokia turėtų būti empirinė formulė, tuomet reikia vadovautis vizualiniais vaizdais, pirmiausia grafiniu stebimų duomenų atvaizdavimu.

Praktiškai dažniausiai apsiribojama šių tipų funkcijomis:

1) linijinis ;

2) kvadratinis a .

(žr. paveikslėlį). Būtina rasti tiesės lygtį

Kuo mažesnis skaičius absoliučia verte, tuo geriau pasirenkama tiesė (2). Kaip tiesės (2) pasirinkimo tikslumo charakteristika, galime paimti kvadratų sumą

Minimalios sąlygos S bus

(6)
(7)

(6) ir (7) lygtis gali būti parašytos tokia forma:

(8)
(9)

Iš (8) ir (9) lygčių lengva rasti a ir b pagal eksperimentines reikšmes x i ir y i . Tiesė (2), apibrėžta (8) ir (9) lygtimis, vadinama tiese, gauta mažiausių kvadratų metodu (šis pavadinimas pabrėžia, kad kvadratų suma S turi minimumą). (8) ir (9) lygtys, iš kurių nustatoma tiesė (2), vadinamos normaliosiomis lygtimis.

Galima nurodyti paprastą ir bendrą normaliųjų lygčių sudarymo būdą. Naudodami eksperimentinius taškus (1) ir lygtį (2), galime užrašyti a ir b lygčių sistemą

y 1 \u003dax 1 +b,
y 2 \u003dax 2 +b,
...
(10)
yn=axn+b,

Kiekvienos iš šių lygčių kairę ir dešinę dalis padauginkite iš koeficiento, esančio pirmajame nežinomajame a (t. y. x 1 , x 2 , ..., x n) ir sudėkite gautas lygtis, kad gautumėte pirmąją normaliąją lygtį (8).

Kiekvienos iš šių lygčių kairę ir dešinę puses padauginame iš antrojo nežinomo b koeficiento, t.y. 1 ir pridėkite gautas lygtis, taip gaudami antrą normaliąją lygtį (9).

Šis normaliųjų lygčių gavimo būdas yra bendras: jis tinka, pavyzdžiui, funkcijai

yra pastovi reikšmė ir ji turi būti nustatyta iš eksperimentinių duomenų (1).

K lygčių sistemą galima parašyti:

Raskite tiesę (2) naudodami mažiausiųjų kvadratų metodą.

Sprendimas. Mes randame:

x i = 21, y i = 46,3, x i 2 = 91, x i y i = 179,1.

Rašome (8) ir (9) lygtis

Iš čia randame

Mažiausių kvadratų metodo tikslumo įvertinimas

Pateiksime metodo tikslumą tiesiniu atveju, kai vyksta (2) lygtis.

Tegul eksperimentinės reikšmės x i yra tikslios, o eksperimentinės reikšmės y i turi atsitiktinių paklaidų su vienoda dispersija visiems i.

Pristatome žymėjimą

(16)

Tada (8) ir (9) lygčių sprendiniai gali būti pavaizduoti kaip

(17)
(18)
kur
(19)
Iš (17) lygties randame
(20)
Panašiai iš (18) lygties gauname

(21)
nes
(22)
Iš (21) ir (22) lygčių randame
(23)

(20) ir (23) lygtys apskaičiuoja koeficientų, nustatytų pagal (8) ir (9) lygtis, tikslumą.

Atkreipkite dėmesį, kad koeficientai a ir b yra koreliuojami. Paprastomis transformacijomis randame jų koreliacijos momentą.

Iš čia randame

0,072, kai x = 1 ir 6,

0,041, kai x = 3,5.

Literatūra

Krantas. Ya. B. Statistiniai analizės ir kokybės kontrolės bei patikimumo metodai. M.: Gosenergoizdat, 1962, p. 552, 92-98 p.

Ši knyga skirta įvairiems inžinieriams (mokslinių tyrimų institutams, projektavimo biurams, bandymų aikštelėms ir gamykloms), užsiimantiems elektroninės įrangos ir kitų masinės pramonės gaminių (mašinų gamybos, instrumentų gamybos, artilerijos ir kt.) kokybės ir patikimumo nustatymu.

Knygoje pateikiamas matematinės statistikos metodų pritaikymas apdorojant ir įvertinant testų rezultatus, kurie lemia tikrinamų gaminių kokybę ir patikimumą. Skaitytojų patogumui pateikiama reikiama informacija iš matematinės statistikos, taip pat daugybė pagalbinių matematinių lentelių, palengvinančių reikiamus skaičiavimus.

Pristatymą iliustruoja daugybė pavyzdžių, paimtų iš radijo elektronikos ir artilerijos technologijų srities.

Mažiausių kvadratų metodas yra vienas iš labiausiai paplitusių ir labiausiai išvystytas dėl jo linijinių parametrų įvertinimo metodų paprastumas ir efektyvumas. Tuo pačiu metu jį naudojant reikia laikytis tam tikro atsargumo, nes naudojant jį sukurti modeliai gali neatitikti daugelio jų parametrų kokybės reikalavimų ir dėl to „negerai“ atspindėti proceso raidos modelius.

Išsamiau panagrinėkime tiesinio ekonometrinio modelio parametrų įvertinimo taikant mažiausiųjų kvadratų metodą procedūrą. Tokį modelį bendra forma galima pavaizduoti (1.2) lygtimi:

y t = a 0 + a 1 x 1 t +...+ a n x nt + ε t .

Pradiniai duomenys vertinant parametrus a 0 , a 1 ,..., a n yra priklausomo kintamojo reikšmių vektorius y= (y 1 , y 2 , ... , y T)" ir nepriklausomų kintamųjų reikšmių matrica

kuriame pirmasis stulpelis, susidedantis iš vienetų, atitinka modelio koeficientą .

Mažiausių kvadratų metodas gavo savo pavadinimą remiantis pagrindiniu principu, kad jo pagrindu gauti parametrų įverčiai turi atitikti: modelio paklaidos kvadratų suma turi būti minimali.

Užduočių sprendimo mažiausių kvadratų metodu pavyzdžiai

2.1 pavyzdys. Prekybos įmonė turi 12 parduotuvių tinklą, informacija apie jų veiklą pateikta lentelėje. 2.1.

Įmonės vadovybė norėtų sužinoti, kaip metinis dydis priklauso nuo parduotuvės prekybos ploto.

2.1 lentelė

Parduotuvės numeris

Metinė apyvarta, milijonai rublių

Prekybos plotas, tūkst.m 2

Mažiausių kvadratų sprendimas. Nurodykime - metinės parduotuvės apyvartą, milijonus rublių; - parduotuvės prekybos plotas, tūkst.m2.

2.1 pav. 2.1 pavyzdžio sklaida

Nustatyti funkcinio ryšio tarp kintamųjų formą ir sudaryti sklaidos diagramą (2.1 pav.).

Remiantis sklaidos diagrama, galime daryti išvadą, kad metinė apyvarta teigiamai priklauso nuo pardavimo ploto (t.y. y didės augant ). Tinkamiausia funkcinio ryšio forma yra − linijinis.

Informacija apie tolesnius skaičiavimus pateikta lentelėje. 2.2. Naudodami mažiausių kvadratų metodą, įvertiname tiesinio vieno koeficiento ekonometrinio modelio parametrus

2.2 lentelė

Šiuo būdu,

Todėl prekybos plotui padidėjus 1 tūkst. m 2, o kitiems rodikliams nesikeičiant, vidutinė metinė apyvarta padidėja 67,8871 mln. rublių.

2.2 pavyzdys.Įmonės vadovybė pastebėjo, kad metinė apyvarta priklauso ne tik nuo parduotuvės prekybos ploto (žr. 2.1 pavyzdį), bet ir nuo vidutinio lankytojų skaičiaus. Atitinkama informacija pateikta lentelėje. 2.3.

2.3 lentelė

Sprendimas. Pažymėkite – vidutinis parduotuvės lankytojų skaičius per dieną, tūkst. žmonių.

Nustatyti funkcinio ryšio tarp kintamųjų formą ir sudaryti sklaidos diagramą (2.2 pav.).

Remiantis sklaidos diagrama, galime daryti išvadą, kad metinė apyvarta yra teigiamai susijusi su vidutiniu lankytojų skaičiumi per dieną (t.y. y didės augant ). Funkcinės priklausomybės forma yra tiesinė.

Ryžiai. 2.2. Taškinė diagrama, pavyzdžiui, 2.2

2.4 lentelė

Apskritai būtina nustatyti dviejų faktorių ekonometrinio modelio parametrus

y t \u003d a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Informacija, reikalinga tolesniems skaičiavimams, pateikta lentelėje. 2.4.

Įvertinkime tiesinio dviejų faktorių ekonometrinio modelio parametrus mažiausių kvadratų metodu.

Šiuo būdu,

Įvertinus koeficientą = 61,6583, matyti, kad, esant kitoms sąlygoms, prekybos plotui padidėjus 1 tūkst.m 2, metinė apyvarta vidutiniškai padidės 61,6583 mln.

  • įvadinė pamoka nemokamai;
  • Daug patyrusių mokytojų (gimtoji ir rusakalbių);
  • Kursai NE konkrečiam laikotarpiui (mėnesiui, šešiems mėnesiams, metams), o tam tikram pamokų skaičiui (5, 10, 20, 50);
  • Daugiau nei 10 000 patenkintų klientų.
  • Vienos pamokos su rusakalbiu mokytoju kaina - nuo 600 rublių, su gimtąja kalba - nuo 1500 rublių

Mažiausių kvadratų metodo esmė yra ieškant trendo modelio parametrų, geriausiai apibūdinančių kokio nors atsitiktinio reiškinio raidos tendenciją laike ar erdvėje (trendas – šios raidos tendenciją apibūdinanti linija). Mažiausių kvadratų metodo (OLS) užduotis yra surasti ne tik kokį nors tendencijų modelį, bet ir rasti geriausią ar optimalų modelį. Šis modelis bus optimalus, jei kvadratinių nuokrypių tarp stebimų faktinių verčių ir atitinkamų apskaičiuotų tendencijų verčių suma yra minimali (mažiausia):

kur yra standartinis nuokrypis tarp stebimos tikrosios vertės

ir atitinkama apskaičiuota tendencijos vertė,

Tikroji (stebėta) tiriamo reiškinio vertė,

Numatoma tendencijų modelio vertė,

Tiriamo reiškinio stebėjimų skaičius.

MNC retai naudojamas atskirai. Paprastai koreliacijos tyrimuose jis dažniausiai naudojamas tik kaip būtina technika. Reikia atsiminti, kad LSM informacinė bazė gali būti tik patikima statistinė eilutė, o stebėjimų skaičius neturėtų būti mažesnis nei 4, priešingu atveju LSM išlyginimo procedūros gali prarasti sveiką protą.

OLS įrankių rinkinys sumažintas iki šių procedūrų:

Pirmoji procedūra. Pasirodo, ar apskritai yra tendencija keisti gaunamą atributą, kai pasikeičia pasirinktas veiksnys-argumentas, arba, kitaip tariant, ar yra ryšys tarp " adresu "ir" X ».

Antroji procedūra. Nustatoma, kuri linija (trajektorija) geriausiai gali apibūdinti ar charakterizuoti šią tendenciją.

Trečia procedūra.

Pavyzdys. Tarkime, kad turime informaciją apie vidutinį saulėgrąžų derlių tiriamame ūkyje (9.1 lentelė).

9.1 lentelė

Stebėjimo numeris

Produktyvumas, k/ha

Kadangi saulėgrąžų gamybos technologijos lygis mūsų šalyje per pastaruosius 10 metų beveik nepasikeitė, tai reiškia, kad greičiausiai derliaus svyravimai analizuojamu laikotarpiu labai priklausė nuo oro ir klimato sąlygų svyravimų. Ar tai tiesa?

Pirmoji MNC procedūra. Tikrinama hipotezė apie saulėgrąžų derliaus kitimo tendencijos egzistavimą, priklausomai nuo oro ir klimato sąlygų pokyčių per analizuojamus 10 metų.

Šiame pavyzdyje „ y » patartina imti saulėgrąžų derlių, o « x » yra stebimų metų skaičius analizuojamu laikotarpiu. Tikrinant hipotezę apie bet kokį ryšį tarp " x "ir" y » galima atlikti dviem būdais: rankiniu būdu ir kompiuterinių programų pagalba. Žinoma, esant kompiuterinėms technologijoms, ši problema išsprendžiama savaime. Tačiau norint geriau suprasti OLS įrankių rinkinį, patartina patikrinti hipotezę apie ryšį tarp " x "ir" y » rankiniu būdu, kai po ranka yra tik rašiklis ir paprastas skaičiuotuvas. Tokiais atvejais tendencijos egzistavimo hipotezę vizualiai geriausia patikrinti pagal analizuojamos laiko eilutės grafinio vaizdo vietą – koreliacijos lauką:

Mūsų pavyzdyje koreliacijos laukas yra aplink lėtai kylančią liniją. Tai savaime rodo, kad egzistuoja tam tikra saulėgrąžų derliaus kitimo tendencija. Neįmanoma kalbėti apie bet kokios tendencijos buvimą tik tada, kai koreliacijos laukas atrodo kaip apskritimas, apskritimas, griežtai vertikalus ar griežtai horizontalus debesis arba susideda iš atsitiktinai išsibarsčiusių taškų. Visais kitais atvejais hipotezė, kad egzistuoja ryšys tarp " x "ir" y ir tęsti tyrimus.

Antroji MNC procedūra. Nustatoma, kuri linija (trajektorija) geriausiai gali apibūdinti ar charakterizuoti saulėgrąžų derliaus kitimo tendenciją analizuojamu laikotarpiu.

Esant kompiuterinėms technologijoms, optimalios tendencijos pasirinkimas vyksta automatiškai. Naudojant „rankinį“ apdorojimą, optimalios funkcijos pasirinkimas, kaip taisyklė, atliekamas vizualiai - pagal koreliacijos lauko vietą. Tai yra, pagal diagramos tipą parenkama linijos lygtis, kuri geriausiai atitinka empirinę tendenciją (faktinę trajektoriją).

Kaip žinia, gamtoje egzistuoja didžiulė funkcinių priklausomybių įvairovė, todėl vizualiai išanalizuoti net nedidelę jų dalį itin sunku. Laimei, realioje ekonominėje praktikoje daugumą santykių galima tiksliai apibūdinti arba parabole, arba hiperbole, arba tiesia linija. Šiuo atžvilgiu, naudodami „rankinį“ variantą, skirtą geriausios funkcijos pasirinkimui, galite apsiriboti tik šiais trimis modeliais.

Hiperbolė:

Antrosios eilės parabolė: :

Nesunku pastebėti, kad mūsų pavyzdyje saulėgrąžų derliaus kitimo tendenciją per analizuojamus 10 metų geriausiai apibūdina tiesia linija, todėl regresijos lygtis bus tiesioji lygtis.

Trečia procedūra. Apskaičiuojami šią tiesę apibūdinančios regresijos lygties parametrai arba, kitaip tariant, nustatoma analitinė formulė, apibūdinanti geriausią tendencijos modelį.

Regresijos lygties parametrų reikšmių radimas, mūsų atveju, parametrai ir , yra LSM šerdis. Šis procesas sumažinamas iki normalių lygčių sistemos sprendimo.

(9.2)

Ši lygčių sistema gana lengvai išsprendžiama Gauso metodu. Prisiminkite, kad dėl sprendimo mūsų pavyzdyje randamos ir parametrų reikšmės. Taigi rasta regresijos lygtis turės tokią formą:

Jis plačiai naudojamas ekonometrijoje aiškios ekonominės jo parametrų interpretacijos forma.

Tiesinė regresija sumažinama iki formos lygties

arba

Tipo lygtis leidžia naudoti nurodytas parametrų reikšmes X turi teorines efektyvios savybės vertes, pakeičiant jas faktines faktoriaus vertes X.

Tiesinės regresijos sudarymas priklauso nuo jos parametrų įvertinimo − a ir in. Tiesinės regresijos parametrų įverčius galima rasti įvairiais metodais.

Klasikinis tiesinės regresijos parametrų vertinimo metodas yra pagrįstas mažiausių kvadratų(MNK).

LSM leidžia gauti tokius parametrų įverčius a ir į, pagal kurią gaunamo požymio faktinių verčių kvadratinių nuokrypių suma (y) iš apskaičiuoto (teorinio) minimalus:

Norint rasti funkcijos minimumą, reikia apskaičiuoti dalines išvestines kiekvieno parametro atžvilgiu a ir b ir prilyginkite juos nuliui.

Pažymėkite S, tada:

Transformavę formulę, gauname tokią normaliųjų lygčių sistemą parametrams įvertinti a ir in:

Spręsdami normaliųjų lygčių sistemą (3.5) kintamųjų nuoseklaus eliminavimo metodu arba determinantų metodu, randame norimus parametrų įverčius a ir in.

Parametras in vadinamas regresijos koeficientu. Jo reikšmė rodo vidutinį rezultato pokytį koeficientui pasikeitus vienu vienetu.

Regresijos lygtis visada papildoma santykio tvirtumo rodikliu. Naudojant tiesinę regresiją, linijinės koreliacijos koeficientas veikia kaip toks indikatorius. Yra įvairių linijinės koreliacijos koeficiento formulės modifikacijų. Kai kurie iš jų yra išvardyti žemiau:

Kaip žinote, tiesinės koreliacijos koeficientas yra ribose: -1 1.

Norint įvertinti tiesinės funkcijos pasirinkimo kokybę, apskaičiuojamas kvadratas

Tiesinės koreliacijos koeficientas vadinamas determinacijos koeficientas . Determinacijos koeficientas apibūdina efektyviojo požymio dispersijos proporciją y, paaiškinama regresija, atsižvelgiant į gauto požymio bendrą dispersiją:

Atitinkamai, reikšmė 1 – apibūdina dispersijos proporciją y, sukelta kitų veiksnių, į kuriuos neatsižvelgta modelyje, įtakos.

Klausimai savikontrolei

1. Mažiausių kvadratų metodo esmė?

2. Kiek kintamųjų suteikia porinę regresiją?

3. Koks koeficientas lemia pakeitimų ryšio sandarumą?

4. Kokiose ribose nustatomas determinacijos koeficientas?

5. Parametro b įvertinimas koreliacinėje regresinėje analizėje?

1. Christopheris Dougherty. Įvadas į ekonometriją. - M.: INFRA - M, 2001 - 402 p.

2. S.A. Borodičius. Ekonometrija. Minsko LLC „Naujos žinios“ 2001 m.


3. R.U. Rakhmetova Trumpas ekonometrijos kursas. Pamoka. Almata. 2004. -78s.

4. I.I. Elisejeva Ekonometrija. - M.: „Finansai ir statistika“, 2002 m

5. Mėnesinis informacinis ir analitinis žurnalas.

Netiesiniai ekonominiai modeliai. Netiesinės regresijos modeliai. Kintamųjų konvertavimas.

Netiesiniai ekonominiai modeliai..

Kintamųjų konvertavimas.

elastingumo koeficientas.

Jei tarp ekonominių reiškinių yra netiesinių ryšių, jie išreiškiami naudojant atitinkamas nelinijines funkcijas: pavyzdžiui, lygiakraštę hiperbolę. , antrojo laipsnio parabolės ir kt.

Yra dvi netiesinės regresijos klasės:

1. Regresijos, kurios yra netiesinės į analizę įtrauktų aiškinamųjų kintamųjų atžvilgiu, bet tiesinės įvertintų parametrų atžvilgiu, pavyzdžiui:

Įvairių laipsnių polinomai - , ;

Lygiakraščio hiperbolė - ;

Puslogaritminė funkcija - .

2. Regresijos, kurios yra netiesinės apskaičiuotuose parametruose, pavyzdžiui:

Galia - ;

Demonstracinis -;

Eksponentinis – .

Bendra gauto požymio atskirų verčių kvadratinių nuokrypių suma adresu nuo vidutinės vertės lemia daugelio veiksnių įtaka. Visą priežasčių rinkinį sąlyginai suskirstome į dvi grupes: tirtas faktorius x ir kiti veiksniai.

Jei veiksnys neturi įtakos rezultatui, tada grafiko regresijos linija yra lygiagreti ašiai Oi ir

Tada visa gauto požymio sklaida atsiranda dėl kitų veiksnių įtakos ir bendra kvadratinių nuokrypių suma sutaps su likutine. Jei kiti veiksniai neturi įtakos rezultatui, tada tu susieta Su X funkciškai, o likutinė kvadratų suma lygi nuliui. Šiuo atveju nuokrypių kvadratu suma, paaiškinama regresija, yra tokia pati kaip visa kvadratų suma.

Kadangi ne visi koreliacijos lauko taškai yra regresijos tiesėje, jų sklaida visada vyksta kaip dėl faktoriaus įtakos X, t.y. regresija adresuįjungta X, ir sukeltas kitų priežasčių veikimo (nepaaiškinama variacija). Regresijos tiesės tinkamumas prognozei priklauso nuo to, kokia visos požymio kitimo dalis adresu paaiškina paaiškintą variantą

Akivaizdu, kad jei nuokrypių kvadratu suma dėl regresijos yra didesnė už likutinę kvadratų sumą, tai regresijos lygtis yra statistiškai reikšminga ir veiksnys X turi didelės įtakos rezultatui. y.

, y. su ypatybės nepriklausomo kitimo laisvės skaičiumi. Laisvės laipsnių skaičius yra susijęs su populiacijos vienetų skaičiumi n ir iš jo nustatytų konstantų skaičiumi. Kalbant apie tiriamą problemą, laisvės laipsnių skaičius turėtų parodyti, kiek nepriklausomų nukrypimų nuo P

Regresijos lygties, kaip visumos, reikšmingumo įvertinimas pateiktas pagalba F– Fišerio kriterijus. Šiuo atveju iškeliama nulinė hipotezė, kad regresijos koeficientas lygus nuliui, t.y. b= 0, taigi ir koeficientas X rezultatui įtakos neturi y.

Prieš tiesioginį F kriterijaus apskaičiavimą atliekama dispersijos analizė. Jame svarbiausia yra bendros kintamojo kvadratinių nuokrypių sumos išplėtimas adresu nuo vidutinės vertės adresuį dvi dalis – „paaiškinta“ ir „nepaaiškinta“:

Bendra kvadratinių nuokrypių suma;

Regresija paaiškinamų nuokrypių kvadratų suma;

Likutinė kvadratinio nuokrypio suma.

Bet kokia kvadratinių nuokrypių suma yra susijusi su laisvės laipsnių skaičiumi , y. su ypatybės nepriklausomo kitimo laisvės skaičiumi. Laisvės laipsnių skaičius yra susijęs su gyventojų vienetų skaičiumi n ir su iš jo nustatytu konstantų skaičiumi. Kalbant apie tiriamą problemą, laisvės laipsnių skaičius turėtų parodyti, kiek nepriklausomų nukrypimų nuo Pįmanoma, norint sudaryti nurodytą kvadratų sumą.

Sklaida pagal laisvės laipsnįD.

F koeficientai (F kriterijus):

Jei nulinė hipotezė yra teisinga, tada faktorius ir liekamosios dispersijos nesiskiria vienas nuo kito. Jei H 0, būtina paneigti, kad faktoriaus dispersija kelis kartus viršytų likutinę. Anglų statistikas Snedecoras sukūrė kritinių verčių lenteles F-ryšiai skirtinguose nulinės hipotezės reikšmingumo lygiuose ir skirtingu laisvės laipsnių skaičiumi. Lentelės vertė F Kriterijus yra didžiausia dispersijų santykio vertė, kuri gali atsirasti, jei jie atsitiktinai skiriasi tam tikram nulinės hipotezės tikimybės lygiui. Apskaičiuota vertė F-ryšys pripažįstamas patikimu, jei o yra didesnis nei lentelės.

Šiuo atveju nulinė hipotezė apie požymių ryšio nebuvimą atmetama ir daroma išvada apie šio ryšio reikšmę: F faktas > F lentelė H 0 atmetamas.

Jei reikšmė mažesnė už lentelę F faktas ‹, F lentelė, tada nulinės hipotezės tikimybė yra didesnė už nurodytą lygį ir jos negalima atmesti be rimtos rizikos padaryti klaidingą išvadą apie santykių buvimą. Šiuo atveju regresijos lygtis laikoma statistiškai nereikšminga. N o nenukrypsta.

Regresijos koeficiento standartinė paklaida

Regresijos koeficiento reikšmingumui įvertinti jo reikšmė lyginama su standartine paklaida, t.y. nustatoma tikroji vertė. t-Studento testas: kuris tada lyginamas su lentelės reikšme esant tam tikram reikšmingumo lygiui ir laisvės laipsnių skaičiui ( n- 2).

Parametrų standartinė klaida a:

Tiesinės koreliacijos koeficiento reikšmingumas tikrinamas pagal paklaidos dydį koreliacijos koeficientas r:

Bendra bruožo dispersija X:

Daugkartinė tiesinė regresija

Modelio kūrimas

Daugkartinė regresija yra efektyvaus požymio regresija su dviem ar daugiau faktorių, t.y. formos modelis

Regresija gali duoti gerą modeliavimo rezultatą, jei galima nepaisyti kitų tyrimo objektą veikiančių veiksnių įtakos. Neįmanoma kontroliuoti atskirų ekonominių kintamųjų elgesio, t.y. neįmanoma užtikrinti visų kitų vieno tiriamo veiksnio įtakos vertinimo sąlygų lygybės. Tokiu atveju turėtumėte pabandyti nustatyti kitų veiksnių įtaką įtraukdami juos į modelį, t. y. sudaryti daugialypės regresijos lygtį: y = a+b 1 x 1 +b 2 +…+b p x p + .

Daugialypės regresijos pagrindinis tikslas – sukurti modelį su daugybe veiksnių, tuo pačiu nustatant kiekvieno iš jų įtaką individualiai, taip pat jų kumuliacinę įtaką modeliuojamam rodikliui. Modelio specifikacija apima dvi klausimų sritis: veiksnių parinkimą ir regresijos lygties tipo pasirinkimą.

Redaktoriaus pasirinkimas
Prastai ir skubotai parengtas ir atliktas perkėlimas padarė milžinišką materialinę ir moralinę žalą samiams. Remiantis...

TURINYS Įvadas ………………………………………………………. .3 1 skyrius. Senovės egiptiečių religiniai ir mitologiniai vaizdiniai………………………………………………….5...

Pasak mokslininkų, jis pateko į „blogiausią“ vietą Dauguma šiuolaikinių paleontologų sutinka, kad pagrindinė mirties priežastis...

Kaip nuimti celibato vainiką? Ši ypatinga neigiama programa neleidžia moteriai ar vyrui sukurti šeimos. Atpažinti vainiką nėra sunku, tai ...
Respublikonų kandidatas Donaldas Trumpas, masonai tapo rinkimų nugalėtoju, 45-uoju Jungtinių Amerikos Valstijų prezidentu, ...
Pasaulyje egzistavo ir tebeegzistuoja gaujų grupės, kurios dėl savo aukštos organizacijos ir ištikimų sekėjų skaičiaus ...
Keistas ir permainingas derinys, kai šalia horizonto atsispindi dangaus dalių ar žemės objektų vaizdai...
Liūtai yra tie, kurie gimė nuo liepos 24 iki rugpjūčio 23 d. Pirmiausia trumpai apibūdinkime šį „grobuonišką“ Zodiako ženklą, o tada...
Brangakmenių ir pusbrangių akmenų įtaka žmogaus likimui, sveikatai ir gyvybei buvo pastebėta labai seniai. Jau senovės žmonės išmoko...