Metode kuadrat terkecil contoh pemecahan masalah. Pengembangan peramalan menggunakan metode kuadrat terkecil. Contoh penyelesaian masalah Memecahkan sistem persamaan dengan metode kuadrat terkecil


Kami memperkirakan fungsi dengan polinomial derajat ke-2. Untuk melakukan ini, kami menghitung koefisien sistem persamaan normal:

, ,

Mari kita buat sistem normal kuadrat terkecil, yang berbentuk:

Solusi dari sistem ini mudah ditemukan :, , .

Jadi, polinomial derajat 2 ditemukan: .

Latar belakang teoritis

Kembali ke halaman<Введение в вычислительную математику. Примеры>

Contoh 2. Mencari derajat optimal suatu polinomial.

Kembali ke halaman<Введение в вычислительную математику. Примеры>

Contoh 3. Turunan dari sistem persamaan normal untuk menemukan parameter ketergantungan empiris.

Mari kita turunkan sistem persamaan untuk menentukan koefisien dan fungsi , yang melakukan pendekatan akar-rata-rata-kuadrat dari fungsi yang diberikan sehubungan dengan titik. Buat fungsi dan tulis kondisi ekstrem yang diperlukan untuk itu:

Maka sistem normal akan berbentuk:

Kami telah memperoleh sistem persamaan linier untuk parameter yang tidak diketahui dan, yang mudah diselesaikan.

Latar belakang teoritis

Kembali ke halaman<Введение в вычислительную математику. Примеры>

Contoh.

Data eksperimen tentang nilai-nilai variabel X dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, fungsi

Menggunakan metode kuadrat terkecil, perkiraan data ini dengan ketergantungan linier y=ax+b(temukan parameter sebuah dan b). Cari tahu mana dari dua garis yang lebih baik (dalam arti metode kuadrat terkecil) menyelaraskan data eksperimen. Membuat gambar.

Inti dari metode kuadrat terkecil (LSM).

Masalahnya adalah untuk menemukan koefisien ketergantungan linier yang fungsi dari dua variabel sebuah dan bmengambil nilai terkecil. Artinya, mengingat data sebuah dan b jumlah deviasi kuadrat dari data eksperimen dari garis lurus yang ditemukan akan menjadi yang terkecil. Ini adalah inti dari metode kuadrat terkecil.

Dengan demikian, solusi dari contoh direduksi menjadi menemukan ekstrem dari fungsi dua variabel.

Turunan rumus untuk mencari koefisien.

Sistem dua persamaan dengan dua yang tidak diketahui disusun dan diselesaikan. Menemukan turunan parsial dari fungsi berdasarkan variabel sebuah dan b, kita menyamakan turunan ini dengan nol.

Kami memecahkan sistem persamaan yang dihasilkan dengan metode apa pun (misalnya metode substitusi atau metode Cramer) dan dapatkan rumus untuk mencari koefisien menggunakan metode kuadrat terkecil (LSM).

Dengan data sebuah dan b fungsi mengambil nilai terkecil. Bukti dari fakta ini diberikan di bawah dalam teks di akhir halaman.

Itulah seluruh metode kuadrat terkecil. Rumus untuk mencari parameter sebuah berisi jumlah , , , dan parameter n adalah jumlah data percobaan. Nilai dari jumlah ini direkomendasikan untuk dihitung secara terpisah.

Koefisien b ditemukan setelah perhitungan sebuah.

Saatnya untuk mengingat contoh aslinya.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kenyamanan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai baris ke-2 untuk setiap angka saya.

Nilai kolom terakhir dari tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk menemukan koefisien sebuah dan b. Kami menggantinya dengan nilai yang sesuai dari kolom terakhir tabel:

Akibatnya, y=0.165x+2.184 adalah garis lurus aproksimasi yang diinginkan.

Masih mencari tahu yang mana dari garis y=0.165x+2.184 atau lebih baik mendekati data asli, yaitu membuat perkiraan menggunakan metode kuadrat terkecil.

Estimasi kesalahan metode kuadrat terkecil.

Untuk melakukan ini, Anda perlu menghitung jumlah deviasi kuadrat dari data asli dari garis-garis ini dan , nilai yang lebih kecil sesuai dengan garis yang lebih mendekati data asli dalam hal metode kuadrat terkecil.

Karena , maka garis y=0.165x+2.184 mendekati data asli dengan lebih baik.

Ilustrasi grafis dari metode kuadrat terkecil (LSM).

Semuanya tampak hebat di tangga lagu. Garis merah adalah garis yang ditemukan y=0.165x+2.184, garis biru adalah , titik-titik merah muda adalah data asli.

Untuk apa, untuk apa semua perkiraan ini?

Saya pribadi menggunakan untuk memecahkan masalah pemulusan data, masalah interpolasi dan ekstrapolasi (dalam contoh asli, Anda dapat diminta untuk menemukan nilai dari nilai yang diamati kamu pada x=3 atau kapan x=6 menurut metode MNC). Tetapi kita akan membicarakan lebih lanjut tentang ini nanti di bagian lain situs ini.

Bagian atas halaman

Bukti.

Sehingga ketika ditemukan sebuah dan b fungsi mengambil nilai terkecil, perlu bahwa pada titik ini matriks bentuk kuadrat dari diferensial orde kedua untuk fungsi pasti positif. Mari kita tunjukkan.

Diferensial orde kedua memiliki bentuk:

Itu adalah

Oleh karena itu, matriks bentuk kuadrat memiliki bentuk

dan nilai elemen tidak bergantung pada sebuah dan b.

Mari kita tunjukkan bahwa matriks tersebut pasti positif. Ini mensyaratkan bahwa sudut minor harus positif.

Minor sudut dari orde pertama . Ketimpangannya sangat ketat, karena titik-titiknya tidak bertepatan. Ini akan tersirat dalam apa yang berikut.

Minor sudut dari orde kedua

Ayo buktikan metode induksi matematika.

Kesimpulan: nilai yang ditemukan sebuah dan b sesuai dengan nilai terkecil dari fungsi , oleh karena itu, adalah parameter yang diinginkan untuk metode kuadrat terkecil.

Pernah mengerti?
Memesan Solusi

Bagian atas halaman

Pengembangan peramalan menggunakan metode kuadrat terkecil. Contoh solusi masalah

Ekstrapolasi - ini adalah metode penelitian ilmiah, yang didasarkan pada penyebaran tren masa lalu dan sekarang, pola, hubungan dengan perkembangan masa depan objek peramalan. Metode ekstrapolasi meliputi: metode rata-rata bergerak, metode pemulusan eksponensial, metode kuadrat terkecil.

Esensi metode kuadrat terkecil terdiri dari meminimalkan jumlah deviasi kuadrat antara nilai yang diamati dan yang dihitung. Nilai yang dihitung ditemukan sesuai dengan persamaan yang dipilih - persamaan regresi. Semakin kecil jarak antara nilai sebenarnya dan yang dihitung, semakin akurat perkiraan berdasarkan persamaan regresi.

Analisis teoretis tentang esensi fenomena yang diteliti, perubahan yang ditampilkan oleh deret waktu, berfungsi sebagai dasar untuk memilih kurva. Pertimbangan tentang sifat pertumbuhan tingkat seri kadang-kadang diperhitungkan. Jadi, jika pertumbuhan output diharapkan dalam deret aritmatika, maka pemulusan dilakukan dalam garis lurus. Jika ternyata pertumbuhannya eksponensial, maka pemulusan harus dilakukan sesuai dengan fungsi eksponensial.

Rumus kerja metode kuadrat terkecil : Y t+1 = a*X + b, di mana t + 1 adalah periode perkiraan; t+1 – indikator yang diprediksi; a dan b adalah koefisien; X adalah simbol waktu.

Koefisien a dan b dihitung menurut rumus berikut:

di mana, Uf - nilai aktual dari rangkaian dinamika; n adalah jumlah level dalam deret waktu;

Pemulusan deret waktu dengan metode kuadrat terkecil berfungsi untuk mencerminkan pola perkembangan fenomena yang diteliti. Dalam ekspresi analitik dari sebuah tren, waktu dianggap sebagai variabel independen, dan tingkat deret bertindak sebagai fungsi dari variabel independen ini.

Perkembangan suatu fenomena tidak tergantung pada berapa tahun telah berlalu sejak titik awalnya, tetapi pada faktor-faktor apa yang mempengaruhi perkembangannya, ke arah mana dan dengan intensitas apa. Dari sini jelas bahwa perkembangan suatu fenomena dalam waktu muncul sebagai akibat dari tindakan faktor-faktor ini.

Mengatur jenis kurva dengan benar, jenis ketergantungan analitis pada waktu adalah salah satu tugas analisis pra-prediktif yang paling sulit. .

Pemilihan jenis fungsi yang menggambarkan tren, parameter yang ditentukan oleh metode kuadrat terkecil, dalam banyak kasus empiris, dengan membangun sejumlah fungsi dan membandingkannya satu sama lain dengan nilai root-mean -kesalahan kuadrat dihitung dengan rumus:

di mana Uf - nilai aktual dari rangkaian dinamika; Ur – nilai yang dihitung (dihaluskan) dari deret waktu; n adalah jumlah level dalam deret waktu; p adalah jumlah parameter yang ditentukan dalam rumus yang menggambarkan tren (tren perkembangan).

Kekurangan dari metode kuadrat terkecil :

  • ketika mencoba menggambarkan fenomena ekonomi yang diteliti menggunakan persamaan matematis, ramalan akan akurat untuk waktu yang singkat dan persamaan regresi harus dihitung ulang saat informasi baru tersedia;
  • kompleksitas pemilihan persamaan regresi, yang dapat dipecahkan dengan menggunakan program komputer standar.

Contoh penggunaan metode kuadrat terkecil untuk mengembangkan ramalan

Sebuah tugas . Terdapat data yang mencirikan tingkat pengangguran di wilayah tersebut, %

  • Buat perkiraan tingkat pengangguran di wilayah tersebut untuk bulan November, Desember, Januari, dengan menggunakan metode: rata-rata bergerak, pemulusan eksponensial, kuadrat terkecil.
  • Hitung kesalahan dalam peramalan yang dihasilkan menggunakan masing-masing metode.
  • Bandingkan hasil yang diperoleh, tarik kesimpulan.

Solusi kuadrat terkecil

Untuk solusinya, kami akan menyusun tabel di mana kami akan membuat perhitungan yang diperlukan:

= 28,63/10 = 2,86% akurasi perkiraan tinggi.

Kesimpulan : Membandingkan hasil yang diperoleh dalam perhitungan metode rata-rata bergerak , pemulusan eksponensial dan metode kuadrat terkecil, kita dapat mengatakan bahwa kesalahan relatif rata-rata dalam perhitungan dengan metode pemulusan eksponensial berada dalam kisaran 20-50%. Ini berarti bahwa akurasi prediksi dalam hal ini hanya memuaskan.

Dalam kasus pertama dan ketiga, akurasi perkiraan tinggi, karena kesalahan relatif rata-rata kurang dari 10%. Tetapi metode rata-rata bergerak memungkinkan untuk mendapatkan hasil yang lebih andal (perkiraan untuk November - 1,52%, perkiraan untuk Desember - 1,53%, perkiraan untuk Januari - 1,49%), karena kesalahan relatif rata-rata saat menggunakan metode ini adalah yang terkecil - 1 ,13%.

Metode kuadrat terkecil

Artikel terkait lainnya:

Daftar sumber yang digunakan

  1. Rekomendasi ilmiah dan metodologis tentang masalah mendiagnosis risiko sosial dan memperkirakan tantangan, ancaman, dan konsekuensi sosial. Universitas Sosial Negeri Rusia. Moskow. 2010;
  2. Vladimirova L.P. Peramalan dan perencanaan dalam kondisi pasar: Proc. uang saku. M.: Rumah Penerbitan "Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Prakiraan Perekonomian Nasional: Panduan Pendidikan dan Metodologi. Yekaterinburg: Rumah Penerbitan Ural. negara ekonomi universitas, 2007;
  4. Slutskin L.N. Kursus MBA dalam peramalan bisnis. Moskow: Buku Bisnis Alpina, 2006.

Program MNE

Masukkan data

Data dan Perkiraan y = a + b x

saya- nomor titik percobaan;
x saya- nilai parameter tetap pada titik saya;
y saya- nilai parameter yang diukur pada titik saya;
saya- pengukuran berat pada titik saya;
y saya, kal.- perbedaan antara nilai yang diukur dan nilai yang dihitung dari regresi kamu pada intinya saya;
S x i (x i)- perkiraan kesalahan x saya saat mengukur kamu pada intinya saya.

Data dan Perkiraan y = kx

saya x saya y saya saya y saya, kal. y saya S x i (x i)

Klik pada grafik

Panduan pengguna untuk program online MNC.

Di bidang data, masukkan nilai `x` dan `y` pada setiap baris terpisah pada satu titik percobaan. Nilai harus dipisahkan dengan spasi (spasi atau tab).

Nilai ketiga dapat berupa bobot titik dari `w`. Jika bobot poin tidak ditentukan, maka itu sama dengan satu. Dalam sebagian besar kasus, bobot titik eksperimen tidak diketahui atau tidak dihitung; semua data eksperimen dianggap setara. Terkadang bobot dalam rentang nilai yang dipelajari pasti tidak setara dan bahkan dapat dihitung secara teoritis. Misalnya, dalam spektrofotometri, bobot dapat dihitung menggunakan rumus sederhana, meskipun pada dasarnya semua orang mengabaikan hal ini untuk mengurangi biaya tenaga kerja.

Data dapat ditempelkan melalui clipboard dari spreadsheet office suite, seperti Excel dari Microsoft Office atau Calc dari Open Office. Untuk melakukannya, di spreadsheet, pilih rentang data yang akan disalin, salin ke papan klip, dan tempel data ke bidang data di halaman ini.

Untuk menghitung dengan metode kuadrat terkecil, setidaknya diperlukan dua titik untuk menentukan dua koefisien `b` - garis singgung sudut kemiringan garis lurus dan `a` - nilai yang dipotong oleh garis lurus pada `y ` sumbu.

Untuk memperkirakan kesalahan dari koefisien regresi yang dihitung, perlu untuk mengatur jumlah titik eksperimen menjadi lebih dari dua.

Metode kuadrat terkecil (LSM).

Semakin besar jumlah titik eksperimen, semakin akurat estimasi statistik dari koefisien (karena penurunan koefisien Student) dan semakin dekat estimasi dengan estimasi sampel umum.

Memperoleh nilai pada setiap titik eksperimental sering dikaitkan dengan biaya tenaga kerja yang signifikan, oleh karena itu, sejumlah eksperimen sering dilakukan, yang memberikan perkiraan yang dapat dicerna dan tidak menyebabkan biaya tenaga kerja yang berlebihan. Sebagai aturan, jumlah titik eksperimental untuk ketergantungan kuadrat terkecil linier dengan dua koefisien dipilih di wilayah 5-7 poin.

Teori Singkat Kuadrat Terkecil untuk Ketergantungan Linier

Misalkan kita memiliki sekumpulan data eksperimen berupa pasangan nilai [`y_i`, `x_i`], di mana `i` adalah jumlah satu pengukuran eksperimental dari 1 hingga `n`; `y_i` - nilai nilai terukur pada titik `i`; `x_i` - nilai parameter yang kita tetapkan pada titik `i`.

Contohnya adalah operasi hukum Ohm. Dengan mengubah tegangan (beda potensial) antara bagian dari rangkaian listrik, kami mengukur jumlah arus yang melewati bagian ini. Fisika memberi kita ketergantungan yang ditemukan secara eksperimental:

`I = U/R`,
di mana `I` - kekuatan saat ini; `R` - resistensi; `U` - tegangan.

Dalam hal ini, `y_i` adalah nilai arus terukur, dan `x_i` adalah nilai tegangan.

Sebagai contoh lain, perhatikan penyerapan cahaya oleh larutan suatu zat dalam larutan. Kimia memberi kita rumus:

`A = l C`,
di mana `A` adalah kerapatan optik solusi; `ε` - transmisi zat terlarut; `l` - panjang jalur ketika cahaya melewati kuvet dengan larutan; `C` adalah konsentrasi zat terlarut.

Dalam hal ini, `y_i` adalah kerapatan optik terukur `A`, dan `x_i` adalah konsentrasi zat yang kita tetapkan.

Kami akan mempertimbangkan kasus ketika kesalahan relatif dalam pengaturan `x_i` jauh lebih kecil daripada kesalahan relatif dalam mengukur `y_i`. Kami juga akan mengasumsikan bahwa semua nilai terukur dari `y_i` adalah acak dan terdistribusi normal, mis. mematuhi hukum distribusi normal.

Dalam kasus ketergantungan linier `y` pada `x`, kita dapat menulis ketergantungan teoretis:
`y = a + bx`.

Dari sudut pandang geometris, koefisien `b` menunjukkan garis singgung sudut kemiringan garis terhadap sumbu `x`, dan koefisien `a` - nilai `y` pada titik perpotongan garis garis dengan sumbu `y` (untuk `x = 0`).

Menemukan parameter garis regresi.

Dalam sebuah eksperimen, nilai terukur `y_i` tidak dapat terletak tepat pada garis teoretis karena kesalahan pengukuran, yang selalu melekat dalam kehidupan nyata. Oleh karena itu, persamaan linier harus diwakili oleh sistem persamaan:
`y_i = a + b x_i + _i` (1),
di mana `ε_i` adalah kesalahan pengukuran `y` yang tidak diketahui dalam eksperimen `i`.

Ketergantungan (1) juga disebut regresi, yaitu ketergantungan dua kuantitas satu sama lain dengan signifikansi statistik.

Tugas memulihkan ketergantungan adalah menemukan koefisien `a` dan `b` dari titik eksperimental [`y_i`, `x_i`].

Untuk mencari koefisien `a` dan `b` biasanya digunakan metode kuadrat terkecil(MNK). Ini adalah kasus khusus dari prinsip kemungkinan maksimum.

Mari kita tulis ulang (1) sebagai `ε_i = y_i - a - b x_i`.

Maka jumlah kesalahan kuadrat adalah
`Φ = jumlah_(i=1)^(n) _i^2 = jumlah_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Prinsip dari metode kuadrat terkecil adalah meminimalkan jumlah (2) terhadap parameter `a` dan `b`.

Minimum tercapai ketika turunan parsial dari jumlah (2) sehubungan dengan koefisien `a` dan `b` sama dengan nol:
`frac(sebagian )(sebagian a) = frac(jumlah sebagian_(i=1)^(n) (y_i - a - b x_i)^2)(sebagian a) = 0`
`frac(sebagian )(sebagian b) = frac(jumlah sebagian_(i=1)^(n) (y_i - a - b x_i)^2)(sebagian b) = 0`

Memperluas turunan, kami memperoleh sistem dua persamaan dengan dua yang tidak diketahui:
`jumlah_(i=1)^(n) (2a + 2bx_i - 2y_i) = jumlah_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

Kami membuka tanda kurung dan mentransfer jumlah yang tidak tergantung pada koefisien yang diinginkan ke setengah lainnya, kami mendapatkan sistem persamaan linier:
`sum_(i=1)^(n) y_i = a n + b jumlah_(i=1)^(n) bx_i`
`jumlah_(i=1)^(n) x_iy_i = jumlah_(i=1)^(n) x_i + b jumlah_(i=1)^(n) x_i^2`

Memecahkan sistem yang dihasilkan, kami menemukan rumus untuk koefisien `a` dan `b`:

`a = frac(sum_(i=1)^(n) y_i jumlah_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i jumlah_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n jumlah_(i=1)^(n) x_iy_i - jumlah_(i=1)^(n) x_i jumlah_(i=1)^(n) y_i) (n jumlah_(i=1)^ (n) x_i^2 - (jumlah_(i=1)^(n) x_i)^2)` (3.2)

Rumus ini memiliki solusi ketika `n > 1` (garis dapat ditarik menggunakan setidaknya 2 titik) dan ketika determinan `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1 )^(n) x_i)^2 != 0`, mis. ketika titik `x_i` dalam eksperimen berbeda (yaitu ketika garis tidak vertikal).

Estimasi kesalahan dalam koefisien garis regresi

Untuk perkiraan kesalahan yang lebih akurat dalam menghitung koefisien `a` dan `b`, sejumlah besar titik eksperimen diinginkan. Ketika `n = 2`, tidak mungkin untuk memperkirakan kesalahan koefisien, karena garis aproksimasi akan secara unik melewati dua titik.

Kesalahan variabel acak `V` ditentukan hukum akumulasi kesalahan
`S_V^2 = jumlah_(i=1)^p (frac(sebagian f)(sebagian z_i))^2 S_(z_i)^2`,
di mana `p` adalah jumlah parameter `z_i` dengan kesalahan `S_(z_i)` yang memengaruhi kesalahan `S_V`;
`f` adalah fungsi ketergantungan `V` pada `z_i`.

Mari kita tulis hukum akumulasi kesalahan untuk kesalahan koefisien `a` dan `b`
`S_a^2 = jumlah_(i=1)^(n)(frac(sebagian a)(sebagian y_i))^2 S_(y_i)^2 + jumlah_(i=1)^(n)(frac(sebagian a )(sebagian x_i))^2 S_(x_i)^2 = S_y^2 jumlah_(i=1)^(n)(frac(sebagian a)(sebagian y_i))^2 `,
`S_b^2 = jumlah_(i=1)^(n)(frac(sebagian b)(sebagian y_i))^2 S_(y_i)^2 + jumlah_(i=1)^(n)(frac(sebagian b )(sebagian x_i))^2 S_(x_i)^2 = S_y^2 jumlah_(i=1)^(n)(frac(sebagian b)(sebagian y_i))^2 `,
karena `S_(x_i)^2 = 0` (sebelumnya kami membuat reservasi bahwa kesalahan `x` dapat diabaikan).

`S_y^2 = S_(y_i)^2` - kesalahan (varians, deviasi standar kuadrat) dalam dimensi `y`, dengan asumsi bahwa kesalahan seragam untuk semua nilai `y`.

Mengganti rumus untuk menghitung `a` dan `b` ke dalam ekspresi yang dihasilkan, kita mendapatkan

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n jumlah_(i=1)^(n) x_i^2 - (jumlah_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

Dalam kebanyakan eksperimen nyata, nilai `Sy` tidak diukur. Untuk melakukan ini, perlu untuk melakukan beberapa pengukuran paralel (percobaan) pada satu atau beberapa titik rencana, yang meningkatkan waktu (dan mungkin biaya) percobaan. Oleh karena itu, biasanya diasumsikan bahwa penyimpangan `y` dari garis regresi dapat dianggap acak. Estimasi varians `y` dalam hal ini dihitung dengan rumus.

`S_y^2 = S_(y, istirahat)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Pembagi `n-2` muncul karena kita telah mengurangi jumlah derajat kebebasan karena perhitungan dua koefisien untuk sampel data eksperimen yang sama.

Estimasi ini juga disebut varians residual relatif terhadap garis regresi `S_(y, rest)^2`.

Penilaian signifikansi koefisien dilakukan sesuai dengan kriteria Siswa

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Jika kriteria yang dihitung `t_a`, `t_b` lebih kecil dari kriteria tabel `t(P, n-2)`, maka dianggap bahwa koefisien yang sesuai tidak berbeda nyata dari nol dengan probabilitas `P` yang diberikan.

Untuk menilai kualitas deskripsi hubungan linier, Anda dapat membandingkan `S_(y, rest)^2` dan `S_(bar y)` relatif terhadap mean menggunakan kriteria Fisher.

`S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i= 1)^n y_i) /n)^2) (n-1)` - estimasi sampel varians `y` relatif terhadap mean.

Untuk mengevaluasi efektivitas persamaan regresi untuk menggambarkan ketergantungan, koefisien Fisher dihitung
`F = S_(bar y) / S_(y, istirahat)^2`,
yang dibandingkan dengan koefisien Fisher tabular `F(p, n-1, n-2)`.

Jika `F > F(P, n-1, n-2)`, perbedaan antara deskripsi ketergantungan `y = f(x)` menggunakan persamaan regresi dan deskripsi menggunakan mean dianggap signifikan secara statistik dengan probabilitas `P`. Itu. regresi menggambarkan ketergantungan lebih baik daripada penyebaran `y` di sekitar rata-rata.

Klik pada grafik
untuk menambahkan nilai ke tabel

Metode kuadrat terkecil. Metode kuadrat terkecil berarti penentuan parameter yang tidak diketahui a, b, c, ketergantungan fungsional yang diterima

Metode kuadrat terkecil berarti penentuan parameter yang tidak diketahui a, b, c,… ketergantungan fungsional yang diterima

y = f(x,a,b,c,…),

yang akan memberikan minimum kuadrat rata-rata (varians) dari kesalahan

, (24)

dimana x i , y i - himpunan pasangan bilangan yang diperoleh dari percobaan.

Karena syarat ekstrem suatu fungsi beberapa variabel adalah syarat turunan parsialnya sama dengan nol, maka parameternya a, b, c,… ditentukan dari sistem persamaan:

; ; ; … (25)

Harus diingat bahwa metode kuadrat terkecil digunakan untuk memilih parameter setelah bentuk fungsi y = f(x) didefinisikan.

Jika dari pertimbangan teoretis tidak mungkin untuk menarik kesimpulan apa pun tentang rumus empiris yang seharusnya, maka seseorang harus dipandu oleh representasi visual, terutama representasi grafis dari data yang diamati.

Dalam praktiknya, paling sering terbatas pada jenis fungsi berikut:

1) linier ;

2) kuadrat a.

(Lihat gambar). Diperlukan untuk menemukan persamaan garis lurus

Semakin kecil angka dalam nilai absolut, semakin baik garis lurus (2) dipilih. Sebagai karakteristik akurasi pemilihan garis lurus (2), kita dapat mengambil jumlah kuadrat

Kondisi minimum untuk S adalah

(6)
(7)

Persamaan (6) dan (7) dapat ditulis dalam bentuk berikut:

(8)
(9)

Dari persamaan (8) dan (9) mudah untuk mencari a dan b dari nilai percobaan xi dan y i . Garis (2) yang didefinisikan oleh persamaan (8) dan (9) disebut garis yang diperoleh dengan metode kuadrat terkecil (nama ini menekankan bahwa jumlah kuadrat S memiliki minimum). Persamaan (8) dan (9), dari mana garis lurus (2) ditentukan, disebut persamaan normal.

Dimungkinkan untuk menunjukkan cara yang sederhana dan umum untuk menyusun persamaan normal. Dengan menggunakan titik percobaan (1) dan persamaan (2), kita dapat menuliskan sistem persamaan untuk a dan b

y 1 \u003d kapak 1 +b,
y 2 \u003dax 2 +b,
...
(10)
yn=axn+b,

Kami mengalikan bagian kiri dan kanan dari masing-masing persamaan ini dengan koefisien pada a yang tidak diketahui pertama (yaitu x 1 , x 2 , ..., x n) dan menambahkan persamaan yang dihasilkan, sebagai hasilnya kami mendapatkan persamaan normal pertama ( 8).

Kami mengalikan sisi kiri dan kanan dari masing-masing persamaan ini dengan koefisien b kedua yang tidak diketahui, yaitu dengan 1, dan tambahkan persamaan yang dihasilkan, menghasilkan persamaan normal kedua (9).

Metode untuk memperoleh persamaan normal ini bersifat umum: cocok, misalnya, untuk fungsi

adalah nilai konstan dan harus ditentukan dari data eksperimen (1).

Sistem persamaan untuk k dapat ditulis:

Temukan garis (2) menggunakan metode kuadrat terkecil.

Larutan. Kami menemukan:

x i =21, y i =46.3, x i 2 =91, x i y i =179.1.

Kami menulis persamaan (8) dan (9)

Dari sini kita menemukan

Memperkirakan keakuratan metode kuadrat terkecil

Mari kita memberikan perkiraan keakuratan metode untuk kasus linier ketika persamaan (2) terjadi.

Biarkan nilai eksperimen x i tepat, dan nilai eksperimen y i memiliki kesalahan acak dengan varians yang sama untuk semua i.

Kami memperkenalkan notasi

(16)

Maka solusi dari persamaan (8) dan (9) dapat direpresentasikan sebagai

(17)
(18)
di mana
(19)
Dari persamaan (17) kita menemukan
(20)
Demikian pula, dari persamaan (18) diperoleh

(21)
karena
(22)
Dari persamaan (21) dan (22) kita menemukan
(23)

Persamaan (20) dan (23) memberikan perkiraan keakuratan koefisien yang ditentukan oleh persamaan (8) dan (9).

Perhatikan bahwa koefisien a dan b berkorelasi. Dengan transformasi sederhana, kami menemukan momen korelasinya.

Dari sini kita menemukan

0,072 pada x=1 dan 6,

0,041 pada x=3,5.

literatur

Pantai. Ya. B. Metode statistik analisis dan kontrol kualitas dan keandalan. M.: Gosenergoizdat, 1962, hal. 552, hlm. 92-98.

Buku ini ditujukan untuk berbagai insinyur (lembaga penelitian, biro desain, lokasi pengujian dan pabrik) yang terlibat dalam menentukan kualitas dan keandalan peralatan elektronik dan produk industri massal lainnya (bangunan mesin, pembuatan instrumen, artileri, dll.).

Buku ini memberikan aplikasi metode statistik matematika untuk pemrosesan dan evaluasi hasil tes, di mana kualitas dan keandalan produk yang diuji ditentukan. Untuk kenyamanan pembaca, informasi yang diperlukan dari statistik matematika diberikan, serta sejumlah besar tabel matematika tambahan yang memfasilitasi perhitungan yang diperlukan.

Presentasi diilustrasikan oleh sejumlah besar contoh yang diambil dari bidang elektronik radio dan teknologi artileri.

Metode kuadrat terkecil adalah salah satu yang paling umum dan paling berkembang karena kesederhanaan dan efisiensi metode untuk memperkirakan parameter linier. Pada saat yang sama, kehati-hatian tertentu harus diperhatikan saat menggunakannya, karena model yang dibuat dengan menggunakannya mungkin tidak memenuhi sejumlah persyaratan untuk kualitas parameternya dan, sebagai akibatnya, tidak mencerminkan pola pengembangan proses dengan "baik".

Mari kita pertimbangkan prosedur untuk memperkirakan parameter model ekonometrik linier menggunakan metode kuadrat terkecil secara lebih rinci. Model seperti itu dalam bentuk umum dapat diwakili oleh persamaan (1.2):

y t = a 0 + a 1 x 1 t +...+ a n x nt + t .

Data awal saat menaksir parameter a 0 , a 1 ,..., a n adalah vektor dari nilai variabel dependen kamu= (y 1 , y 2 , ... , y T)" dan matriks nilai variabel bebas

di mana kolom pertama, yang terdiri dari satu, sesuai dengan koefisien model .

Metode kuadrat terkecil mendapatkan namanya berdasarkan prinsip dasar bahwa estimasi parameter yang diperoleh atas dasarnya harus memenuhi: jumlah kuadrat dari kesalahan model harus minimal.

Contoh penyelesaian masalah dengan metode kuadrat terkecil

Contoh 2.1. Perusahaan perdagangan memiliki jaringan yang terdiri dari 12 toko, informasi tentang kegiatannya disajikan pada Tabel. 2.1.

Manajemen perusahaan ingin tahu bagaimana ukuran tahunan tergantung pada area penjualan toko.

Tabel 2.1

Nomor toko

Omset tahunan, juta rubel

Area perdagangan, ribu m 2

Solusi kuadrat terkecil. Mari kita tentukan - omset tahunan toko -th, juta rubel; - luas jual toko ke-th, ribu m 2.

Gambar 2.1. Scatterplot untuk Contoh 2.1

Untuk menentukan bentuk hubungan fungsional antar variabel dan membangun scatterplot (Gbr. 2.1).

Berdasarkan diagram pencar, kita dapat menyimpulkan bahwa omset tahunan secara positif bergantung pada area penjualan (yaitu, y akan meningkat dengan pertumbuhan ). Bentuk koneksi fungsional yang paling tepat adalah linier.

Informasi untuk perhitungan lebih lanjut disajikan pada Tabel. 2.2. Dengan menggunakan metode kuadrat terkecil, kami memperkirakan parameter model ekonometrik satu faktor linier

Tabel 2.2

Lewat sini,

Oleh karena itu, dengan peningkatan area perdagangan sebesar 1 ribu m 2, hal-hal lain dianggap sama, omset tahunan rata-rata meningkat sebesar 67,8871 juta rubel.

Contoh 2.2. Manajemen perusahaan memperhatikan bahwa omset tahunan tidak hanya bergantung pada area penjualan toko (lihat contoh 2.1), tetapi juga pada jumlah rata-rata pengunjung. Informasi yang relevan disajikan dalam tabel. 2.3.

Tabel 2.3

Larutan. Menunjukkan - jumlah rata-rata pengunjung ke toko per hari, ribuan orang.

Untuk menentukan bentuk hubungan fungsional antar variabel dan membangun scatterplot (Gbr. 2.2).

Berdasarkan diagram pencar, kita dapat menyimpulkan bahwa omset tahunan berhubungan positif dengan jumlah rata-rata pengunjung per hari (yaitu, y akan meningkat dengan pertumbuhan ). Bentuk ketergantungan fungsional adalah linier.

Beras. 2.2. Scatterplot misalnya 2.2

Tabel 2.4

Secara umum, perlu untuk menentukan parameter model ekonometrik dua faktor

y t \u003d a 0 + a 1 x 1 t + a 2 x 2 t + t

Informasi yang diperlukan untuk perhitungan lebih lanjut disajikan pada Tabel. 2.4.

Mari kita perkirakan parameter model ekonometrika dua faktor linier menggunakan metode kuadrat terkecil.

Lewat sini,

Evaluasi koefisien = 61,6583 menunjukkan bahwa, dengan hal lain dianggap sama, dengan peningkatan area perdagangan sebesar 1 ribu m 2, omset tahunan akan meningkat rata-rata 61,6583 juta rubel.

  • pelajaran pengantar Bebas;
  • Sejumlah besar guru berpengalaman (asli dan berbahasa Rusia);
  • Kursus BUKAN untuk periode tertentu (bulan, enam bulan, tahun), tetapi untuk jumlah pelajaran tertentu (5, 10, 20, 50);
  • Lebih dari 10.000 pelanggan yang puas.
  • Biaya satu pelajaran dengan guru berbahasa Rusia - dari 600 rubel, dengan penutur asli - dari 1500 rubel

Inti dari metode kuadrat terkecil adalah dalam menemukan parameter model tren yang paling menggambarkan tren perkembangan beberapa fenomena acak dalam waktu atau ruang (tren adalah garis yang mencirikan tren perkembangan ini). Tugas metode kuadrat terkecil (OLS) adalah untuk menemukan tidak hanya beberapa model tren, tetapi untuk menemukan model terbaik atau optimal. Model ini akan optimal jika jumlah deviasi kuadrat antara nilai aktual yang diamati dan nilai tren yang dihitung terkait minimal (terkecil):

di mana adalah standar deviasi antara nilai aktual yang diamati

dan nilai tren terhitung yang sesuai,

Nilai aktual (yang diamati) dari fenomena yang diteliti,

Perkiraan nilai model tren,

Banyaknya pengamatan terhadap fenomena yang diteliti.

MNC jarang digunakan sendiri. Sebagai aturan, paling sering digunakan hanya sebagai teknik yang diperlukan dalam studi korelasi. Perlu diingat bahwa basis informasi LSM hanya dapat berupa rangkaian statistik yang dapat diandalkan, dan jumlah pengamatan tidak boleh kurang dari 4, jika tidak, prosedur pemulusan LSM dapat kehilangan akal sehatnya.

Toolkit OLS direduksi menjadi prosedur berikut:

Prosedur pertama. Ternyata apakah ada kecenderungan sama sekali untuk mengubah atribut yang dihasilkan ketika faktor-argumen yang dipilih berubah, atau dengan kata lain, apakah ada hubungan antara " pada " dan " X ».

Prosedur kedua. Ditentukan garis (lintasan) mana yang paling mampu menggambarkan atau mencirikan tren ini.

Prosedur ketiga.

Contoh. Misalkan kita memiliki informasi tentang hasil rata-rata bunga matahari untuk pertanian yang diteliti (Tabel 9.1).

Tabel 9.1

Nomor observasi

Produktivitas, c/ha

Karena tingkat teknologi dalam produksi bunga matahari di negara kita tidak banyak berubah selama 10 tahun terakhir, itu berarti, kemungkinan besar, fluktuasi hasil pada periode yang dianalisis sangat bergantung pada fluktuasi cuaca dan kondisi iklim. Apakah itu benar?

Prosedur MNC pertama. Hipotesis tentang adanya tren perubahan hasil bunga matahari tergantung pada perubahan kondisi cuaca dan iklim selama 10 tahun yang dianalisis sedang diuji.

Dalam contoh ini, untuk " kamu » disarankan untuk mengambil hasil bunga matahari, dan untuk « x » adalah jumlah tahun yang diamati dalam periode yang dianalisis. Menguji hipotesis tentang adanya hubungan antara “ x " dan " kamu » dapat dilakukan dengan dua cara: secara manual dan dengan bantuan program komputer. Tentunya dengan tersedianya teknologi komputer, masalah ini dapat teratasi dengan sendirinya. Namun, untuk lebih memahami toolkit OLS, disarankan untuk menguji hipotesis tentang adanya hubungan antara " x " dan " kamu » secara manual, saat hanya ada pena dan kalkulator biasa. Dalam kasus seperti itu, hipotesis keberadaan tren paling baik diperiksa secara visual dengan lokasi gambar grafik dari deret waktu yang dianalisis - bidang korelasi:

Bidang korelasi dalam contoh kita terletak di sekitar garis yang meningkat perlahan. Hal ini sendiri menunjukkan adanya tren tertentu dalam perubahan hasil bunga matahari. Mustahil untuk berbicara tentang keberadaan tren apa pun hanya ketika bidang korelasi terlihat seperti lingkaran, lingkaran, awan yang benar-benar vertikal atau horizontal, atau terdiri dari titik-titik yang tersebar secara acak. Dalam semua kasus lain, perlu untuk mengkonfirmasi hipotesis adanya hubungan antara " x " dan " kamu dan melanjutkan penelitian.

Prosedur MNC kedua. Ditentukan garis (lintasan) mana yang paling mampu menggambarkan atau mengkarakterisasi tren perubahan hasil bunga matahari untuk periode yang dianalisis.

Dengan tersedianya teknologi komputer, pemilihan trend yang optimal terjadi secara otomatis. Dengan pemrosesan "manual", pilihan fungsi optimal dilakukan, sebagai suatu peraturan, secara visual - berdasarkan lokasi bidang korelasi. Artinya, menurut jenis bagan, persamaan garis dipilih, yang paling sesuai dengan tren empiris (ke lintasan sebenarnya).

Seperti yang Anda ketahui, di alam ada berbagai macam dependensi fungsional, sehingga sangat sulit untuk menganalisis secara visual bahkan sebagian kecil darinya. Untungnya, dalam praktik ekonomi nyata, sebagian besar hubungan dapat digambarkan secara akurat baik dengan parabola, atau hiperbola, atau garis lurus. Dalam hal ini, dengan opsi "manual" untuk memilih fungsi terbaik, Anda dapat membatasi diri hanya pada tiga model ini.

Hiperbola:

Parabola orde kedua: :

Sangat mudah untuk melihat bahwa dalam contoh kita, tren perubahan hasil bunga matahari selama 10 tahun yang dianalisis paling baik dicirikan oleh garis lurus, sehingga persamaan regresi akan menjadi persamaan garis lurus.

Prosedur ketiga. Parameter persamaan regresi yang mencirikan garis ini dihitung, atau dengan kata lain, ditentukan formula analitik yang menggambarkan model tren terbaik.

Menemukan nilai parameter persamaan regresi, dalam kasus kami, parameter dan , adalah inti dari LSM. Proses ini direduksi menjadi penyelesaian sistem persamaan normal.

(9.2)

Sistem persamaan ini cukup mudah diselesaikan dengan metode Gauss. Ingatlah bahwa sebagai hasil dari solusi, dalam contoh kami, nilai parameter dan ditemukan. Dengan demikian, persamaan regresi yang ditemukan akan memiliki bentuk sebagai berikut:

Ini banyak digunakan dalam ekonometrika dalam bentuk interpretasi ekonomi yang jelas dari parameternya.

Regresi linier direduksi untuk menemukan persamaan bentuk

atau

Ketik persamaan memungkinkan untuk nilai parameter yang diberikan X memiliki nilai teoretis dari fitur efektif, menggantikan nilai aktual faktor ke dalamnya X.

Membangun regresi linier turun ke memperkirakan parameternya sebuah dan di. Estimasi parameter regresi linier dapat ditemukan dengan metode yang berbeda.

Pendekatan klasik untuk memperkirakan parameter regresi linier didasarkan pada kuadrat terkecil(MNK).

LSM memungkinkan seseorang untuk mendapatkan perkiraan parameter seperti itu sebuah dan di, di mana jumlah deviasi kuadrat dari nilai sebenarnya dari sifat yang dihasilkan (y) dari terhitung (teoritis) minimal:

Untuk menemukan minimum suatu fungsi, perlu untuk menghitung turunan parsial terhadap masing-masing parameter sebuah dan b dan menyamakannya dengan nol.

Dilambangkan dengan S, maka:

Mengubah rumus, kami memperoleh sistem persamaan normal berikut untuk memperkirakan parameter: sebuah dan di:

Memecahkan sistem persamaan normal (3.5) baik dengan metode eliminasi berturut-turut variabel atau dengan metode determinan, kami menemukan perkiraan parameter yang diinginkan sebuah dan di.

Parameter di disebut koefisien regresi. Nilainya menunjukkan rata-rata perubahan hasil dengan perubahan faktor sebesar satu satuan.

Persamaan regresi selalu dilengkapi dengan indikator keketatan sambungan. Ketika menggunakan regresi linier, koefisien korelasi linier bertindak sebagai indikator tersebut. Ada berbagai modifikasi rumus koefisien korelasi linier. Beberapa dari mereka terdaftar di bawah ini:

Seperti yang Anda ketahui, koefisien korelasi linier berada dalam batas: -1 1.

Untuk menilai kualitas pemilihan fungsi linier, kuadrat dihitung

Koefisien korelasi linier yang disebut koefisien determinasi. Koefisien determinasi mencirikan proporsi varians fitur efektif y, dijelaskan oleh regresi, dalam varians total dari sifat yang dihasilkan:

Dengan demikian, nilai 1 - mencirikan proporsi dispersi y, disebabkan oleh pengaruh faktor lain yang tidak diperhitungkan dalam model.

Pertanyaan untuk pengendalian diri

1. Inti dari metode kuadrat terkecil?

2. Berapa banyak variabel yang memberikan regresi berpasangan?

3. Koefisien apa yang menentukan ketatnya hubungan antara perubahan?

4. Dalam batas berapakah koefisien determinasi ditentukan?

5. Estimasi parameter b dalam analisis korelasi-regresi?

1. Christopher Dougherty. Pengantar ekonometrika. - M.: INFRA - M, 2001 - 402 hal.

2. S.A. Borodich. Ekonometrika. Minsk LLC "Pengetahuan Baru" 2001.


3. R.U. Rakhmetova Kursus singkat di bidang ekonometrika. Tutorial. Almaty. 2004. -78s.

4. I.I. Eliseeva.Ekonometrika. - M.: "Keuangan dan statistik", 2002

5. Informasi bulanan dan majalah analitis.

Model ekonomi nonlinier. Model regresi nonlinier. Konversi variabel.

Model ekonomi nonlinier..

Konversi variabel.

koefisien elastisitas.

Jika ada hubungan non-linier antara fenomena ekonomi, maka mereka dinyatakan menggunakan fungsi non-linier yang sesuai: misalnya, hiperbola sama sisi , parabola derajat kedua, dll.

Ada dua kelas regresi non-linier:

1. Regresi yang tidak linier terhadap variabel penjelas yang termasuk dalam analisis, tetapi linier terhadap parameter yang diestimasi, misalnya:

Polinomial berbagai derajat - , ;

Hiperbola sama sisi - ;

Fungsi semilogaritma - .

2. Regresi yang bersifat non-linier pada parameter yang diestimasi, misalnya:

Kekuasaan - ;

Demonstratif -;

Eksponensial - .

Jumlah total deviasi kuadrat dari nilai individu dari atribut yang dihasilkan pada dari nilai rata-rata disebabkan oleh pengaruh banyak faktor. Kami secara kondisional membagi seluruh rangkaian alasan menjadi dua kelompok: mempelajari faktor x dan faktor lain.

Jika faktor tersebut tidak mempengaruhi hasil, maka garis regresi pada grafik sejajar dengan sumbu oh dan

Kemudian seluruh dispersi dari atribut yang dihasilkan adalah karena pengaruh faktor lain dan jumlah total deviasi kuadrat akan bertepatan dengan residual. Jika faktor lain tidak mempengaruhi hasil, maka kamu terikat Dengan X secara fungsional, dan jumlah sisa kuadrat adalah nol. Dalam hal ini, jumlah deviasi kuadrat yang dijelaskan oleh regresi sama dengan jumlah kuadrat total.

Karena tidak semua titik bidang korelasi terletak pada garis regresi, pencarnya selalu terjadi karena pengaruh faktor X, yaitu regresi pada pada X, dan disebabkan oleh tindakan penyebab lain (variasi yang tidak dapat dijelaskan). Kesesuaian garis regresi untuk ramalan tergantung pada bagian mana dari total variasi sifat pada menjelaskan variasi yang dijelaskan

Jelas, jika jumlah deviasi kuadrat karena regresi lebih besar dari jumlah sisa kuadrat, maka persamaan regresi signifikan secara statistik dan faktor X memiliki dampak yang signifikan pada hasil. y.

, yaitu dengan jumlah kebebasan variasi independen fitur. Jumlah derajat kebebasan terkait dengan jumlah unit populasi n dan jumlah konstanta yang ditentukan darinya. Sehubungan dengan masalah yang diteliti, jumlah derajat kebebasan harus menunjukkan berapa banyak penyimpangan independen dari P

Penilaian signifikansi persamaan regresi secara keseluruhan diberikan dengan bantuan F- Kriteria Fisher. Dalam hal ini, hipotesis nol diajukan bahwa koefisien regresi sama dengan nol, yaitu. b= 0, dan karenanya faktor X tidak mempengaruhi hasil y.

Perhitungan langsung dari kriteria-F didahului dengan analisis varians. Pusatnya adalah perluasan jumlah total deviasi kuadrat dari variabel pada dari nilai rata-rata pada menjadi dua bagian - "dijelaskan" dan "tidak dijelaskan":

Jumlah total deviasi kuadrat;

Jumlah kuadrat deviasi dijelaskan oleh regresi;

Jumlah sisa deviasi kuadrat.

Setiap jumlah deviasi kuadrat terkait dengan jumlah derajat kebebasan , yaitu dengan jumlah kebebasan variasi independen fitur. Jumlah derajat kebebasan berhubungan dengan jumlah unit populasi n dan dengan jumlah konstanta yang ditentukan darinya. Sehubungan dengan masalah yang diteliti, jumlah derajat kebebasan harus menunjukkan berapa banyak penyimpangan independen dari P mungkin diperlukan untuk membentuk jumlah kuadrat tertentu.

Dispersi per derajat kebebasanD.

F-rasio (F-kriteria):

Jika hipotesis nol benar, maka faktor dan varians residual tidak berbeda satu sama lain. Untuk H 0, sanggahan diperlukan agar varians faktor melebihi residual beberapa kali. Ahli statistik Inggris Snedecor mengembangkan tabel nilai kritis F-hubungan pada tingkat signifikansi yang berbeda dari hipotesis nol dan jumlah derajat kebebasan yang berbeda. Nilai tabel F-kriteria adalah nilai maksimum rasio varians yang dapat terjadi jika mereka menyimpang secara acak untuk tingkat probabilitas tertentu dari kehadiran hipotesis nol. Nilai yang dihitung F-hubungan diakui andal jika o lebih besar dari tabel.

Dalam hal ini, hipotesis nol tentang tidak adanya hubungan fitur ditolak dan kesimpulan dibuat tentang signifikansi hubungan ini: F fakta > F tabel H0 ditolak.

Jika nilainya kurang dari tabel F fakta , F tabel, maka probabilitas hipotesis nol lebih tinggi dari tingkat tertentu dan tidak dapat ditolak tanpa risiko serius untuk menarik kesimpulan yang salah tentang adanya suatu hubungan. Dalam hal ini, persamaan regresi dianggap tidak signifikan secara statistik. N o tidak menyimpang.

Kesalahan standar dari koefisien regresi

Untuk menilai signifikansi koefisien regresi, nilainya dibandingkan dengan kesalahan standarnya, yaitu ditentukan nilai sebenarnya t-Tes siswa: yang kemudian dibandingkan dengan nilai tabel pada tingkat signifikansi tertentu dan jumlah derajat kebebasan ( n- 2).

Kesalahan Standar Parameter sebuah:

Signifikansi koefisien korelasi linier diperiksa berdasarkan besarnya kesalahan koefisien korelasi r:

Varians total dari sebuah fitur X:

Regresi Linier Berganda

Bangunan model

Regresi berganda adalah regresi fitur yang efektif dengan dua atau lebih faktor, yaitu model bentuk

Regresi dapat memberikan hasil yang baik dalam pemodelan jika pengaruh faktor lain yang mempengaruhi objek penelitian dapat diabaikan. Perilaku variabel ekonomi individu tidak dapat dikendalikan, yaitu, tidak mungkin untuk memastikan kesetaraan semua kondisi lain untuk menilai pengaruh satu faktor yang diteliti. Dalam hal ini, Anda harus mencoba mengidentifikasi pengaruh faktor lain dengan memasukkannya ke dalam model, yaitu membangun persamaan regresi berganda: y = a+b 1 x 1 +b 2 +…+b p x p + .

Tujuan utama dari regresi berganda adalah untuk membangun model dengan sejumlah besar faktor, sambil menentukan pengaruh masing-masing faktor secara individual, serta dampak kumulatifnya pada indikator yang dimodelkan. Spesifikasi model mencakup dua bidang pertanyaan: pemilihan faktor dan pilihan jenis persamaan regresi

Pilihan Editor
Kita semua ingat kartun Soviet lama "The Kid Who Counted to Ten". Dalam cerita ini, kambing pertama kali mendapatkannya untuk...

Sejarah studi objektif kompetensi numerik pada hewan berasal dari awal abad ke-20. Asal usul daerah ini terletak...

Orang-orang kuno, selain kapak batu dan kulit sebagai ganti pakaian, tidak memiliki apa-apa, jadi mereka tidak memiliki apa-apa untuk dihitung. Lambat laun mereka menjadi...

UNIVERSITAS NEGERI TAMBOV DInamai SETELAH G.R. DERZHAVINA JURUSAN LANDASAN TEORI PENDIDIKAN FISIK ABSTRAK DENGAN TOPIK : "...
Peralatan produksi es krim: teknologi produksi + 3 jenis bisnis es krim + peralatan yang diperlukan ...
. 2. Departemen Alga Hijau. Kelas Isoflagellata. Kelas Konjugasi. 3. Departemen Kuning-hijau dan Diatom. 4. Kerajaan...
Dalam kehidupan manusia modern digunakan di mana-mana. Hampir semua peralatan listrik dan teknik listrik ditenagai oleh daya, ...
Salah satu makhluk paling menakjubkan di dunia bawah laut adalah axolotl. Ia juga sering disebut naga air Meksiko. axolotl...
Pencemaran lingkungan dipahami sebagai masuknya zat berbahaya ke dalam ruang eksternal, tetapi ini bukan definisi yang lengkap. Polusi...