Linearna regresija i korelacija: značenje i procjena parametara. Jednačina linearne višestruke regresije

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Procjena značaja parametara regresijske jednačine

Procjena značaja parametara jednadžbe linearna regresija izvedeno korištenjem Studentovog t testa:

Ako t calc. > t cr, tada se prihvata glavna hipoteza ( H o), ukazujući statistički značaj regresijski parametri;

Ako t calc.< t cr, tada je alternativna hipoteza prihvaćena ( H 1), što ukazuje na statističku beznačajnost parametara regresije.

Gdje m a , m b– standardne greške parametara a I b:

(2.19)

(2.20)

Kritična (tabelarna) vrijednost kriterija nalazi se pomoću statističkih tabela Studentove distribucije (Dodatak B) ili korištenjem tabela Excel(odjeljak čarobnjaka „Statistička” funkcija):

t cr = STUDARIST( α=1-P; k=n-2), (2.21)

Gdje k=n-2 takođe predstavlja broj stepeni slobode .

Procjena statističke značajnosti može se primijeniti i na koeficijent linearne korelacije

Gdje gospodinstandardna greška određivanje vrijednosti koeficijenta korelacije r yx

(2.23)

U nastavku se nalaze opcije za zadatke za praktičan i laboratorijski rad na temama drugog odjeljka.

Pitanja za samotestiranje za odjeljak 2

1. Navedite glavne komponente ekonometrijskog modela i njihovu suštinu.

2. Glavni sadržaj faza ekonometrijskog istraživanja.

3. Suština pristupa određivanju parametara linearne regresije.

4. Suština i osobenosti primjene metode najmanjih kvadrata prilikom određivanja parametara jednadžbe regresije.

5. Koji indikatori se koriste za procjenu bliskosti odnosa između faktora koji se proučavaju?

6. Esencija linearni koeficijent korelacije.

7. Suština koeficijenta determinacije.

8. Suština i glavne karakteristike postupaka za procjenu adekvatnosti (statističke značajnosti) regresionih modela.

9. Procjena adekvatnosti modela linearne regresije koeficijentom aproksimacije.

10. Suština pristupa procjeni adekvatnosti regresionih modela primjenom Fisherovog kriterija. Definicija empirijskog i kritične vrijednosti kriterijum.

11. Suština koncepta „analize varijanse“ u odnosu na ekonometrijska istraživanja.

12. Suština i glavne karakteristike postupka za procjenu značaja parametara jednačine linearne regresije.

13. Osobine korištenja Studentove distribucije pri procjeni značajnosti parametara jednačine linearne regresije.

14. Koji je zadatak predviđanja pojedinačnih vrijednosti društveno-ekonomskog fenomena koji se proučava?

1. Konstruisati korelaciono polje i formulisati pretpostavku o obliku jednačine za odnos faktora koji se proučavaju;

2. Zapisati osnovne jednačine metode najmanjih kvadrata, izvršiti potrebne transformacije, napraviti tabelu za međuproračune i odrediti parametre jednačine linearne regresije;

3. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

4. Analizirati rezultate, formulisati zaključke i preporuke.

1. Izračunavanje vrijednosti koeficijenta linearne korelacije;

2. Izrada analize tabele varijanse;

3. Procjena koeficijenta determinacije;

4. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

5. Analizirati rezultate, formulisati zaključke i preporuke.

4. Ponašanje ukupna procjena adekvatnost izabrane regresione jednačine;

1. Procjena adekvatnosti jednačine na osnovu vrijednosti koeficijenta aproksimacije;

2. Procjena adekvatnosti jednačine na osnovu vrijednosti koeficijenta determinacije;

3. Procjena adekvatnosti jednačine po Fišerovom kriterijumu;

4. Izvršiti opštu ocjenu adekvatnosti parametara regresione jednačine;

5. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

6. Analizirati rezultate, formulisati zaključke i preporuke.

1. Korišćenje standardnih procedura čarobnjaka za funkcije Excel tabela (iz odeljka „Matematički” i „Statistički”);

2. Priprema podataka i karakteristike korištenja funkcije LINEST;

3. Priprema podataka i karakteristike korištenja funkcije “PREDIKCIJA”.

1. Korištenje standardnih procedura paketa za analizu podataka iz Excel tabela;

2. Priprema podataka i karakteristike primjene procedure „REGRESIJA“;

3. Interpretacija i sinteza tabličnih podataka regresiona analiza;

4. Interpretacija i sinteza podataka iz analize tabele varijanse;

5. Interpretacija i generalizacija podataka iz tabele za procjenu značajnosti parametara regresione jednačine;

Prilikom izvođenja laboratorijskog rada na osnovu jedne od opcija, morate izvršiti sljedeće specifične zadatke:

1. Odabrati oblik jednačine za odnos faktora koji se proučavaju;

2. Odrediti parametre regresione jednačine;

3. Procijeniti blisku povezanost faktora koji se proučavaju;

4. Procijeniti adekvatnost odabrane regresione jednačine;

5. Procijeniti statističku značajnost parametara regresione jednačine.

6. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

7. Analizirati rezultate, formulisati zaključke i preporuke.

Zadaci za praktičan i laboratorijski rad na temu “Uparena linearna regresija i korelacija u ekonometrijskom istraživanju”.

Opcija 1 Opcija 2 Opcija 3 Opcija 4 Opcija 5
x y x y x y x y x y
Opcija 6 Opcija 7 Opcija 8 Opcija 9 Opcija 10
x y x y x y x y x y

Linearna regresija se svodi na pronalaženje jednadžbe u obliku:

Prvi izraz dozvoljava date vrednosti faktor a X izračunajte teorijske vrijednosti rezultantne karakteristike zamjenom stvarnih vrijednosti faktora u nju. Na grafikonu (slika 1.2), teorijske vrijednosti leže na pravoj liniji, koja predstavlja liniju regresije.

Konstrukcija linearne regresije svodi se na procjenu njenih parametara - a i b. Klasični pristup procjeni parametara linearne regresije temelji se na metodi najmanjih kvadrata (OLS).

Metoda najmanjih kvadrata nam omogućava da dobijemo takve procjene parametara A I b, pri čemu je zbir kvadrata odstupanja stvarnih vrijednosti at od teorijskih y x minimum:

Rice. 1.2.

Da bismo pronašli minimum, potrebno je izračunati parcijalne izvode suma (1.4) za svaki od parametara (a i ft) i izjednačiti ih sa nulom:

Nakon transformacije dobijamo sistem normalnih jednačina:

U sistemu P- veličina uzorka, količine se lako izračunavaju iz originalnih podataka. Rješavanje sistema za A I b, dobijamo:

Izraz (1.7) se može napisati u drugom obliku:

gdje je cov(x, y) - kovarijacija osobina; su* - faktor disperzije X.

Parametar b se naziva koeficijent regresije. Njegova vrijednost pokazuje prosječnu promjenu rezultata sa povećanjem faktora za jednu jedinicu. Mogućnost jasnog ekonomska interpretacija napravljen koeficijent regresije linearna jednačina parna regresija je prilično česta u ekonometrijskim istraživanjima.

Formalno A - značenje at at x = 0. Ako X nema i ne može imati nultu vrijednost, onda ovo tumačenje slobodnog pojma A nema smisla. Parametar A najčešće nema ekonomski sadržaj. Pokušaji da se to ekonomski protumači mogu dovesti do apsurda, posebno kada a 0. Može se interpretirati samo predznak parametra A. Ako a > 0, tada se relativna promjena rezultata događa sporije od promjene faktora. Uporedimo ove relativne promjene:

Ponekad se jednadžba linearne parne regresije piše za odstupanja od srednje vrijednosti:

Gdje

U ovom slučaju, slobodni član je jednak nuli, što se odražava u izrazu (1.10). Ova činjenica proizilazi iz geometrijskih razmatranja: ista prava linija (1.3) odgovara jednadžbi regresije, ali kada se procjenjuje regresija u devijacijama, ishodište koordinata se pomiče u tačku sa koordinatama (Zc, y). U ovom slučaju, u izrazu (1.8) će oba suma biti jednaka nuli, što će za posljedicu imati jednakost slobodnog člana nuli. Izrazi (1.7) i (1.9) su takođe pojednostavljeni.

Kao primjer, razmotrimo grupu preduzeća koja proizvode jednu vrstu proizvoda, regresijska zavisnost troškova od proizvodnje proizvoda y = a + bx+ e (Tabela 1.1).

Sistem normalnih jednačina će imati oblik

Rešavajući to, dobijamo A - -5,79, b - 36,84.

Jednačina regresije ima oblik

Tabela 1.1

Ulazni podaci za procjenu parametara uparenog linearnog modela

Izlaz proizvoda (x), hiljade jedinica.

Troškovi proizvodnje (y), miliona rubalja

Zamjenom x vrijednosti u regresionu jednadžbu nalazimo teorijske vrijednosti y ( posljednja kolona sto 1.1).

Magnituda A nema ekonomskog smisla. Ako su varijable X I at izraženo u terminima odstupanja od prosječnih nivoa, tada će linija regresije na grafu proći kroz ishodište. Procjena koeficijenta regresije se neće promijeniti: y" = 36,84x", gdje je y" = y-y, x" = x-x.

Kao drugi primjer, razmotrite funkciju potrošnje oblika:

gdje je C potrošnja; at- prihod; K, L - opcije.

Ova jednačina linearne regresije se obično koristi zajedno sa jednadžbom bilansa stanja

gdje je / iznos investicije; G- uštede.

Radi jednostavnosti, pretpostavite da se prihod troši na potrošnju i investicije. Dakle, razmatramo sistem jednačina

Prisustvo bilansne jednakosti nameće ograničenja na vrijednost koeficijenta regresije, koji ne može biti veći od jedan, tj. K 1.

Pretpostavimo da je funkcija potrošnje C = 1.9 + 0.65g.

Koeficijent regresije karakterizira sklonost potrošnji. Pokazuje da se od svake hiljadu rubalja prihoda u prosjeku troši 650 rubalja na potrošnju, a 350 rubalja. investirano. Ako izračunamo regresiju veličine ulaganja na prihod, tj. I = a + by, tada će jednačina regresije biti I= -1,9 + 0,35 g. Ne treba ga određivati, jer se izvodi iz funkcije potrošnje. Koeficijenti regresije ove dvije jednačine povezani su jednakošću 0,65 + 0,35 = 1. Ako je koeficijent regresije veći od jedan, tada Ne samo prihod, već i štednja se troši na potrošnju.

Koeficijent regresije TO u funkciji potrošnje se koristi za izračunavanje množitelja:

Gdje T» 2,86, tako da je dodatna investicija 1 hiljada rubalja. za duži period će dovesti, uz ostale jednake stvari, do dodatnog prihoda od 2,86 hiljada rubalja.

U linearnoj regresiji, linearni koeficijent korelacije djeluje kao indikator bliskosti veze G.

Njegove vrijednosti su u granicama: - 1 r 1. Ako je 6>0, onda 0 g b 0-1 g 0. Prema primjeru, izračunavanje izraza (1.11) daje g = 0,991, što znači veoma blisku zavisnost troškova proizvodnje od obima proizvodnje.

Za procjenu kvaliteta selekcije linearna funkcija koeficijent determinacije se izračunava kao kvadrat koeficijenta linearne korelacije I 2. Karakterizira udio varijanse u rezultantnom atributu y objašnjenom regresijom, in totalna varijansa rezultujući znak:

Vrijednost 1 - g 2 karakteriše udio varijanse y, uzrokovane uticajem drugih faktora koji nisu uzeti u obzir u modelu.

U primjeru g 2 = 0,982. Jednačina regresije objašnjava 98,2% varijanse u y, a ostali faktori čine 1,8% - ovo je rezidualna varijansa.

Linearna regresija se svodi na pronalaženje jednadžbe u obliku:

(ili
) (3)

Prvi izraz dozvoljava date vrijednosti faktora X izračunajte teorijske vrijednosti rezultirajuće karakteristike zamjenom stvarnih vrijednosti faktora u nju X . Na grafikonu, teorijske vrijednosti leže na pravoj liniji, koja predstavlja liniju regresije.

Konstrukcija linearne regresije svodi se na procjenu njenih parametara - A I b . Klasičan pristup procjeni parametara linearne regresije temelji se na metoda najmanjih kvadrata (LSM).

Metoda najmanjih kvadrata nam omogućava da dobijemo takve procjene parametara A I b , pri čemu je zbir kvadrata odstupanja stvarnih vrijednosti at od teorijskih minimum:

, ili
(4)

Za pronalaženje minimuma potrebno je izračunati parcijalne derivate zbira (4) za svaki od parametara - A I b - i postavite ih jednakima nuli.

(5)

Hajde da se transformišemo, dobijamo sistem normalnih jednačina:

(6)

U ovom sistemu n - veličine uzorka, iznosi se lako izračunavaju iz originalnih podataka. Rešavamo sistem u odnosu na A I b , dobijamo:

(7)

(8)

Izraz (7) se može napisati u drugom obliku:

(9)

Gdje sav(x,y) - kovarijacija karakteristika, - faktor disperzije X .

Parametar b pozvao koeficijent regresije. Njegova vrijednost pokazuje prosječnu promjenu rezultata sa promjenom faktora za jednu jedinicu. Mogućnost jasne ekonomske interpretacije koeficijenta regresije učinila je jednadžbu linearne parne regresije prilično uobičajenom u ekonometrijskom istraživanju.

Formalno A - značenje at at x=0. Ako X nema i ne može imati nultu vrijednost, onda ovo tumačenje slobodnog pojma A nema smisla. Parametar A možda nemaju ekonomski sadržaj. Pokušaji da se to ekonomski protumači mogu dovesti do apsurda, posebno kada A< 0 . Može se interpretirati samo znak parametra A . Ako a > 0 , tada se relativna promjena u rezultatu događa sporije od promjene faktora. Uporedimo ove relativne promjene:

at.

Ponekad se jednadžba linearne parne regresije piše za odstupanja od srednje vrijednosti:

y′ = b x" , (10)

Gdje
,
. U ovom slučaju, slobodni član je jednak nuli, što se odražava u izrazu (10). Ova činjenica proizilazi iz geometrijskih razmatranja: ista prava linija (3) odgovara jednadžbi regresije, ali kada se procjenjuje regresija u devijacijama, ishodište koordinata se pomiče u tačku sa koordinatama
. U ovom slučaju, u izrazu (8) će oba suma biti jednaka nuli, što će za posljedicu imati jednakost slobodnog člana nuli.

Razmotrimo, kao primjer, za grupu preduzeća koja proizvode jednu vrstu proizvoda, regresijska zavisnost troškova od proizvodnje proizvoda y = a + bx + ε.

Tabela 1

Proizvodnja proizvoda u hiljadama jedinica ( x)

Troškovi proizvodnje, milioni rubalja ( y)

x 2

y 2

Sistem normalnih jednačina će izgledati ovako:

Rešavajući to, dobijamo a = -5,79,b = 36,84.

Jednačina regresije je:

Zamjena vrijednosti u jednadžbu X , nađimo teorijske vrijednosti y (poslednja kolona tabele).

Magnituda A nema ekonomskog smisla. Ako su varijable X I at izraženo u terminima odstupanja od prosječnih nivoa, tada će linija regresije na grafu proći kroz ishodište. Procjena koeficijenta regresije se neće promijeniti:

, Gdje
,

Kao drugi primjer, razmotrite funkciju potrošnje oblika:

C = K·y + L

Gdje WITH- potrošnja, at-prihod, K, L- opcije. Ova jednačina linearne regresije se obično koristi zajedno sa jednadžbom bilansa stanja:

y = C + I – r,

Gdje I– veličina investicije, r– uštede.

Radi jednostavnosti, pretpostavite da se prihod troši na potrošnju i investicije. Dakle, razmatra se sistem jednačina:

Prisustvo bilansne jednakosti nameće ograničenja na vrijednost koeficijenta regresije, koji ne može biti veći od jedan, tj. TO≤ 1.

Pretpostavimo da je funkcija potrošnje:

Koeficijent regresije karakterizira sklonost potrošnji. Pokazuje da se od svake hiljadu rubalja prihoda u prosjeku troši 650 rubalja na potrošnju, a 350 rubalja. je investirano. Ako izračunamo regresiju veličine ulaganja na prihod, tj.
, tada će jednačina regresije biti
. Ovu jednačinu ne treba definirati, jer je izvedena iz funkcije potrošnje. Koeficijenti regresije ove dvije jednačine povezani su jednakošću:

Ako je koeficijent regresije veći od jedan, onda at< С + 1, a ne samo prihod, već se i štednja troši na potrošnju.

Koeficijent regresije u funkciji potrošnje koristi se za izračunavanje množitelja:

.

Ovdje je m≈ 2,86, tako da je dodatna investicija 1 hiljada rubalja. za duži period će dovesti, uz ostale jednake stvari, do dodatnog prihoda od 2,86 hiljada rubalja.

U linearnoj regresiji, koeficijent linearne korelacije služi kao indikator bliskosti veze r:

(11)

Njegove vrijednosti su u granicama: 0 < r ≤ 1 . Ako b > 0 , To 0 ≤ r ≤ 1 , at b < 0, – 1 ≤ r < 0 . Prema primjeru r=0,991, što znači veoma blisku zavisnost troškova proizvodnje od obima proizvodnje.

Da biste procijenili kvalitetu uklapanja linearne funkcije, izračunajte koeficijent odlučnosti kao kvadrat koeficijenta linearne korelacije r 2 . Karakterizira udio varijanse rezultirajuće karakteristike y objašnjeno regresijom u ukupnoj varijansi rezultirajuće osobine:

12

Magnituda 1 - r 2 karakteriše udio varijanse y, uzrokovane uticajem drugih faktora koji nisu uzeti u obzir u modelu.

U primjeru, σ 2 = 0,092. Jednačina regresije objašnjava 98,2% varijanse y, a ostali faktori čine 1,8%, ovo je rezidualna varijansa.

Za teritorije regiona dati su podaci za 200X.

Broj regije Prosječna životna plata po glavi stanovnika po danu jedne radno sposobne osobe, rub., x Prosječna dnevna plata, rub., god
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

vježba:

1. Konstruirajte korelacijsko polje i formulirajte hipotezu o obliku veze.

2. Izračunajte parametre jednačine linearne regresije

4. Koristeći prosječni (opći) koeficijent elastičnosti, dati komparativnu ocjenu jačine veze između faktora i rezultata.

7. Izračunajte predviđenu vrijednost rezultata ako se predviđena vrijednost faktora poveća za 10% od njegovog prosječnog nivoa. Definiraj interval povjerenja prognoza za nivo značajnosti.

Rješenje:

Rešimo ovaj problem koristeći Excel.

1. Upoređujući dostupne podatke x i y, na primjer, rangirajući ih rastućim redom faktora x, može se uočiti postojanje direktne veze između karakteristika, kada povećanje prosječnog životnog nivoa po glavi stanovnika povećava prosječni dnevni nadnica. Na osnovu ovoga možemo pretpostaviti da je odnos između karakteristika direktan i da se može opisati jednolinskom jednadžbom. Isti zaključak potvrđuje se i na osnovu grafičke analize.

Da biste izgradili polje korelacije, možete koristiti Excel PPP. Unesite početne podatke redom: prvo x, zatim y.

Odaberite područje ćelija koje sadrži podatke.

Zatim odaberite: Insert / Scatter Plot / Scatter with Markers kao što je prikazano na slici 1.

Slika 1 Konstrukcija korelacionog polja

Analiza korelacionog polja pokazuje prisustvo bliske pravolinijskoj zavisnosti, jer se tačke nalaze skoro u pravoj liniji.

2. Izračunati parametre jednačine linearne regresije
Koristimo ugrađenu statističku funkciju LINEST.

Za ovo:

1) Otvorite postojeću datoteku koja sadrži analizirane podatke;
2) Odaberite područje praznih ćelija veličine 5x2 (5 redaka, 2 stupca) za prikaz rezultata regresijska statistika.
3) Aktivirajte Čarobnjak za funkcije: u glavnom meniju izaberite Formule / Funkcija umetanja.
4) U prozoru Kategorija ti uzimaš Statistički, u funkcijskom prozoru - LINEST. Kliknite na dugme uredu kao što je prikazano na slici 2;

Slika 2 Dijaloški okvir čarobnjaka za funkcije

5) Popunite argumente funkcije:

Poznate vrijednosti za

Poznate vrijednosti x

Konstantno- logička vrijednost koja ukazuje na prisustvo ili odsustvo slobodnog člana u jednačini; ako je Konstanta = 1, onda se slobodni termin izračunava na uobičajen način, ako je Konstanta = 0, onda je slobodni termin 0;

Statistika- logička vrijednost koja pokazuje da li treba prikazati dodatne informacije o regresionoj analizi ili ne. Ako je Statistika = 1, tada se prikazuju dodatne informacije, ako je Statistika = 0, tada se prikazuju samo procjene parametara jednadžbe.

Kliknite na dugme uredu;

Slika 3 Dijaloški okvir Argumenti funkcije LINEST

6) Prvi element konačne tabele će se pojaviti u gornjoj lijevoj ćeliji odabranog područja. Da otvorite celu tabelu, pritisnite dugme , a zatim na kombinaciju tipki ++ .

Dodatna statistika regresije će biti ispisana redoslijedom prikazanim na sljedećem dijagramu:

Vrijednost koeficijenta b Koeficijent vrijednost
Standardna greška b Standardna greška a
Standardna greška y
F-statistika
Regresijski zbir kvadrata

Slika 4 Rezultat izračunavanja funkcije LINEST

Dobili smo nivo regresije:

Zaključujemo: S povećanjem prosječnog životnog nivoa po glavi stanovnika za 1 rub. prosječna dnevna plata raste u prosjeku za 0,92 rublje.

Znači 52% varijacije plate(y) objašnjava se varijacijom faktora x - prosječnog egzistencijalnog nivoa po glavi stanovnika, i 48% - djelovanjem drugih faktora koji nisu uključeni u model.

Koristeći izračunati koeficijent determinacije, može se izračunati koeficijent korelacije: .

Veza se ocenjuje kao bliska.

4. Pomoću prosječnog (općeg) koeficijenta elastičnosti određujemo jačinu utjecaja faktora na rezultat.

Za jednačinu pravolinijske, prosječni (ukupni) koeficijent elastičnosti određujemo pomoću formule:

Prosječne vrijednosti ćemo pronaći odabirom područja ćelija sa x vrijednostima i odabirom Formule / AutoSum / Average, a isto ćemo učiniti sa vrijednostima y.

Slika 5 Izračunavanje prosječnih vrijednosti funkcije i argumenta

Dakle, ako se prosječni troškovi života po glavi stanovnika mijenjaju za 1% od njegove prosječne vrijednosti, prosječna dnevna plata će se promijeniti u prosjeku za 0,51%.

Korištenje alata za analizu podataka Regresija dostupno:
- rezultate regresijske statistike,
- rezultate analize varijanse,
- rezultati intervala povjerenja,
- reziduali i grafovi uklapanja regresijskih linija,
- reziduali i normalna vjerovatnoća.

Procedura je sljedeća:

1) provjerite pristup Paket analiza. U glavnom meniju izaberite: Fajl/Opcije/Dodaci.

2) U padajućoj listi Kontrola odaberite stavku Excel dodaci i pritisnite dugme Idi.

3) U prozoru Dodaci označite polje Paket analiza, a zatim kliknite na dugme uredu.

Ako Paket analiza nije na listi polja Dostupni dodaci, pritisnite dugme Pregled da izvršite pretragu.

Ako dobijete poruku koja ukazuje da paket za analizu nije instaliran na vašem računaru, kliknite Da da ga instalirate.

4) U glavnom meniju izaberite: Podaci / Analiza podataka / Alati za analizu / Regresija, a zatim kliknite na dugme uredu.

5) Popunite dijaloški okvir parametara ulaznih i izlaznih podataka:

Interval unosa Y- opseg koji sadrži podatke rezultujućeg atributa;

Interval unosa X- opseg koji sadrži podatke faktorske karakteristike;

Oznake- zastavicu koja pokazuje da li prvi red sadrži nazive kolona ili ne;

Konstanta - nula- zastavicu koja označava prisustvo ili odsustvo slobodnog člana u jednačini;

Izlazni interval- dovoljno je naznačiti gornju lijevu ćeliju budućeg raspona;

6) Novi radni list - možete odrediti proizvoljno ime za novi list.

Zatim kliknite na dugme uredu.

Slika 6 Dijaloški okvir za unos parametara za alat Regresija

Rezultati regresione analize za podatke o problemu prikazani su na slici 7.

Slika 7 Rezultat korištenja alata za regresiju

5. Procijenimo korištenje prosečna greška kvalitet aproksimacije jednadžbi. Koristimo rezultate regresione analize prikazane na slici 8.

Slika 8 Rezultat korištenja alata za regresiju “Povlačenje ostatka”

Hajde da komponujemo novi sto kao što je prikazano na slici 9. U koloni C izračunavamo relativnu grešku aproksimacije koristeći formulu:

Slika 9 Proračun prosječne greške aproksimacije

Prosječna greška aproksimacije se izračunava pomoću formule:

Kvalitet izrađenog modela ocjenjuje se kao dobar, jer ne prelazi 8 - 10%.

6. Iz tabele sa statistikom regresije (slika 4) zapisujemo stvarnu vrijednost Fisherovog F-testa:

Zbog na nivou značajnosti od 5%, onda možemo zaključiti da je jednačina regresije značajna (odnos je dokazan).

8. Procijenit ćemo statističku značajnost parametara regresije koristeći Studentovu t-statistiku i izračunavanjem intervala povjerenja za svaki indikator.

Postavili smo hipotezu H 0 o statistički beznačajnoj razlici između indikatora i nule:

.

za broj stepeni slobode

Slika 7 ima stvarne t-statističke vrijednosti:

T-test za koeficijent korelacije može se izračunati na dva načina:

Metoda I:

Gdje - slučajna greška koeficijenta korelacije.

Podatke za proračun ćemo uzeti iz tabele na slici 7.

Metoda II:

Stvarne vrijednosti t-statistike premašuju vrijednosti tablice:

Stoga se hipoteza H 0 odbacuje, odnosno regresijski parametri i koeficijent korelacije ne razlikuju se slučajno od nule, već su statistički značajni.

Interval pouzdanosti za parametar a definiran je kao

Za parametar a, granice od 95% kao što je prikazano na slici 7 bile su:

Interval pouzdanosti za koeficijent regresije je definiran kao

Za koeficijent regresije b, granice od 95% kao što je prikazano na slici 7 bile su:

Analiza gornje i donje granice intervala povjerenja dovodi do zaključka da s vjerovatnoćom parametri a i b, koji su unutar navedenih granica, ne uzimaju nulte vrijednosti, tj. nisu statistički beznačajne i značajno se razlikuju od nule.

7. Dobijene procjene jednačine regresije omogućavaju njeno korištenje za prognoziranje. Ako su predviđeni troškovi života:

Tada će predviđena vrijednost troškova života biti:

Izračunavamo grešku prognoze koristeći formulu:

Gdje

Također ćemo izračunati varijansu koristeći Excel PPP. Za ovo:

1) Aktivirajte Čarobnjak za funkcije: u glavnom meniju izaberite Formule / Funkcija umetanja.

3) Popunite opseg koji sadrži numeričke podatke faktorske karakteristike. Kliknite uredu.

Slika 10 Izračun varijanse

Dobili smo vrijednost varijanse

Za brojanje rezidualna varijansa za jedan stepen slobode koristićemo rezultate analize varijanse kao što je prikazano na slici 7.

Intervali povjerenja za predviđanje pojedinačnih vrijednosti y sa vjerovatnoćom od 0,95 određeni su izrazom:

Interval je prilično širok, prvenstveno zbog malog obima posmatranja. Općenito, prognoza za prosječnu mjesečnu platu pokazala se pouzdanom.

Uslov problema je preuzet iz: Radionica o ekonometriji: Proc. dodatak / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko i drugi; Ed. I.I. Eliseeva. - M.: Finansije i statistika, 2003. - 192 str.: ilustr.

100 RUR bonus za prvu narudžbu

Odaberite vrstu posla Diplomski rad Rad na kursu Sažetak Magistarski rad Izvještaj o praksi Članak Pregled izvještaja Test Monografija Rešavanje problema Poslovni plan Odgovori na pitanja Kreativni rad Esej Crtanje Radovi Prevod Prezentacije Tipkanje Ostalo Povećanje jedinstvenosti teksta Magistarski rad Laboratorijski rad Pomoć na mreži

Saznajte cijenu

Prilikom procjene parametara jednadžbe regresije koristi se metoda najmanjih kvadrata (OLS). U ovom slučaju, određeni su preduslovi u vezi sa slučajnom komponentom e. U modelu, slučajna komponenta e je veličina koja se ne može uočiti. Nakon što su parametri modela procijenjeni, izračunavanje razlika između stvarnih i teoretskih vrijednosti rezultirajuće karakteristike y , moguće je odrediti procjene slučajne komponente. Pošto nisu stvarni slučajni ostaci, mogu se smatrati realizacijom nekog uzorka nepoznatog ostatka zadata jednačina, tj. ei.

Kada se mijenja specifikacija modela ili joj se dodaju nova zapažanja, procjene uzoraka reziduala ei mogu se promijeniti. Dakle, zadatak regresione analize uključuje ne samo konstrukciju samog modela, već i proučavanje slučajnih devijacija ei, odnosno rezidualnih vrijednosti.

Kada se koriste Fisher i Student testovi, prave se pretpostavke o ponašanju reziduala ei - reziduali su nezavisni slučajne varijable a njihova srednja vrijednost je 0; imaju istu (konstantnu) varijansu i prate normalnu distribuciju.

Statistički testovi regresijskih parametara i indikatora korelacije zasnovani su na neprovjerljivim pretpostavkama distribucije slučajne komponente ei. Oni su samo preliminarni. Nakon konstruisanja regresione jednadžbe, prisustvo od

procjenjuje ei (slučajne reziduale) onih svojstava koja su pretpostavljena. To je zbog činjenice da procjene parametara regresije moraju zadovoljiti određene kriterije. Moraju biti nepristrasni, bogati i efikasni. Ova svojstva procjena dobijenih korištenjem OLS-a su izuzetno važna. praktični značaj u korištenju rezultata regresije i korelacije.

Undisplaced procjene znači da je matematičko očekivanje reziduala nula. Ako su procjene nepristrasne, onda se mogu porediti u različitim studijama.

Ocjene se računaju efektivno, ako ih karakteriše najmanja disperzija. U praktičnom istraživanju to znači mogućnost prelaska sa tačke na intervalnu procenu.

Bogatstvo procjene karakterizira povećanje njihove tačnosti sa povećanjem veličine uzorka. Od velikog su praktičnog interesa oni rezultati regresije za koje je interval povjerenja očekivane vrijednosti parametra regresije bi ima granicu vrijednosti vjerovatnoće, jednako jedan. Drugim riječima, vjerovatnoća dobivanja procjene na datoj udaljenosti od pravo značenje parametar je blizu jedinice.

Navedeni kriterijumi evaluacije (nepristrasnost, doslednost i efikasnost) se nužno uzimaju u obzir kada na različite načine procjena. Metoda najmanjih kvadrata konstruiše procjene regresije zasnovane na minimiziranju sume kvadrata reziduala. Stoga je vrlo važno ispitati ponašanje reziduala regresije ei. Uslovi neophodni za dobijanje nepristrasnih, konzistentnih i efikasnih procena su preduslovi OLS-a koji su poželjni za dobijanje pouzdanih rezultata regresije.

Studije ei ostataka uključuju provjeru prisustva sljedećeg pet prostorija CG:

1. nasumična priroda ostataka;

2. nulta prosječna vrijednost reziduala, neovisno o xi;

3. homoskedastičnost – varijansa svake devijacije ei je ista za sve vrijednosti x ;

4. odsustvo autokorelacije reziduala – vrijednosti reziduala ei se distribuiraju nezavisno jedna od druge;

5. ostaci prate normalnu distribuciju.

Ako distribucija slučajnih reziduala ei ne odgovara nekim pretpostavkama OLS-a, tada model treba prilagoditi.

Prije svega, provjerava se slučajna priroda reziduala ei - prva premisa OLS-a. U tu svrhu iscrtava se graf ovisnosti reziduala ei od teorijske vrijednosti rezultirajuće karakteristike.

Ako se na grafu dobije horizontalna traka, tada su reziduali ei slučajne varijable i metoda najmanjih kvadrata je opravdana teorijske vrijednosti dobro približne stvarnim vrijednostima y.

Sljedeći slučajevi su mogući ako ei zavisi od to:

1) ostaci ei nisu slučajni

2) reziduali ei nemaju konstantnu varijansu

3) ostaci ei su sistematski.

U ovim slučajevima, potrebno je ili primijeniti drugu funkciju ili uvesti dodatne informacije i ponovo izgraditi jednadžbu regresije sve dok reziduali ei ne budu slučajne varijable.

Druga premisa OLS-a je relativno nula prosječne veličine ostatak znači da . Ovo je izvodljivo za linearne modele i modele koji su nelinearni u odnosu na uključene varijable.

Istovremeno, nepristrasnost procena koeficijenata regresije dobijenih OLS zavisi od nezavisnosti slučajnih reziduala i x vrednosti, što se takođe proučava u okviru usaglašenosti sa drugom premisom OLS. U tu svrhu, uz prikazani graf ovisnosti reziduala ei o teoretskim vrijednostima rezultantnog atributa, konstruiran je graf ovisnosti slučajnih reziduala ei od faktora uključenih u regresiju xj.

Ako se ostaci na grafu nalaze u obliku vodoravne trake, onda su neovisni o vrijednostima xj. Ako graf pokazuje postojanje veze između ei i xj, onda je model neadekvatan. Razlozi za neadekvatnost mogu biti različiti. Moguće je da je treća premisa OLS-a narušena i da disperzija reziduala nije konstantna za svaku vrijednost faktora xj. Specifikacija modela je možda netačna i treba je unijeti

dodatni pojmovi iz xj, na primjer . Akumulacija bodova u određenim područjima vrijednosti faktora xj ukazuje na prisustvo sistematske greške u modelu.

Pretpostavka normalne raspodjele reziduala omogućava testiranje regresijskih i korelacijskih parametara korištenjem F- i t-testova. U isto vrijeme, procjene regresije pronađene korištenjem OLS imaju dobra svojstva čak i u odsustvu normalne raspodjele reziduala, tj. ako je povrijeđena peta premisa MNK.

Apsolutno je neophodno dobiti konzistentne procjene parametara regresije korištenjem OLS-a je usklađenost sa trećim i četvrtim preduvjetom.

Treća premisa OLS-a zahtijeva da varijansa reziduala bude homoskedastičan. To znači da za svaku vrijednost faktora xj reziduali ei imaju istu varijansu. Ako ovaj uvjet za primjenu metode najmanjih kvadrata nije ispunjen, onda heteroskedastičnost. Prisustvo heteroskedastičnosti može se jasno vidjeti iz korelacionog polja:

1. Varijanca reziduala raste kako se x povećava.

Onda imamo sljedeći pogled heteroskedastičnost: velika varijansa ei za velike vrijednosti

2. Varijanca reziduala dostiže svoju maksimalnu vrijednost pri prosječnim vrijednostima x, a opada na minimalnim i maksimalnim vrijednostima.

Tada imamo sljedeći tip heteroskedastičnosti: velika disperzija ei za prosječne vrijednosti i mala disperzija ei za male i velike vrijednosti

3. Varijanca reziduala je maksimalna pri malim vrijednostima x i varijansa reziduala je ujednačena kako se x povećava.

Tada imamo sljedeći tip heteroskedastičnosti: velika disperzija ei za male vrijednosti, opadajuća disperzija reziduala ei kao

Prilikom konstruiranja regresijskih modela, izuzetno je važno pridržavati se četvrte premise OLS-a - odsustvo autokorelacije reziduala, odnosno vrijednosti reziduala ei se distribuiraju nezavisno jedna od druge.

Autokorelacija reziduala znači postojanje korelacije između reziduala trenutnih i prethodnih (naknadnih) opservacija. Koeficijent korelacije između ei i ej, gdje su ei reziduali trenutnih opažanja, ej su reziduali prethodnih opažanja (na primjer, j=i-1), može se definirati kao:

tj. prema uobičajenoj formuli za koeficijent linearne korelacije. Ako se pokaže da se ovaj koeficijent značajno razlikuje od nule, tada su reziduali autokorelirani i funkcija gustoće vjerovatnoće F(e) ovisi o j -toj tački posmatranja i iz distribucije zaostalih vrijednosti na drugim osmatračkim tačkama.

Odsustvo autokorelacije rezidualnih vrijednosti osigurava konzistentnost i efikasnost procjena koeficijenata regresije. Posebno je važno pridržavati se ove premise OLS-a kada se konstruiraju regresijski modeli zasnovani na vremenskim serijama, gdje se, zbog prisustva trenda, naknadni nivoi vremenske serije, po pravilu, zavise od njihovih prethodnih nivoa.

Ukoliko osnovne pretpostavke OLS-a nisu ispunjene, potrebno je prilagoditi model, mijenjajući njegovu specifikaciju, dodajući (isključujući) neke faktore, transformirajući izvorne podatke kako bi se dobile procjene koeficijenata regresije koji imaju svojstvo nepristrasnosti, nižu vrijednost disperzije reziduala i stoga obezbjeđuju efikasnije statističko testiranje značajnosti parametara regresije.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”