Kako pronaći ukupnu varijansu. Varijanca i standardna devijacija

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Za grupisane podatke rezidualna varijansa- prosjek unutargrupnih varijansi:

Gdje je σ 2 j unutargrupna varijansa j-te grupe.

Za negrupisane podatke rezidualna varijansa– mjera tačnosti aproksimacije, tj. aproksimacija linije regresije originalnim podacima:
gdje je y(t) – prognoza prema jednačini trenda; y t – početni niz dinamike; n – broj bodova; p – broj koeficijenata regresijske jednačine (broj varijabli za objašnjenje).
U ovom primjeru se zove nepristrasni estimator varijanse.

Primjer br. 1. Raspodjelu radnika tri preduzeća jednog udruženja po tarifnim kategorijama karakterišu sljedeći podaci:

Radnička tarifna kategorijaBroj radnika u preduzeću
preduzeće 1preduzeće 2preduzeće 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definiraj:
1. varijansa za svako preduzeće (unutargrupne varijanse);
2. prosjek varijansi unutar grupe;
3. međugrupna disperzija;
4. totalna varijansa.

Rješenje.
Prije nego što počnete rješavati problem, potrebno je utvrditi koja je karakteristika efektivna, a koja faktorijalna. U primjeru koji se razmatra, rezultujući atribut je “Tarifna kategorija”, a faktor faktora je “Broj (naziv) preduzeća”.
Tada imamo tri grupe (preduzeća) za koje je potrebno izračunati grupni prosjek i unutargrupne varijanse:


KompanijaGrupni prosjek,Varijanca unutar grupe,
1 4 1,8

Prosjek varijansi unutar grupe ( rezidualna varijansa) će se izračunati pomoću formule:


gdje možete izračunati:
ili:


onda:
Ukupna varijansa će biti jednaka: s 2 = 1,6 + 0 = 1,6.
Ukupna varijansa se također može izračunati korištenjem jedne od sljedeće dvije formule:

Prilikom rješavanja praktičnih problema, često se mora suočiti sa osobinom koja ima samo dvije alternativne vrijednosti. U ovom slučaju ne govorimo o težini određene vrijednosti neke karakteristike, već o njenom udjelu u ukupnosti. Ako se udio jedinica stanovništva koje posjeduju karakteristiku koja se proučava označava sa “ R", a oni koji nemaju - kroz" q", tada se varijansa može izračunati pomoću formule:
s 2 = p×q

Primjer br. 2. Na osnovu podataka o proizvodnji šest radnih timova utvrditi međugrupnu varijansu i proceniti uticaj radna smena na njihovu produktivnost rada ako je ukupna varijansa 12,2.

Timski radnik br.Učinak radnika, kom.
u prvoj smjeniu drugoj smjeni
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Rješenje. Početni podaci

Xf 1f 2f 3f 4f 5f 6Ukupno
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Ukupno 31 33 37 37 40 38

Tada imamo 6 grupa za koje je potrebno izračunati grupnu sredinu i unutargrupne varijanse.
1. Pronađite prosječne vrijednosti svake grupe.







2. Pronađite srednji kvadrat svake grupe.







Sumiramo rezultate proračuna u tabeli:
Broj grupeGrupni prosjekVarijanca unutar grupe
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varijanca unutar grupe karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike unutar grupe pod uticajem svih faktora na nju, osim faktora koji leži u osnovi grupisanja:
Prosjek unutargrupnih varijansi će se izračunati pomoću formule:


4. Međugrupna varijansa karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike pod uticajem faktora (faktorske karakteristike) koji čini osnovu grupe.
Međugrupnu varijansu definiramo kao:

Gdje


Onda

Ukupna varijansa karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike pod uticajem svih faktora (faktorskih karakteristika) bez izuzetka. Prema uslovima zadatka, ona je jednaka 12,2.
Empirijska korelacija mjeri koji je dio ukupne varijabilnosti rezultirajuće karakteristike uzrokovan faktorom koji se proučava. Ovo je omjer varijanse faktora i ukupne varijanse:

Definiramo empirijsku korelaciju:

Veze između karakteristika mogu biti slabe i jake (bliske). Njihovi kriterijumi se ocjenjuju na Chaddock skali:
0,1 0,3 0,5 0,7 0,9 U našem primjeru, odnos između osobine Y i faktora X je slab
Koeficijent determinacije.

Odredimo koeficijent determinacije:

Tako je 0,67% varijacije rezultat razlika između osobina, a 99,37% drugih faktora.
Zaključak: u ovom slučaju učinak radnika ne zavisi od rada u određenoj smjeni, tj. uticaj radne smjene na njihovu produktivnost rada nije značajan i uzrokovan je drugim faktorima.

Primjer br. 3. Na osnovu prosjeka plate i kvadrata odstupanja od njegove vrijednosti za dvije grupe radnika, pronađite ukupnu varijansu primjenom pravila sabiranja varijansi:

Rješenje:
Prosjek varijansi unutar grupe

Međugrupnu varijansu definiramo kao:


Ukupna varijansa će biti: 480 + 13824 = 14304

Disperzija u statistici nalazi se kao pojedinačne vrijednosti karakteristike na kvadrat iz . Ovisno o početnim podacima, određuje se korištenjem jednostavnih i ponderiranih formula varijanse:

1. (za negrupirane podatke) se izračunava pomoću formule:

2. Ponderirana varijansa (za serije varijacija):

gdje je n frekvencija (ponovljivost faktora X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge probleme za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata dostupni su sljedeći podaci. Potrebno je konstruirati intervalni niz distribucije karakteristike, izračunati prosječnu vrijednost karakteristike i proučiti njenu disperziju

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala koristeći formulu:

gdje je X max maksimalna vrijednost karakteristike grupisanja;
X min – minimalna vrijednost karakteristike grupisanja;
n – broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Kreirajmo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 – 165,6 = 162,3)

Određujemo prosječnu visinu učenika koristeći ponderiranu formulu aritmetičkog prosjeka:

Odredimo varijansu koristeći formulu:

Formula disperzije se može transformirati na sljedeći način:

Iz ove formule slijedi da varijansa je jednaka razlika između prosjeka kvadrata opcija i kvadrata i prosjeka.

Disperzija u varijantnim serijama With u jednakim intervalima metodom momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Određivanje varijanse, izračunato metodom momenata, koristeći sljedeću formulu je manje naporno:

gdje je i vrijednost intervala;
A je konvencionalna nula, za koju je prikladno koristiti sredinu intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji karakteristika mijenja na takav način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati pomoću formule:

Zamjenom q = 1- p u ovu formulu disperzije dobijamo:

Vrste varijanse

Ukupna varijansa mjeri varijaciju neke karakteristike u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja pojedinačnih vrednosti karakteristike x od ukupne srednje vrednosti x i može se definisati kao jednostavna varijansa ili ponderisana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije koji je posljedica uticaja neuračunatih faktora i ne zavisi od faktora-atributa koji čini osnovu grupe. Takva disperzija jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar grupe X od aritmetičke sredine grupe i može se izračunati kao jednostavna disperzija ili kao ponderirana disperzija.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u problemu proučavanja utjecaja kvalifikacija radnika na nivo produktivnosti rada u radionici pokazuju varijacije u outputu u svakoj grupi uzrokovane svim mogućim faktorima ( tehničko stanje opreme, dostupnosti alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava nasumičan, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se pomoću formule:

Karakterizira sistematsku varijaciju rezultirajuće karakteristike, koja je posljedica utjecaja faktora-znaka koji čini osnovu grupe. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava pomoću formule:

Pravilo za dodavanje varijanse u statistiku

Prema pravilo za dodavanje varijansi ukupna varijansa je jednaka zbroju prosjeka varijansi unutar grupe i između grupa:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za dodavanje varijansi, možete odrediti po dva poznate disperzije treći je nepoznat, a takođe sudi o jačini uticaja karakteristike grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti konstantni iznos, tada se disperzija neće promijeniti.
2. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge probleme za njeno pronalaženje

Primjer 1. Određivanje grupnog, grupnog prosjeka, međugrupne i ukupne varijanse

Primjer 2. Pronalaženje varijanse i koeficijenta varijacije u tabeli grupisanja

Primjer 3. Pronalaženje varijanse u diskretne serije

Primjer 4. Za grupu od 20 dopisnih studenata dostupni su sljedeći podaci. Potrebno je konstruirati intervalni niz distribucije karakteristike, izračunati prosječnu vrijednost karakteristike i proučiti njenu disperziju

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala koristeći formulu:

gdje je X max maksimalna vrijednost karakteristike grupisanja;
X min – minimalna vrijednost karakteristike grupisanja;
n – broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Kreirajmo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X"i – sredina intervala. (na primjer, sredina intervala 159 – 165,6 = 162,3)

Određujemo prosječnu visinu učenika koristeći ponderiranu formulu aritmetičkog prosjeka:

Odredimo varijansu koristeći formulu:

Formula se može transformisati ovako:

Iz ove formule slijedi da varijansa je jednaka razlika između prosjeka kvadrata opcija i kvadrata i prosjeka.

Disperzija u varijantnim serijama sa jednakim intervalima pomoću metode momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Određivanje varijanse, izračunato metodom momenata, koristeći sljedeću formulu je manje naporno:

gdje je i vrijednost intervala;
A je konvencionalna nula, za koju je prikladno koristiti sredinu intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

Alternativna varijansa osobina (ako se u statističkoj populaciji karakteristika mijenja na takav način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati pomoću formule:

Zamjenom q = 1- p u ovu formulu disperzije dobijamo:

Vrste varijanse

Ukupna varijansa mjeri varijaciju neke karakteristike u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja pojedinačnih vrednosti karakteristike x od ukupne srednje vrednosti x i može se definisati kao jednostavna varijansa ili ponderisana varijansa.

Varijanca unutar grupe karakterizira slučajnu varijaciju, tj. dio varijacije koji je posljedica uticaja neuračunatih faktora i ne zavisi od faktora-atributa koji čini osnovu grupe. Takva disperzija jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar grupe X od aritmetičke sredine grupe i može se izračunati kao jednostavna disperzija ili kao ponderirana disperzija.



dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radionici pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost opreme). alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kategoriji kvalifikacija (unutar grupe svi radnici imaju iste kvalifikacije).

Prema uzorku ankete, deponenti su grupisani prema veličini njihovog depozita u gradskoj Sberbanci:

Definiraj:

1) obim varijacije;

2) prosječna veličina depozita;

3) prosečno linearno odstupanje;

4) disperzija;

5) prosjek standardna devijacija;

6) koeficijent varijacije doprinosa.

Rješenje:

Ova serija distribucije sadrži otvorene intervale. U takvim serijama, konvencionalno se pretpostavlja da je vrijednost intervala prve grupe jednaka vrijednosti intervala sljedeće, a vrijednost intervala posljednja grupa jednaka vrijednosti prethodnog intervala.

Vrijednost intervala druge grupe je 200, dakle, vrijednost prve grupe je također jednaka 200. Vrijednost intervala pretposljednje grupe je jednaka 200, što znači da će i posljednji interval također imaju vrijednost od 200.

1) Definirajmo raspon varijacije kao razliku između najveće i najmanje vrijednosti atributa:

Raspon varijacija u veličini depozita je 1000 rubalja.

2) Prosječna veličina doprinosa će se odrediti primjenom ponderirane formule aritmetičkog prosjeka.

Hajde da prvo odredimo diskretna količina karakteristika u svakom intervalu. Da bismo to učinili, koristeći jednostavnu formulu aritmetičke sredine, nalazimo sredine intervala.

Prosječna vrijednost prvog intervala će biti:

drugi - 500 itd.

Unesimo rezultate proračuna u tabelu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Ukupno 400 - 312000

Prosječan depozit u gradskoj Sberbanci iznosit će 780 rubalja:

3) Prosječna linearna devijacija je aritmetička sredina apsolutnih odstupanja pojedinačnih vrijednosti karakteristike od ukupnog prosjeka:

Procedura za izračunavanje prosječne linearne devijacije u nizu intervalne distribucije je kako slijedi:

1. Izračunava se ponderisana aritmetička sredina, kao što je prikazano u stavu 2).

2. Apsolutna odstupanja od prosjeka se utvrđuju:

3. Rezultirajuća odstupanja se množe sa frekvencijama:

4. Pronađite zbir ponderisanih odstupanja bez uzimanja u obzir predznaka:

5. Zbir ponderiranih odstupanja podijeljen je zbirom frekvencija:

Pogodno je koristiti tabelu proračunskih podataka:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Ukupno 400 - - - 81280

Prosječna linearna devijacija veličine depozita klijenata Sberbanke iznosi 203,2 rublja.

4) Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti atributa od aritmetičke sredine.

Izračun varijanse u intervalni redovi distribucija se vrši prema formuli:

Procedura za izračunavanje varijanse u ovom slučaju je sljedeća:

1. Odrediti ponderisanu aritmetičku sredinu, kao što je prikazano u stavu 2).

2. Pronađite odstupanja od prosjeka:

3. Kvadrirajte odstupanje svake opcije od prosjeka:

4. Pomnožite kvadrate odstupanja ponderima (frekvencijama):

5. Sumirajte dobijene proizvode:

6. Dobiveni iznos se podijeli sa zbirom pondera (učestalosti):

Stavimo proračune u tabelu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Ukupno 400 - - - 23040000

Raspon varijacije (ili raspon varijacije) - je razlika između maksimuma i minimalne vrijednosti znak:

U našem primjeru raspon varijacije smjenskog učinka radnika je: u prvoj brigadi R = 105-95 = 10 djece, u drugoj brigadi R = 125-75 = 50 djece. (5 puta više). Ovo sugeriše da je učinak 1. brigade „stabilniji“, ali druga brigada ima više rezervi za povećanje učinka, jer Ako svi radnici dostignu maksimalan učinak za ovu brigadu, može proizvesti 3 * 125 = 375 dijelova, au 1. brigadi samo 105 * 3 = 315 dijelova.
Ako ekstremne vrijednosti karakteristike nisu tipične za populaciju, tada se koriste kvartilni ili decilni rasponi. Kvartilni raspon RQ= Q3-Q1 pokriva 50% obima populacije, prvi decilni raspon RD1 = D9-D1 pokriva 80% podataka, drugi decilni raspon RD2= D8-D2 – 60%.
Nedostatak indikatora raspona varijacije je što njegova vrijednost ne odražava sve fluktuacije osobine.
Najjednostavniji opći indikator koji odražava sve fluktuacije neke karakteristike je prosječno linearno odstupanje, što je aritmetička sredina apsolutnih odstupanja pojedinačnih opcija od njihove prosječne vrijednosti:

,
za grupisane podatke
,
gdje je xi vrijednost atributa u diskretnom nizu ili sredina intervala u distribuciji intervala.
U gornjim formulama razlike u brojiocu se uzimaju po modulu, inače će, prema svojstvu aritmetičke sredine, brojilac uvijek biti jednak nuli. Stoga se prosječna linearna devijacija rijetko koristi u statističkoj praksi, samo u slučajevima kada zbrajanje indikatora bez uzimanja u obzir predznaka ima ekonomski smisla. Uz nju se, na primjer, analizira sastav radne snage, profitabilnost proizvodnje, spoljnotrgovinski promet.
Varijanca osobine je prosječni kvadrat odstupanja od njihove prosječne vrijednosti:
jednostavna varijansa
,
ponderisana varijansa
.
Formula za izračunavanje varijanse može se pojednostaviti:

Dakle, varijansa je jednaka razlici između prosjeka kvadrata opcije i kvadrata prosjeka opcije populacije:
.
Međutim, zbog zbrajanja kvadrata odstupanja, varijansa daje iskrivljenu predstavu o odstupanjima, pa se na osnovu nje izračunava prosjek standardna devijacija, koji pokazuje koliko u prosjeku specifične varijante osobine odstupaju od njihove prosječne vrijednosti. Izračunato preuzimanjem kvadratni korijen iz disperzije:
za negrupisane podatke
,
za varijantne serije

Kako manje vrijednosti varijansa i standardna devijacija, što je populacija homogenija, to će biti pouzdanija (tipična) prosječna vrijednost.
Prosječna linearna i standardna devijacija su imenovani brojevi, odnosno izraženi su u mjernim jedinicama neke karakteristike, identični su sadržajem i bliski po značenju.
Izračunati apsolutni pokazatelji varijacije se preporučuju korištenjem tabela.
Tabela 3 - Proračun karakteristika varijacije (na primjeru perioda podataka o smjenskom učinku radnika posade)


Broj radnika

Sredina intervala

Izračunate vrijednosti

Ukupno:

Prosječan učinak radnika u smjeni:

Prosječna linearna devijacija:

Odstupanja u proizvodnji:

Standardna devijacija outputa pojedinih radnika od prosječan učinak:
.

1 Proračun disperzije metodom momenata

Izračunavanje varijansi uključuje glomazne proračune (posebno ako je izražena prosječna vrijednost veliki broj sa više decimala). Izračuni se mogu pojednostaviti korištenjem pojednostavljene formule i svojstava disperzije.
Disperzija ima sledeća svojstva:

  1. Ako se sve vrijednosti karakteristike smanji ili poveća za istu vrijednost A, tada se disperzija neće smanjiti:

,

, zatim ili
Koristeći svojstva disperzije i prvo smanjivši sve varijante populacije za vrijednost A, a zatim podijelivši s vrijednošću intervala h, dobijamo formulu za izračunavanje disperzije u varijacionim serijama s jednakim intervalima na neki način:
,
gdje je disperzija izračunata metodom momenata;
h – vrijednost intervala varijacione serije;
– opcija novih (transformiranih) vrijednosti;
A je konstantna vrijednost, koja se koristi kao sredina intervala sa najvećom frekvencijom; ili opcija sa najvećom frekvencijom;
– kvadrat momenta prvog reda;
– trenutak drugog reda.
Izračunajmo disperziju metodom momenata na osnovu podataka o smjenskom učinku radnika tima.
Tabela 4 - Proračun varijanse metodom momenata


Grupe proizvodnih radnika, kom.

Broj radnika

Sredina intervala

Izračunate vrijednosti

Procedura obračuna:


  1. Izračunavamo varijansu:

2 Izračunavanje varijanse alternativne karakteristike

Među karakteristikama koje proučava statistika ima i onih koje imaju samo dva međusobno isključiva značenja. Ovo su alternativni znakovi. Date su im, respektivno, dvije kvantitativne vrijednosti: opcije 1 i 0. Učestalost opcije 1, koja je označena sa p, je udio jedinica koje posjeduju ovu karakteristiku. Razlika 1-r=q je frekvencija opcija 0. Dakle,


xi

Aritmetička sredina alternativnog znaka
, jer je p+q=1.

Alternativna varijansa osobina
, jer 1-r=q
Dakle, varijansa alternativne karakteristike jednaka je proizvodu udjela jedinica koje posjeduju ovu karakteristiku i udjela jedinica koje ne posjeduju ovu karakteristiku.
Ako se vrijednosti 1 i 0 javljaju podjednako često, tj. p=q, varijansa dostiže svoj maksimum pq=0,25.
Varijanca alternativnog atributa se koristi u anketama uzoraka, na primjer, kvaliteta proizvoda.

3 Varijanca između grupa. Pravilo dodavanja varijanse

Disperzija je, za razliku od drugih karakteristika varijacije, aditivna veličina. Odnosno u zbiru, koji je podijeljen u grupe prema faktorskim karakteristikama X , varijansa rezultantne karakteristike y može se razložiti na varijansu unutar svake grupe (unutar grupa) i varijansu između grupa (između grupa). Tada, uz proučavanje varijacije osobine u cijeloj populaciji u cjelini, postaje moguće proučavati varijacije u svakoj grupi, kao i između ovih grupa.

Ukupna varijansa mjeri varijaciju u osobini at u potpunosti pod uticajem svih faktora koji su izazvali ovu varijaciju (odstupanja). Jednako je srednjem kvadratnom odstupanju pojedinačnih vrijednosti atributa at od velikog prosjeka i može se izračunati kao jednostavna ili ponderisana varijansa.
Međugrupna varijansa karakterizira varijaciju rezultirajuće osobine at uzrokovane uticajem faktora-znaka X, što je činilo osnovu grupisanja. Karakterizira varijaciju grupnih prosjeka i jednak je srednjem kvadratu odstupanja grupnih prosjeka od ukupnog prosjeka:
,
gdje je aritmetička sredina i-te grupe;
– broj jedinica u i-oj grupi (učestalost i-te grupe);
– ukupan prosek stanovništva.
Varijanca unutar grupe odražava slučajnu varijaciju, odnosno onaj dio varijacije koji je uzrokovan utjecajem neuračunatih faktora i ne ovisi o faktoru-atributu koji čini osnovu grupiranja. Karakterizira varijaciju pojedinačnih vrijednosti u odnosu na grupne prosjeke i jednaka je srednjoj kvadratnoj devijaciji pojedinačnih vrijednosti atributa at unutar grupe iz aritmetičke sredine ove grupe (srednja vrijednost grupe) i izračunava se kao jednostavna ili ponderirana varijansa za svaku grupu:
ili ,
gdje je broj jedinica u grupi.
Na osnovu varijansi unutar grupe za svaku grupu, može se odrediti ukupna sredina varijansi unutar grupe:
.
Odnos između tri disperzije se naziva pravila za dodavanje varijanti, prema kojem je ukupna varijansa jednaka zbroju varijanse između grupa i prosjeka varijansi unutar grupe:

Primjer. Proučavanjem uticaja tarifne kategorije (kvalifikacije) radnika na nivo produktivnosti njihovog rada dobijeni su sljedeći podaci.
Tabela 5 – Distribucija radnika po prosječnom satu.



p/p

Radnici 4. kategorije

Radnici 5. kategorije

Izlaz
radnik, kom.,

Izlaz
radnik, kom.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

IN u ovom primjeru radnici su podijeljeni u dvije grupe prema faktorskim karakteristikama X– kvalifikacije koje karakteriše njihov rang. Rezultirajuća osobina – proizvodnja – varira i pod njenim uticajem (varijacije među grupama) i zbog drugih slučajnih faktora (varijacije unutar grupe). Cilj je izmjeriti ove varijacije korištenjem tri varijanse: ukupne, između grupa i unutar grupa. Empirijski koeficijent determinacije pokazuje udio varijacije u rezultujućoj karakteristici at pod uticajem faktorskog znaka X. Ostatak ukupne varijacije at uzrokovane promjenama drugih faktora.
U primjeru, empirijski koeficijent determinacije je:
ili 66,7%
To znači da je 66,7% varijacija u produktivnosti radnika posledica razlika u kvalifikacijama, a 33,3% je posledica uticaja drugih faktora.
Empirijska korelacija pokazuje blisku vezu između grupiranja i karakteristika performansi. Izračunato kao kvadratni korijen empirijskog koeficijenta determinacije:

Empirijski korelacijski omjer, poput , može imati vrijednosti od 0 do 1.
Ako nema veze, onda =0. U ovom slučaju =0, to jest, srednje vrijednosti grupe su jedna drugoj i nema međugrupnih varijacija. To znači da karakteristika grupisanja - faktor ne utiče na formiranje opšte varijacije.
Ako je veza funkcionalna, onda =1. U ovom slučaju, varijansa grupne sredine jednaka je ukupnoj varijansi (), odnosno nema varijacije unutar grupe. To znači da karakteristika grupisanja u potpunosti određuje varijaciju rezultirajuće karakteristike koja se proučava.
Što je vrijednost korelacijskog omjera bliža jedinici, to je bliža, bliža funkcionalnoj zavisnosti, veza između karakteristika.
Za kvalitativna procjena Chaddockovi odnosi se koriste za određivanje bliskosti veze između karakteristika.

U primjeru , što ukazuje na blisku vezu između produktivnosti radnika i njihovih kvalifikacija.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”