Izračunavanje prosjeka i varijansi. Indikatori varijacije: koncept, vrste, formule za proračun

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Raspon varijacije (ili raspon varijacije) - je razlika između maksimuma i minimalne vrijednosti znak:

U našem primjeru raspon varijacije smjenskog učinka radnika je: u prvoj brigadi R = 105-95 = 10 djece, u drugoj brigadi R = 125-75 = 50 djece. (5 puta više). Ovo sugeriše da je učinak 1. brigade „stabilniji“, ali druga brigada ima više rezervi za povećanje učinka, jer Ako svi radnici dostignu maksimalan učinak za ovu brigadu, može proizvesti 3 * 125 = 375 dijelova, au 1. brigadi samo 105 * 3 = 315 dijelova.
Ako ekstremne vrijednosti karakteristike nisu tipične za populaciju, tada se koriste kvartilni ili decilni rasponi. Kvartilni raspon RQ= Q3-Q1 pokriva 50% obima populacije, prvi decilni raspon RD1 = D9-D1 pokriva 80% podataka, drugi decilni raspon RD2= D8-D2 – 60%.
Nedostatak indikatora raspona varijacije je što njegova vrijednost ne odražava sve fluktuacije osobine.
Najjednostavniji opći indikator koji odražava sve fluktuacije neke karakteristike je prosječno linearno odstupanje, što je aritmetička sredina apsolutnih odstupanja pojedinačnih opcija od njihove prosječne vrijednosti:

,
za grupisane podatke
,
gdje je xi vrijednost karakteristike u diskretne serije ili sredina intervala u intervalnoj distribuciji.
U gornjim formulama razlike u brojiocu se uzimaju po modulu, inače će, prema svojstvu aritmetičke sredine, brojilac uvijek biti jednak nuli. Stoga se prosječna linearna devijacija rijetko koristi u statističkoj praksi, samo u slučajevima kada zbrajanje indikatora bez uzimanja u obzir predznaka ima ekonomski smisla. Uz nju se, na primjer, analizira sastav radne snage, profitabilnost proizvodnje, spoljnotrgovinski promet.
Varijanca osobine je prosječni kvadrat odstupanja od njihove prosječne vrijednosti:
jednostavna varijansa
,
ponderisana varijansa
.
Formula za izračunavanje varijanse može se pojednostaviti:

Dakle, varijansa je jednaka razlici između prosjeka kvadrata opcije i kvadrata prosjeka opcije populacije:
.
Međutim, zbog zbrajanja kvadrata odstupanja, varijansa daje iskrivljenu predstavu o odstupanjima, pa se na osnovu nje izračunava prosjek standardna devijacija , koji pokazuje koliko u prosjeku specifične varijante osobine odstupaju od njihove prosječne vrijednosti. Izračunato uzimanjem kvadratnog korijena varijanse:
za negrupisane podatke
,
za varijantne serije

Kako manje vrijednosti varijansa i standardna devijacija, što je populacija homogenija, to će biti pouzdanija (tipična) prosječna vrijednost.
Prosječna linearna i standardna devijacija su imenovani brojevi, odnosno izraženi su u mjernim jedinicama neke karakteristike, identični su sadržajem i bliski po značenju.
Izračunati apsolutni pokazatelji varijacije se preporučuju korištenjem tabela.
Tabela 3 - Proračun karakteristika varijacije (na primjeru perioda podataka o smjenskom učinku radnika posade)


Broj radnika

Sredina intervala

Izračunate vrijednosti

Ukupno:

Prosječan učinak radnika u smjeni:

Prosječna linearna devijacija:

Odstupanja u proizvodnji:

Standardna devijacija outputa pojedinih radnika od prosječan učinak:
.

1 Proračun disperzije metodom momenata

Izračunavanje varijansi uključuje glomazne proračune (posebno ako je izražena prosječna vrijednost veliki broj sa više decimala). Izračuni se mogu pojednostaviti korištenjem pojednostavljene formule i svojstava disperzije.
Disperzija ima sledeća svojstva:

  1. Ako se sve vrijednosti karakteristike smanji ili poveća za istu vrijednost A, tada se disperzija neće smanjiti:

,

, zatim ili
Koristeći svojstva disperzije i prvo smanjivši sve varijante populacije za vrijednost A, a zatim podijelivši vrijednost intervala h, dobijamo formulu za izračunavanje disperzije u varijantne serije With u jednakim intervalima na neki način:
,
gdje je disperzija izračunata metodom momenata;
h – vrijednost intervala varijacione serije;
– opcija novih (transformiranih) vrijednosti;
A je konstantna vrijednost, koja se koristi kao sredina intervala sa najvećom frekvencijom; ili opcija sa najvećom frekvencijom;
– kvadrat momenta prvog reda;
– trenutak drugog reda.
Izračunajmo disperziju metodom momenata na osnovu podataka o smjenskom učinku radnika tima.
Tabela 4 - Proračun varijanse metodom momenata


Grupe proizvodnih radnika, kom.

Broj radnika

Sredina intervala

Izračunate vrijednosti

Procedura obračuna:


  1. Izračunavamo varijansu:

2 Izračunavanje varijanse alternativne karakteristike

Među karakteristikama koje proučava statistika ima i onih koje imaju samo dva međusobno isključiva značenja. Ovo su alternativni znakovi. Date su im, respektivno, dvije kvantitativne vrijednosti: opcije 1 i 0. Učestalost opcije 1, koja je označena sa p, je udio jedinica koje posjeduju ovu karakteristiku. Razlika 1-r=q je frekvencija opcija 0. Dakle,


xi

Aritmetička sredina alternativnog znaka
, jer je p+q=1.

Alternativna varijansa osobina
, jer 1-r=q
Dakle, varijansa alternativne karakteristike jednaka je proizvodu udjela jedinica koje posjeduju ovu karakteristiku i udjela jedinica koje ne posjeduju ovu karakteristiku.
Ako se vrijednosti 1 i 0 javljaju podjednako često, tj. p=q, varijansa dostiže svoj maksimum pq=0,25.
Varijanca alternativnog atributa se koristi u anketama uzoraka, na primjer, kvaliteta proizvoda.

3 Varijanca između grupa. Pravilo dodavanja varijanse

Disperzija je, za razliku od drugih karakteristika varijacije, aditivna veličina. Odnosno u zbiru, koji je podijeljen u grupe prema faktorskim karakteristikama X , varijansa rezultantne karakteristike y može se razložiti na varijansu unutar svake grupe (unutar grupa) i varijansu između grupa (između grupa). Tada, uz proučavanje varijacije osobine u cijeloj populaciji u cjelini, postaje moguće proučavati varijacije u svakoj grupi, kao i između ovih grupa.

Ukupna varijansa mjeri varijaciju u osobini at u potpunosti pod uticajem svih faktora koji su izazvali ovu varijaciju (odstupanja). Jednako je srednjem kvadratnom odstupanju pojedinačnih vrijednosti atributa at od velikog prosjeka i može se izračunati kao jednostavna ili ponderisana varijansa.
Međugrupna varijansa karakterizira varijaciju rezultirajuće osobine at uzrokovane uticajem faktora-znaka X, što je činilo osnovu grupisanja. Karakterizira varijaciju grupnih prosjeka i jednak je srednjem kvadratu odstupanja grupnih prosjeka od ukupnog prosjeka:
,
gdje je aritmetička sredina i-te grupe;
– broj jedinica u i-oj grupi (učestalost i-te grupe);
– ukupan prosek stanovništva.
Varijanca unutar grupe odražava slučajnu varijaciju, odnosno onaj dio varijacije koji je uzrokovan utjecajem neuračunatih faktora i ne ovisi o faktoru-atributu koji čini osnovu grupiranja. Karakterizira varijaciju pojedinačnih vrijednosti u odnosu na grupne prosjeke i jednaka je srednjoj kvadratnoj devijaciji pojedinačnih vrijednosti atributa at unutar grupe iz aritmetičke sredine ove grupe (srednja vrijednost grupe) i izračunava se kao jednostavna ili ponderirana varijansa za svaku grupu:
ili ,
gdje je broj jedinica u grupi.
Na osnovu varijansi unutar grupe za svaku grupu, može se odrediti ukupna sredina varijansi unutar grupe:
.
Odnos između tri disperzije se naziva pravila za dodavanje varijanti, Pri čemu totalna varijansa jednak zbroju varijanse između grupa i prosjeka varijansi unutar grupe:

Primjer. Proučavanjem uticaja tarifne kategorije (kvalifikacije) radnika na nivo produktivnosti njihovog rada dobijeni su sljedeći podaci.
Tabela 5 – Distribucija radnika po prosječnom satu.



p/p

Radnici 4. kategorije

Radnici 5. kategorije

Izlaz
radnik, kom.,

Izlaz
radnik, kom.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

IN u ovom primjeru radnici su podijeljeni u dvije grupe prema faktorskim karakteristikama X– kvalifikacije koje karakteriše njihov rang. Rezultirajuća osobina – proizvodnja – varira i pod njenim uticajem (varijacije među grupama) i zbog drugih slučajnih faktora (varijacije unutar grupe). Cilj je izmjeriti ove varijacije korištenjem tri varijanse: ukupne, između grupa i unutar grupa. Empirijski koeficijent determinacije pokazuje udio varijacije u rezultujućoj karakteristici at pod uticajem faktorskog znaka X. Ostatak ukupne varijacije at uzrokovane promjenama drugih faktora.
U primjeru, empirijski koeficijent determinacije je:
ili 66,7%
To znači da je 66,7% varijacija u produktivnosti radnika posledica razlika u kvalifikacijama, a 33,3% je posledica uticaja drugih faktora.
Empirijska korelacija pokazuje blisku vezu između grupiranja i karakteristika performansi. Izračunato kao kvadratni korijen empirijskog koeficijenta determinacije:

Empirijski korelacijski omjer, poput , može imati vrijednosti od 0 do 1.
Ako nema veze, onda =0. U ovom slučaju =0, to jest, srednje vrijednosti grupe su jedna drugoj i nema međugrupnih varijacija. To znači da karakteristika grupisanja - faktor ne utiče na formiranje opšte varijacije.
Ako je veza funkcionalna, onda =1. U ovom slučaju, varijansa grupne sredine jednaka je ukupnoj varijansi (), odnosno nema varijacije unutar grupe. To znači da karakteristika grupisanja u potpunosti određuje varijaciju rezultirajuće karakteristike koja se proučava.
Što je vrijednost korelacijskog omjera bliža jedinici, to je bliža, bliža funkcionalnoj zavisnosti, veza između karakteristika.
Za kvalitativna procjena Chaddockovi odnosi se koriste za određivanje bliskosti veze između karakteristika.

U primjeru , što ukazuje na blisku vezu između produktivnosti radnika i njihovih kvalifikacija.

Među brojnim indikatorima koji se koriste u statistici, potrebno je izdvojiti obračun varijanse. Treba napomenuti da je ručno izvođenje ovog proračuna prilično zamoran zadatak. Srećom, Excel ima funkcije koje vam omogućavaju automatizaciju postupka izračunavanja. Hajde da saznamo algoritam za rad sa ovim alatima.

Disperzija je indikator varijacije, što je prosječni kvadrat odstupanja od matematičko očekivanje. Dakle, izražava širenje brojeva oko prosječne vrijednosti. Izračunavanje varijanse može se izvršiti i za opštu populaciju i za uzorak.

Metoda 1: izračunavanje na osnovu populacije

Za obračun ovaj indikator u Excelu, funkcija se koristi za populaciju DISP.G. Sintaksa ovog izraza je sljedeća:

DISP.G(Broj1;Broj2;…)

Ukupno se može koristiti od 1 do 255 argumenata. Argumenti mogu biti sljedeći: numeričke vrijednosti, kao i reference na ćelije u kojima se nalaze.

Pogledajmo kako izračunati ovu vrijednost za raspon sa numeričkim podacima.


Metoda 2: proračun po uzorku

Za razliku od izračunavanja vrijednosti zasnovane na populaciji, pri izračunavanju uzorka nazivnik ne označava ukupno brojeva, ali jedan manje. Ovo se radi u svrhu ispravljanja grešaka. Excel uzima u obzir ovu nijansu posebna funkcija, koji je namijenjen za ovu vrstu proračuna - DISP.V. Njegova sintaksa je predstavljena sljedećom formulom:

DISP.B(Broj1;Broj2;…)

Broj argumenata, kao iu prethodnoj funkciji, također može biti u rasponu od 1 do 255.


Kao što vidite, Excel program može uvelike olakšati izračunavanje varijanse. Ova statistika može biti izračunata aplikacijom, bilo iz populacije ili iz uzorka. U ovom slučaju, sve radnje korisnika zapravo se svode samo na navođenje raspona obrađenih brojeva, i to glavnog Excel rad radi sam. Naravno, ovo će uštedjeti značajnu količinu vremena korisnika.

Međutim, sama ova karakteristika nije dovoljna za proučavanje slučajne varijable. Zamislimo dva strijelca koji pucaju u metu. Jedan precizno šutira i pogađa blizu centra, dok se drugi... samo zabavlja i ne cilja. Ali ono što je smiješno je da on prosjek rezultat će biti potpuno isti kao kod prvog strijelca! Ova situacija je konvencionalno ilustrovana sledećim slučajnim varijablama:

Matematičko očekivanje „snajpera” jednako je, međutim, „ zanimljiva ličnost": – takođe je nula!

Stoga, postoji potreba da se kvantifikuje koliko daleko rasuti metke (vrijednosti slučajne varijable) u odnosu na centar mete (matematičko očekivanje). dobro i rasipanje prevedeno sa latinskog nije drugačije nego disperzija .

Da vidimo kako se to utvrđuje numerička karakteristika koristeći jedan od primjera iz 1. dijela lekcije:

Tamo smo pronašli razočaravajuće matematičko očekivanje ove igre, a sada moramo izračunati njenu varijansu, koja označeno sa kroz .

Hajde da saznamo koliko su pobede/gubici „razbacani“ u odnosu na prosečnu vrednost. Očigledno, za ovo moramo izračunati razlike između vrijednosti slučajne varijable i ona matematičko očekivanje:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Sada se čini da morate sumirati rezultate, ali ovaj način nije prikladan - iz razloga što će fluktuacije lijevo poništiti jedna drugu s fluktuacijama udesno. Tako, na primjer, "amaterski" strijelac (primjer iznad) razlike će biti , a kada se dodaju dat će nulu, tako da nećemo dobiti nikakvu procjenu disperzije njegovog gađanja.

Da biste zaobišli ovaj problem, možete razmotriti moduli razlike, ali iz tehničkih razloga pristup se ukorijenio kada se kvadriraju. Pogodnije je formulirati rješenje u tabeli:

I ovdje počinje računati prosjećna težina vrijednost kvadrata odstupanja. Šta je? Njihova je očekivanu vrijednost, što je mjera raspršenja:

definicija varijanse. Iz definicije je to odmah jasno varijansa ne može biti negativna– obratite pažnju na vežbu!

Prisjetimo se kako pronaći očekivanu vrijednost. Pomnožite kvadratne razlike sa odgovarajućim vjerovatnoćama (nastavak tabele):
– figurativno rečeno, ovo je „vlačna sila“,
i sumirajte rezultate:

Ne mislite li da je u odnosu na dobitke rezultat ispao prevelik? Tako je – stavili smo ga na kvadrat, a da bismo se vratili na dimenziju naše igre, moramo izdvojiti Kvadratni korijen. Ova količina se zove standardna devijacija i označava se grčkim slovom "sigma":

Ova vrijednost se ponekad naziva standardna devijacija .

Šta je njegovo značenje? Ako odstupimo od matematičkog očekivanja lijevo i desno za standardnu ​​devijaciju:

– tada će najvjerovatnije vrijednosti slučajne varijable biti „koncentrirane“ na ovom intervalu. Ono što zapravo opažamo:

Međutim, dešava se da se pri analizi raspršenja gotovo uvijek operira konceptom disperzije. Hajde da shvatimo šta to znači u odnosu na igre. Ako u slučaju strelica govorimo o "preciznosti" pogodaka u odnosu na centar mete, onda disperzija karakterizira dvije stvari:

Prvo, očigledno je da kako se opklade povećavaju, tako se povećava i disperzija. Tako, na primjer, ako povećamo za 10 puta, onda će se matematičko očekivanje povećati za 10 puta, a varijansa će se povećati za 100 puta (pošto je ovo kvadratna veličina). Ali imajte na umu da se sama pravila igre nisu promijenila! Samo su se stope promijenile, grubo govoreći, prije smo se kladili na 10 rubalja, sada je 100.

Drugo, više zanimljiva poenta je da varijanta karakteriše stil igre. Zabilježimo mentalno gaming opklade na nekom određenom nivou, i da vidimo šta je šta:

Igra niske varijance je oprezna igra. Igrač ima tendenciju da bira najpouzdanije šeme, gde ne gubi/dobija previše u jednom trenutku. Na primjer, crveno/crni sistem u ruletu (vidi primjer 4 članka Slučajne varijable) .

Igra velike varijance. Često je zovu disperzivno igra. Ovo je avanturistički ili agresivni stil igre, gdje igrač bira „adrenalinske“ šeme. Da se barem setimo "Martingale", u kojoj su iznosi u igri redovi veličine veći od „tihe“ igre iz prethodne tačke.

Situacija u pokeru je indikativna: postoje tzv čvrsto igrače koji imaju tendenciju da budu oprezni i "drhtavi" u pogledu svojih sredstava za igre (bankroll). Nije iznenađujuće da njihov bankroll ne fluktuira značajno (niska varijansa). Naprotiv, ako igrač ima veliku varijansu, onda je on agresor. Često rizikuje velike opklade i može ili probiti ogromnu banku ili se izgubiti u paramparčad.

Ista stvar se dešava i na Forexu, i tako dalje - ima dosta primera.

Štaviše, u svim slučajevima nije bitno da li se igra za penije ili hiljade dolara. Svaki nivo ima svoje igrače niske i visoke disperzije. Pa, kao što se sjećamo, prosječan dobitak je “odgovoran” očekivanu vrijednost.

Vjerovatno ste primijetili da je pronalaženje varijanse dug i mukotrpan proces. Ali matematika je velikodušna:

Formula za pronalaženje varijanse

Ova formula je izvedena direktno iz definicije varijanse i mi je odmah stavljamo u upotrebu. Kopirat ću znak s našom igrom iznad:

i pronađeno matematičko očekivanje.

Izračunajmo varijansu na drugi način. Prvo, pronađimo matematičko očekivanje - kvadrat slučajne varijable. By određivanje matematičkog očekivanja:

U ovom slučaju:

Dakle, prema formuli:

Kako kažu, osjetite razliku. A u praksi je, naravno, bolje koristiti formulu (osim ako uvjet ne zahtijeva drugačije).

Savladavamo tehniku ​​rešavanja i projektovanja:

Primjer 6

Pronađite njegovo matematičko očekivanje, varijansu i standardnu ​​devijaciju.

Ovaj zadatak se nalazi svuda i, po pravilu, nema smislenog značenja.
Možete zamisliti nekoliko sijalica sa brojevima koje svijetle u ludnici sa određenim vjerovatnoćama :)

Rješenje: Pogodno je sumirati osnovne proračune u tabeli. Prvo upisujemo početne podatke u gornja dva reda. Zatim izračunavamo proizvode, zatim i na kraju zbrojeve u desnoj koloni:

Zapravo, skoro sve je spremno. Treći red prikazuje gotova matematička očekivanja: .

Izračunavamo varijansu koristeći formulu:

I na kraju, standardna devijacija:
– Lično, obično zaokružujem na 2 decimale.

Svi proračuni se mogu izvršiti na kalkulatoru, ili još bolje - u Excelu:

Ovde je teško pogrešiti :)

Odgovori:

Oni koji žele mogu još više pojednostaviti svoj život i iskoristiti moj kalkulator (demo), koji ne samo da će trenutno riješiti ovaj problem, već i izgraditi tematske grafike (stići ćemo uskoro). Program može biti preuzeti iz biblioteke– ako ste preuzeli barem jedan edukativni materijal, ili dobiti drugi način. Hvala na podršci projektu!

Nekoliko zadataka koje morate riješiti sami:

Primjer 7

Izračunajte varijansu slučajne varijable u prethodnom primjeru po definiciji.

I sličan primjer:

Primjer 8

Diskretna slučajna varijabla je određena svojim zakonom distribucije:

Da, vrijednosti slučajne varijable mogu biti prilično velike (primjer iz pravi posao) , a ovdje, ako je moguće, koristite Excel. Kao, usput, u primjeru 7 - brže je, pouzdanije i ugodnije.

Rješenja i odgovori na dnu stranice.

Da zaključimo 2. dio lekcije, osvrnut ćemo se na još jedan tipičan problem, čak bi se moglo reći i malu zagonetku:

Primjer 9

Diskretna slučajna varijabla može imati samo dvije vrijednosti: i , i . Vjerovatnoća, matematičko očekivanje i varijansa su poznati.

Rješenje: Počnimo s nepoznatom vjerovatnoćom. Budući da slučajna varijabla može uzeti samo dvije vrijednosti, zbir vjerovatnoća odgovarajućih događaja je:

i od tada .

Ostaje samo da se pronađe..., lako je reći :) Ali dobro, idemo. Po definiciji matematičkog očekivanja:
– zamjena poznatih količina:

– i ništa se više ne može istisnuti iz ove jednadžbe, osim što je možete prepisati u uobičajenom smjeru:

ili:

O dalje radnje, mislim da možete pogoditi. Sastavimo i riješimo sistem:

Decimale- ovo je, naravno, potpuna sramota; pomnožite obje jednačine sa 10:

i podijeli sa 2:

To je bolje. Iz 1. jednačine izražavamo:
(ovo je lakši nacin)– zamijeniti u 2. jednačinu:


Mi gradimo na kvadrat i napravi pojednostavljenja:

pomnoži sa:

Rezultat je bio kvadratna jednačina, nalazimo njegov diskriminant:
- Super!

i dobijamo dva rješenja:

1) ako , To ;

2) ako , To .

Uslov je zadovoljen prvim parom vrijednosti. WITH velika vjerovatnoća sve je tačno, ali, ipak, zapišimo zakon raspodjele:

i izvršite provjeru, odnosno pronađite očekivanje:

Glavni generalizirajući indikatori varijacije u statistici su disperzije i standardne devijacije.

Disperzija ovo aritmetička sredina kvadratna odstupanja svake karakteristične vrijednosti od ukupnog prosjeka. Varijanca se obično naziva srednjim kvadratom odstupanja i označava se sa  2. Ovisno o izvornim podacima, varijansa se može izračunati korištenjem jednostavne ili ponderirane aritmetičke sredine:

 neponderisana (jednostavna) varijansa;

 ponderisana varijansa.

Standardna devijacija ovo je generalizirajuća karakteristika apsolutnih veličina varijacije znakova u zbiru. Izražava se u istim mjernim jedinicama kao i atribut (u metrima, tonama, procentima, hektarima, itd.).

Standardna devijacija je kvadratni korijen varijanse i označava se sa :

 standardna devijacija neponderisana;

 ponderisana standardna devijacija.

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, to bolje aritmetička sredina odražava cjelokupnu zastupljenu populaciju.

Izračunavanju standardne devijacije prethodi izračunavanje varijanse.

Procedura za izračunavanje ponderisane varijanse je kako slijedi:

1) odrediti ponderisanu aritmetičku sredinu:

2) izračunajte odstupanja opcija od prosjeka:

3) kvadrat odstupanja svake opcije od prosjeka:

4) pomnožiti kvadrate odstupanja sa težinama (frekvencijama):

5) sumirajte rezultirajuće proizvode:

6) dobijeni iznos se podijeli sa zbirom pondera:

Primjer 2.1

Izračunajmo ponderisanu aritmetičku sredinu:

Vrijednosti odstupanja od srednje vrijednosti i njihovi kvadrati prikazani su u tabeli. Definirajmo varijansu:

Standardna devijacija će biti jednaka:

Ako su izvorni podaci prikazani u obliku intervala distribucijske serije , tada prvo trebate odrediti diskretnu vrijednost atributa, a zatim primijeniti opisanu metodu.

Primjer 2.2

Pokažimo proračun varijanse za intervalnu seriju koristeći podatke o raspodjeli zasijane površine kolektivne farme prema prinosu pšenice.

Aritmetička sredina je:

Izračunajmo varijansu:

6.3. Izračunavanje varijanse pomoću formule zasnovane na pojedinačnim podacima

Tehnika proračuna varijanse komplikovano, ali velike vrijednosti opcije i frekvencije mogu biti neodoljive. Proračuni se mogu pojednostaviti korištenjem svojstava disperzije.

Disperzija ima sljedeća svojstva.

1. Smanjenje ili povećanje težine (učestalosti) promjenjive karakteristike za određeni broj puta ne mijenja disperziju.

2. Smanjite ili povećajte svaku vrijednost karakteristike za isti konstantni iznos A ne mijenja disperziju.

3. Smanjite ili povećajte svaku vrijednost karakteristike za određeni broj puta k odnosno smanjuje ili povećava varijansu u k 2 puta standardna devijacija  u k jednom.

4. Disperzija karakteristike u odnosu na proizvoljnu vrijednost je uvijek veća od disperzije u odnosu na aritmetičku sredinu po kvadratu razlike između prosječne i proizvoljne vrijednosti:

Ako A 0, tada dolazimo do sljedeće jednakosti:

odnosno varijansa karakteristike jednaka je razlici između srednjeg kvadrata karakterističnih vrijednosti i kvadrata srednje vrijednosti.

Svako svojstvo se može koristiti samostalno ili u kombinaciji s drugim prilikom izračunavanja varijanse.

Procedura za izračunavanje varijanse je jednostavna:

1) odrediti aritmetička sredina :

2) kvadrat aritmetičke sredine:

3) kvadrat odstupanja svake varijante serije:

X i 2 .

4) pronađite zbir kvadrata opcija:

5) podijeliti zbir kvadrata opcija sa njihovim brojem, odnosno odrediti prosječni kvadrat:

6) odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrednosti:

Primjer 3.1 Dostupni su sljedeći podaci o produktivnosti radnika:

Napravimo sljedeće proračune:

Disperzija u statistici nalazi se kao pojedinačne vrijednosti karakteristike na kvadrat iz . Ovisno o početnim podacima, određuje se korištenjem jednostavnih i ponderiranih formula varijanse:

1. (za negrupirane podatke) se izračunava pomoću formule:

2. Ponderirana varijansa (za serije varijacija):

gdje je n frekvencija (ponovljivost faktora X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge probleme za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata dostupni su sljedeći podaci. Treba izgraditi intervalne serije raspodjela karakteristike, izračunati prosječnu vrijednost karakteristike i proučiti njenu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala koristeći formulu:

gdje je X max maksimalna vrijednost karakteristike grupisanja;
X min – minimalna vrijednost karakteristike grupisanja;
n – broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Kreirajmo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 – 165,6 = 162,3)

Određujemo prosječnu visinu učenika koristeći ponderiranu formulu aritmetičkog prosjeka:

Odredimo varijansu koristeći formulu:

Formula disperzije se može transformirati na sljedeći način:

Iz ove formule slijedi da varijansa je jednaka razlika između prosjeka kvadrata opcija i kvadrata i prosjeka.

Disperzija u varijantnim serijama sa jednakim intervalima pomoću metode momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Određivanje varijanse, izračunato metodom momenata, koristeći sljedeću formulu je manje naporno:

gdje je i vrijednost intervala;
A je konvencionalna nula, za koju je prikladno koristiti sredinu intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji karakteristika mijenja na takav način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati pomoću formule:

Zamjenom q = 1- p u ovu formulu disperzije dobijamo:

Vrste varijanse

Ukupna varijansa mjeri varijaciju neke karakteristike u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja pojedinačnih vrednosti karakteristike x od ukupne srednje vrednosti x i može se definisati kao jednostavna varijansa ili ponderisana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije koji je posljedica uticaja neuračunatih faktora i ne zavisi od faktora-atributa koji čini osnovu grupe. Takva disperzija jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar grupe X od aritmetičke sredine grupe i može se izračunati kao jednostavna disperzija ili kao ponderirana disperzija.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u problemu proučavanja utjecaja kvalifikacija radnika na nivo produktivnosti rada u radionici pokazuju varijacije u outputu u svakoj grupi uzrokovane svim mogućim faktorima ( tehničko stanje opreme, dostupnosti alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava nasumičan, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se pomoću formule:

Karakterizira sistematsku varijaciju rezultirajuće karakteristike, koja je posljedica utjecaja faktora-znaka koji čini osnovu grupe. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava pomoću formule:

Pravilo za dodavanje varijanse u statistiku

Prema pravilo dodavanja varijansi ukupna varijansa je jednaka zbroju prosjeka varijansi unutar grupe i između grupa:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za dodavanje varijansi, možete odrediti po dva poznate disperzije treći je nepoznat, a takođe sudi o jačini uticaja karakteristike grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti konstantni iznos, tada se disperzija neće promijeniti.
2. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”