Varijanca vremenske serije se izračunava pomoću formule. Apsolutne varijacije

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Hajde da izračunamoGOSPOĐAEXCELvarijansa i standardna devijacija uzorci. Također ćemo izračunati varijansu slučajne varijable ako je poznata njena distribucija.

Hajde da prvo razmotrimo disperzija, onda standardna devijacija.

Varijanca uzorka

Varijanca uzorka (varijansa uzorka,uzorakvarijansa) karakterizira širenje vrijednosti u nizu u odnosu na .

Sve 3 formule su matematički ekvivalentne.

Iz prve formule jasno je da varijansa uzorka je zbir kvadrata odstupanja svake vrijednosti u nizu od prosjeka, podijeljeno s veličinom uzorka minus 1.

varijanse uzorci koristi se funkcija DISP(), engleski. naziv VAR, tj. VARiance. Od verzije MS EXCEL 2010, preporučljivo je koristiti njegov analogni DISP.V(), engleski. naziv VARS, tj. Uzorak VARiance. Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija DISP.G(), engleski. naziv VARP, tj. Varijanca stanovništva, koja se izračunava disperzija Za stanovništva. Cela razlika se svodi na imenilac: umesto n-1 kao DISP.V(), DISP.G() ima samo n u nazivniku. Prije MS EXCEL 2010, funkcija VAR() se koristila za izračunavanje varijanse populacije.

Varijanca uzorka
=QUADROTCL(uzorak)/(COUNT(uzorak)-1)
=(SUM(Uzorak)-BROJ(Uzorak)*PROSEK(Uzorak)^2)/ (BROJ(Uzorak)-1)– uobičajena formula
=SUM((Uzorak -PROSEK(Uzorak))^2)/ (BROJ(Uzorak)-1) –

Varijanca uzorka je jednako 0, samo ako su sve vrijednosti jednake jedna drugoj i, shodno tome, jednake prosječna vrijednost. Obično je veća vrijednost varijanse, veća je širina vrijednosti u nizu.

Varijanca uzorka je tačka procene varijanse distribucija slučajne varijable od koje je napravljen uzorak. O gradnji intervali poverenja prilikom procene varijanse može se pročitati u članku.

Varijanca slučajne varijable

Da izračunam disperzija slučajna varijabla, morate je znati.

Za varijanse slučajna varijabla X se često označava kao Var(X). Disperzija jednako kvadratu odstupanja od srednje vrijednosti E(X): Var(X)=E[(X-E(X)) 2 ]

disperzija izračunato po formuli:

gdje je x i vrijednost koju slučajna varijabla može uzeti, a μ je prosječna vrijednost (), p(x) je vjerovatnoća da će slučajna varijabla uzeti vrijednost x.

Ako slučajna varijabla ima , onda disperzija izračunato po formuli:

Dimenzija varijanse odgovara kvadratu mjerne jedinice početne vrijednosti. Na primjer, ako vrijednosti u uzorku predstavljaju mjerenje težine dijela (u kg), tada bi dimenzija varijanse bila kg 2 . Ovo može biti teško protumačiti, pa okarakterisati širenje vrijednosti, vrijednost jednaka kvadratni korijen od varijansestandardna devijacija.

Neke nekretnine varijanse:

Var(X+a)=Var(X), gdje je X slučajna varijabla, a a konstanta.

Var(aH)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ovo svojstvo disperzije se koristi u članak o linearnoj regresiji.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), gdje su X i Y - slučajne varijable, Cov(H;Y) - kovarijansa ovih slučajnih varijabli.

Ako su slučajne varijable nezavisne, onda one kovarijansa je jednako 0, i stoga Var(X+Y)=Var(X)+Var(Y). Ovo svojstvo disperzije se koristi u izvođenju.

Pokažimo da je za nezavisne veličine Var(X-Y)=Var(X+Y). Zaista, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ovo svojstvo disperzije se koristi za konstruiranje .

Standardna devijacija uzorka

Standardna devijacija uzorka je mjera koliko su široko rasute vrijednosti u uzorku u odnosu na njihov .

A-priorat, standardna devijacija jednako kvadratnom korijenu varijanse:

Standardna devijacija ne uzima u obzir veličinu vrijednosti u uzorak, već samo stepen disperzije vrijednosti oko njih prosjek. Da bismo to ilustrirali, dajmo primjer.

Izračunajmo standardnu ​​devijaciju za 2 uzorka: (1; 5; 9) i (1001; 1005; 1009). U oba slučaja s=4. Očigledno je da se omjer standardne devijacije i vrijednosti niza značajno razlikuje između uzoraka. U takvim slučajevima se koristi Koeficijent varijacije(Koeficijent varijacije, CV) - odnos Standardna devijacija do prosjeka aritmetika, izraženo u procentima.

U MS EXCEL 2007 i ranijim verzijama za proračun Standardna devijacija uzorka koristi se funkcija =STDEVAL(), engleski. naziv STDEV, tj. Standardna devijacija. Od verzije MS EXCEL 2010, preporučljivo je koristiti njegov analogni =STANDDEV.B() , engleski. naziv STDEV.S, tj. Standardna devijacija uzorka.

Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija STANDARDEV.G(), engleski. naziv STDEV.P, tj. Standardna devijacija stanovništva, koja se izračunava standardna devijacija Za stanovništva. Cela razlika se svodi na imenilac: umesto n-1 kao u STANDARDEV.V(), STANDARDEVAL.G() ima samo n u nazivniku.

Standardna devijacija također se može izračunati direktno koristeći formule u nastavku (pogledajte primjer fajla)
=ROOT(QUADROTCL(Uzorak)/(BROJ(Uzorak)-1))
=ROOT((SUM(Uzorak)-BROJ(Uzorak)*PROSEK(Uzorak)^2)/(BROJ(Uzorak)-1))

Druge mjere raspršenosti

Funkcija SQUADROTCL() izračunava sa zbir kvadrata odstupanja vrijednosti od njihovih prosjek. Ova funkcija će vratiti isti rezultat kao formula =DISP.G( Uzorak)*PROVJERI( Uzorak) , Gdje Uzorak- referenca na raspon koji sadrži niz vrijednosti uzorka (). Izračuni u funkciji QUADROCL() vrše se prema formuli:

Funkcija SROTCL() je također mjera širenja skupa podataka. Funkcija SROTCL() izračunava prosjek apsolutnih vrijednosti odstupanja vrijednosti od prosjek. Ova funkcija će vratiti isti rezultat kao formula =SUMPRODUCT(ABS(Uzorak-PROSEK(Uzorak)))/BROJ(Uzorak), Gdje Uzorak- veza do raspona koji sadrži niz vrijednosti uzorka.

Izračuni u funkciji SROTCL () vrše se prema formuli:

Ako se populacija podijeli u grupe prema osobini koja se proučava, onda se za ovu populaciju može izračunati sledeće vrste varijanse: ukupno, grupa (unutar grupe), prosek grupe (prosek unutar grupe), međugrupa.

U početku se izračunava koeficijent determinacije, koji pokazuje koji dio ukupne varijacije osobine koja se proučava je međugrupna varijacija, tj. zbog karakteristika grupisanja:

Empirijski korelacioni odnos karakteriše bliskost veze između grupisanja (faktorskih) i karakteristika performansi.

Empirijski omjer korelacije može imati vrijednosti od 0 do 1.

Da biste procijenili bliskost veze na osnovu empirijske korelacije, možete koristiti Chaddockove relacije:

Primjer 4. Dostupni su sljedeći podaci o izvođenju radova projektantskih i geodetskih organizacija različitih oblika imovina:

definirati:

1) totalna varijansa;

2) grupne varijanse;

3) prosek grupnih varijansi;

4) međugrupna varijansa;

5) ukupna varijansa na osnovu pravila za sabiranje varijansi;


6) koeficijent determinacije i empirijski odnos korelacije.

Izvucite zaključke.

Rješenje:

1. Odredimo prosečan obim posla koji obavljaju preduzeća dva oblika svojine:

Izračunajmo ukupnu varijansu:

2. Odredite grupne prosjeke:

miliona rubalja;

miliona rubalja

Grupne varijance:

;

3. Izračunajte prosjek grupnih varijansi:

4. Odredimo međugrupnu varijansu:

5. Izračunajte ukupnu varijansu na osnovu pravila za dodavanje varijansi:

6. Odredimo koeficijent determinacije:

.

Dakle, obim poslova koje obavljaju projektantsko-istraživačke organizacije za 22% zavisi od oblika vlasništva preduzeća.

Empirijski korelacijski omjer se izračunava pomoću formule

.

Vrijednost izračunatog indikatora ukazuje da je zavisnost obima posla od oblika vlasništva preduzeća mala.

Primjer 5. Kao rezultat istraživanja tehnološke discipline proizvodnih područja, dobijeni su sljedeći podaci:

Odredite koeficijent determinacije

Među brojnim pokazateljima koji se koriste u statistici, potrebno je izdvojiti obračun varijanse. Treba napomenuti da je ručno izvođenje ovog proračuna prilično zamoran zadatak. Srećom, Excel ima funkcije koje vam omogućavaju automatizaciju postupka izračunavanja. Hajde da saznamo algoritam za rad sa ovim alatima.

Disperzija je indikator varijacije, što je prosječni kvadrat odstupanja od matematičkog očekivanja. Dakle, izražava širenje brojeva oko srednje vrijednosti. Izračunavanje varijanse može se izvršiti i za opštu populaciju i za uzorak.

Metoda 1: izračunavanje na osnovu populacije

Za kalkulaciju ovaj indikator u Excelu, funkcija se koristi za populaciju DISP.G. Sintaksa ovog izraza je sljedeća:

DISP.G(Broj1;Broj2;…)

Može se koristiti ukupno od 1 do 255 argumenata. Argumenti mogu biti sljedeći: numeričke vrijednosti, kao i reference na ćelije u kojima se nalaze.

Pogledajmo kako izračunati ovu vrijednost za raspon sa numeričkim podacima.


Metoda 2: proračun po uzorku

Za razliku od izračunavanja vrijednosti zasnovane na populaciji, pri izračunavanju uzorka nazivnik ne označava ukupno brojeva, ali jedan manje. Ovo se radi u svrhu ispravljanja grešaka. Excel uzima u obzir ovu nijansu posebna funkcija, koji je namijenjen za ovu vrstu proračuna - DISP.V. Njegova sintaksa je predstavljena sljedećom formulom:

DISP.B(Broj1;Broj2;…)

Broj argumenata, kao iu prethodnoj funkciji, također može biti u rasponu od 1 do 255.


Kao što vidite, Excel program može uvelike olakšati izračunavanje varijanse. Ova statistika može biti izračunata aplikacijom, bilo iz populacije ili iz uzorka. U ovom slučaju, sve radnje korisnika zapravo se svode samo na specificiranje raspona brojeva koji će se obraditi, a glavni Excel rad radi sam. Naravno, ovo će uštedjeti značajnu količinu vremena korisnika.

Varijanca je mjera disperzije koja opisuje komparativno odstupanje između vrijednosti podataka i srednje vrijednosti. To je najčešće korištena mjera disperzije u statistici, izračunata zbrajanjem, kvadriranjem, odstupanjem svake vrijednosti podataka od prosječne veličine. Formula za izračunavanje varijanse je data u nastavku:

s 2 – varijansa uzorka;

x av—srednja vrijednost uzorka;

n veličina uzorka (broj vrijednosti podataka),

(x i – x avg) je odstupanje od prosječne vrijednosti za svaku vrijednost skupa podataka.

Da bismo bolje razumjeli formulu, pogledajmo primjer. Ne volim baš da kuvam, pa to retko radim. Međutim, da ne bih gladovao, s vremena na vrijeme moram otići do štednjaka da provedem plan zasićenja tijela proteinima, mastima i ugljikohidratima. Donji skup podataka pokazuje koliko puta Renat kuha svakog mjeseca:

Prvi korak u izračunavanju varijanse je određivanje srednje vrijednosti uzorka, koja je u našem primjeru 7,8 puta mjesečno. Ostatak proračuna može se olakšati korištenjem sljedeće tabele.

Završna faza izračunavanja varijanse izgleda ovako:

Za one koji vole da sve proračune rade u jednom potezu, jednadžba bi izgledala ovako:

Korištenje metode sirovog brojanja (primjer kuhanja)

Ima ih još efikasan metod izračunavanje varijanse, poznato kao metoda "sirovog brojanja". Iako jednadžba na prvi pogled može izgledati prilično glomazna, zapravo i nije toliko strašna. Možete se uvjeriti u to, a zatim odlučiti koja vam se metoda najviše sviđa.

je zbir svake vrijednosti podataka nakon kvadriranja,

je kvadrat zbira svih vrijednosti podataka.

Ne gubi razum sada. Hajde da sve ovo stavimo u tabelu i videćete da je uključeno manje izračunavanja nego u prethodnom primeru.

Kao što vidite, rezultat je bio isti kao pri korištenju prethodne metode. Prednosti ovu metodu postaju očigledni kako se veličina uzorka (n) povećava.

Kalkulacija varijanse u Excel-u

Kao što ste verovatno već pretpostavili, Excel ima formulu koja vam omogućava da izračunate varijansu. Štaviše, počevši od Excel 2010, možete pronaći 4 vrste formule varijanse:

1) VARIANCE.V – Vraća varijansu uzorka. Booleove vrijednosti i tekst se zanemaruju.

2) DISP.G - Vraća varijansu populacije. Booleove vrijednosti i tekst se zanemaruju.

3) VARIANCE - Vraća varijansu uzorka, uzimajući u obzir Boolean i tekstualne vrijednosti.

4) VARIANCE - Vraća varijansu populacije, uzimajući u obzir logičke i tekstualne vrijednosti.

Prvo, shvatimo razliku između uzorka i populacije. Svrha deskriptivne statistike je sumiranje ili prikaz podataka na način koji pruža brze informacije. velika slika, da tako kažem, recenzija. Statističko zaključivanje vam omogućava da napravite zaključke o populaciji na osnovu uzorka podataka iz te populacije. Populacija predstavlja sve moguće ishode ili mjerenja koja nas zanimaju. Uzorak je podskup populacije.

Na primjer, zainteresovani smo za grupu studenata sa jednog od ruskih univerziteta i treba da odredimo prosječan rezultat grupe. Možemo izračunati prosječan uspjeh učenika, a onda će dobijena cifra biti parametar, budući da će cijela populacija biti uključena u naše proračune. Međutim, ako želimo da izračunamo GPA svih učenika u našoj zemlji, onda će ova grupa biti naš uzorak.

Razlika u formuli za izračunavanje varijanse između uzorka i populacije je imenilac. Pri čemu će za uzorak to biti jednako (n-1), a za opštu populaciju samo n.

Pogledajmo sada funkcije za izračunavanje varijanse sa završecima A,čiji opis navodi da se u proračunu uzimaju u obzir tekstualne i logičke vrijednosti. U ovom slučaju, prilikom izračunavanja varijanse određenog skupa podataka u kojem se pojavljuju nenumeričke vrijednosti, Excel će tumačiti tekst i lažne Booleove vrijednosti kao jednake 0, a prave Booleove vrijednosti kao jednake 1.

Dakle, ako imate niz podataka, izračunavanje njegove varijanse neće biti teško pomoću jedne od gore navedenih Excel funkcija.

Disperzija u statistici se definiše kao standardna devijacija pojedinačnih vrednosti karakteristike na kvadrat od aritmetičke sredine. Uobičajena metoda za izračunavanje kvadrata odstupanja opcija od prosjeka sa njihovim naknadnim usrednjavanjem.

U ekonomskoj statističkoj analizi uobičajeno je da se varijacija neke karakteristike procjenjuje najčešće koristeći standardnu ​​devijaciju; to je kvadratni korijen varijanse.

(3)

Karakterizira apsolutnu fluktuaciju vrijednosti različite karakteristike i izražava se u istim mjernim jedinicama kao i opcije. U statistici često postoji potreba da se uporede varijacije različitih karakteristika. Za takva poređenja koristi se relativna mjera varijacije, koeficijent varijacije.

Svojstva disperzije:

1) ako oduzmete bilo koji broj od svih opcija, onda se varijansa neće promijeniti;

2) ako se sve vrijednosti opcije podijele s bilo kojim brojem b, tada će se varijansa smanjiti za b^2 puta, tj.

3) ako izračunate prosječni kvadrat odstupanja od bilo kojeg broja sa nejednakom aritmetičkom sredinom, onda će on biti veći od varijanse. Istovremeno, dobro definisanom vrijednošću po kvadratu razlike između prosječne vrijednosti c.

Disperzija se može definirati kao razlika između srednjeg kvadrata i srednjeg kvadrata.

17. Grupne i međugrupne varijacije. Pravilo dodavanja varijanse

Ako se statistička populacija podijeli na grupe ili dijelove prema osobini koja se proučava, tada se za takvu populaciju mogu izračunati sljedeće vrste disperzije: grupna (privatna), grupna prosječna (privatna) i međugrupna.

Ukupna varijansa– odražava varijaciju karakteristike zbog svih uslova i uzroka koji djeluju u datoj statističkoj populaciji.

Grupna varijansa- jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti karakteristike unutar grupe od aritmetičke sredine ove grupe, koja se naziva grupna sredina. Međutim, prosjek grupe se ne poklapa sa ukupnim prosjekom za cijelu populaciju.

Grupna varijansa odražava varijaciju osobine samo zbog uslova i uzroka koji djeluju unutar grupe.

Prosjek grupnih varijacija- definira se kao ponderirana aritmetička sredina grupnih varijansi, pri čemu su ponderi volumen grupe.

Međugrupna varijansa- jednaka srednjem kvadratu odstupanja grupnih prosjeka od ukupnog prosjeka.

Međugrupna disperzija karakterizira varijaciju rezultirajuće karakteristike zbog karakteristike grupiranja.

Postoji određeni odnos između razmatranih vrsta disperzija: ukupna disperzija jednaka je zbroju prosječne grupne i međugrupne disperzije.

Ovaj odnos se naziva pravilo zbrajanja varijanse.

18. Dinamički nizovi i njegove komponente. Vrste vremenskih serija.

Red u statistici- to su digitalni podaci koji pokazuju promjene u nekoj pojavi u vremenu ili prostoru i omogućavaju statističko poređenje pojava kako u procesu njihovog razvoja u vremenu tako iu razne forme i vrste procesa. Zahvaljujući tome, moguće je otkriti međusobnu zavisnost pojava.

U statistici se proces razvoja kretanja društvenih pojava tokom vremena obično naziva dinamikom. Za prikaz dinamike konstruiraju se dinamičke serije (hronološke, vremenske), koje su nizovi vremenski promjenjivih vrijednosti statističkog pokazatelja (na primjer, broj osuđenih osoba preko 10 godina), raspoređenih hronološkim redom. Njihovi sastavni elementi su digitalne vrijednosti datog indikatora i periodi ili vremenski periodi na koje se odnose.

Najvažnija karakteristika dinamičkih serija- njihovu veličinu (volumen, magnituda) određene pojave ostvarene u određenom periodu ili u određenom trenutku. Shodno tome, veličina članova dinamičke serije je njen nivo. Razlikovati početni, srednji i završni nivo dinamičke serije. Prvi nivo prikazuje vrijednost prvog, konačnog - vrijednost posljednjeg člana serije. Prosječan nivo predstavlja prosječni raspon hronoloških varijacija i izračunava se ovisno o tome da li je dinamička serija intervalna ili trenutna.

Drugi važna karakteristika vremenske serije- vrijeme proteklo od početnog do završnog opažanja, odnosno broj takvih opažanja.

Postoje različite vrste vremenskih serija koje se mogu klasificirati prema sljedećim kriterijima.

1) U zavisnosti od načina iskazivanja nivoa, serije dinamike se dele na serije apsolutnih i derivativnih indikatora (relativne i prosečne vrednosti).

2) U zavisnosti od toga kako nivoi serije izražavaju stanje pojave u određenim vremenskim trenucima (na početku mjeseca, kvartala, godine itd.) ili njenu vrijednost u određenim vremenskim intervalima (npr. po danu, mjesec, godina, itd.) itd.), razlikovati trenutak i intervalni redovi zvučnici. Serije trenutaka se relativno rijetko koriste u analitičkom radu agencija za provođenje zakona.

U statističkoj teoriji dinamika se razlikuje prema nizu drugih klasifikacijskih kriterijuma: zavisno od udaljenosti između nivoa - sa jednakim nivoima i nejednakim nivoima u vremenu; u zavisnosti od prisustva glavne tendencije procesa koji se proučava - stacionarni i nestacionarni. Prilikom analize vremenske serije dolaze sa sljedećih nivoa serije i predstavljaju ih u obliku komponenti:

Y t = TP + E (t)

gdje je TP deterministička komponenta koja određuje opštu tendenciju promjene tokom vremena ili trenda.

E (t) je nasumična komponenta koja uzrokuje fluktuacije nivoa.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”