Varijacijska serija. prosječne vrijednosti

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Statističke serije distribucija– ovo je uređena distribucija populacijskih jedinica u grupe prema određenim varijabilnim karakteristikama.
U zavisnosti od karakteristika na kojima se formira niz distribucije, postoje atributivne i varijacione serije distribucije.

Prisustvo zajedničke karakteristike je osnova za formiranje statističke populacije, koja predstavlja rezultate opisivanja ili mjerenja općih karakteristika objekata proučavanja.

Predmet proučavanja u statistici su promjenjive (promjenjive) karakteristike ili statističke karakteristike.

Vrste statističkih karakteristika.

Redovi distribucije se nazivaju atributivni izgrađen po kriterijumima kvaliteta. Atributivno– ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica itd.).
Serija distribucije se obično prikazuje u obliku tabela. U tabeli 2.8 prikazuje seriju raspodjele atributa.
Tabela 2.8 - Distribucija vrsta pravne pomoći koju pružaju advokati građanima jednog od regiona Ruske Federacije.

Varijacijska serija– to su vrijednosti karakteristike (ili intervala vrijednosti) i njihove frekvencije.
Varijabilne serije su distribucijske serije, izgrađen na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija.
Varijantama se smatraju pojedinačne vrijednosti karakteristike koje ona uzima u nizu varijacija.
Učestalosti su brojevi pojedinačnih opcija ili svake grupe varijantne serije, tj. Ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u seriji distribucije. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen.
Frekvencije su učestalosti izražene kao dijelovi jedinice ili kao postotak od ukupnog broja. Prema tome, zbir frekvencija je jednak 1 ili 100%. Varijaciona serija omogućava procjenu oblika zakona raspodjele na osnovu stvarnih podataka.

U zavisnosti od prirode varijacije osobine, postoje diskretne i intervalne varijacione serije.
Primjer diskretne serije varijacija dat je u tabeli. 2.9.
Tabela 2.9 - Raspodjela porodica prema broju nastanjenih soba u pojedinačnim stanovima 1989. godine u Ruskoj Federaciji.

Prva kolona tabele predstavlja opcije za diskretnu seriju varijacija, druga kolona sadrži frekvencije serije varijacija, a treća sadrži indikatore frekvencije.

Varijacijska serija

Određena kvantitativna karakteristika se proučava u opštoj populaciji. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata uzorka je jednak n. U prvoj fazi statističke obrade, rasponu uzorci, tj. redosled brojeva x 1 , x 2 , …, x n Uzlazno. Svaka posmatrana vrednost x i pozvao opcija. Frekvencija m i je broj zapažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i je omjer frekvencija m i na veličinu uzorka n: .
Prilikom proučavanja varijacionih serija također se koriste koncepti akumulirane frekvencije i akumulirane frekvencije. Neka x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max.
Karakteristika se naziva diskretno varijabilnom ako se njene pojedinačne vrijednosti (varijante) razlikuju jedna od druge za određenu konačnu vrijednost (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Tabela 1. Opšti pogled na diskretnu varijantnu seriju frekvencija

Karakteristične vrijednostix i x 1 x 2 x n
Frekvencijem i m 1 m 2 m n

Karakteristika se naziva kontinuirano promjenjiva ako se njene vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tj. znak može uzeti bilo koju vrijednost u određenom intervalu. Kontinuirani niz varijacija za takvu karakteristiku naziva se interval.

Tabela 2. Opšti prikaz intervalnih varijacionih serija frekvencija

Tabela 3. Grafičke slike serije varijacija

RedPoligon ili histogramEmpirijska funkcija distribucije
Diskretno
Interval
Pregledom rezultata promatranja utvrđuje se koliko vrijednosti opcija spada u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili u svim slučajevima lijevo (češće) ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija sadržanih unutar navedenih granica. Razlike a i – a i +1 nazivaju se parcijalni intervali. Da bi se pojednostavili naknadni proračuni, niz intervalnih varijacija može se zamijeniti uslovno diskretnim. U ovom slučaju, prosječna vrijednost i-interval se uzima kao opcija x i, i odgovarajuću frekvenciju intervala m i– za frekvenciju ovog intervala.
Za grafički prikaz varijacionih serija najčešće se koriste poligon, histogram, kumulativna kriva i empirijska funkcija raspodjele.

U tabeli 2.3 (Grupacija ruskog stanovništva prema prosječnom dohotku po glavi stanovnika u aprilu 1994.) intervalne varijacione serije.
Pogodno je analizirati nizove distribucije pomoću grafičke slike, koja omogućava prosuđivanje oblika distribucije. Vizuelni prikaz prirode promjena u frekvencijama varijacionih serija je dat pomoću poligon i histogram.
Poligon se koristi kada se prikazuje diskretna serija varijacija.
Hajde da, na primjer, grafički prikažemo raspodjelu stambenog fonda po tipu stana (tabela 2.10).
Tabela 2.10 - Raspodjela stambenog fonda urbanog područja prema tipu stana (uslovne brojke).


Rice. Distribucija stambenog prostora


Na osi ordinata mogu se nacrtati ne samo vrijednosti frekvencija, već i frekvencije serije varijacija.
Histogram se koristi za prikaz niza intervalnih varijacija. Prilikom konstruiranja histograma, vrijednosti intervala se iscrtavaju na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku šipki jedna uz drugu.
Hajde da grafički prikažemo niz intervalne distribucije date u tabeli. 2.11.
Tabela 2.11 - Raspodjela porodica prema veličini stambenog prostora po osobi (uslovne brojke).
N p/p Grupe porodica prema veličini stambenog prostora po osobi Broj porodica sa datom veličinom stambenog prostora Kumulativni broj porodica
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Rice. 2.2. Histogram distribucije porodica prema veličini stambenog prostora po osobi


Koristeći podatke akumulirane serije (tabela 2.11), konstruišemo kumulirajuća distribucija.


Rice. 2.3. Kumulativna distribucija porodica prema veličini stambenog prostora po osobi


Reprezentacija varijacione serije u obliku kumulata je posebno efikasna za varijacione serije čije su frekvencije izražene kao razlomci ili procenti zbira frekvencija serija.
Ako promijenimo osi kada grafički prikazujemo niz varijacija u obliku kumulata, onda ćemo dobiti ogiva. Na sl. 2.4 prikazuje ogive konstruisano na osnovu podataka u tabeli. 2.11.
Histogram se može pretvoriti u poligon distribucije pronalaženjem središta stranica pravougaonika, a zatim povezivanjem ovih tačaka pravim linijama. Rezultirajući poligon distribucije prikazan je na Sl. 2.2 sa isprekidanom linijom.
Prilikom konstruiranja histograma distribucije varijacionog niza s nejednakim intervalima, duž ordinatne ose nisu iscrtane frekvencije, već gustoća distribucije karakteristike u odgovarajućim intervalima.
Gustina distribucije je frekvencija izračunata po jedinici širine intervala, tj. koliko jedinica u svakoj grupi ima po jedinici vrijednosti intervala. Primjer izračunavanja gustine distribucije prikazan je u tabeli. 2.12.
Tabela 2.12 - Distribucija preduzeća po broju zaposlenih (uslovne brojke)
N p/p Grupe preduzeća prema broju zaposlenih, ljudi. Broj preduzeća Veličina intervala, ljudi. Gustina distribucije
A 1 2 3=1/2
1 Do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Može se koristiti i za grafičko predstavljanje serije varijacija kumulativna kriva. Koristeći kumulaciju (krivulja zbira), prikazan je niz akumuliranih frekvencija. Kumulativne frekvencije se određuju uzastopnim zbrajanjem frekvencija po grupama i pokazuju koliko jedinica u populaciji ima vrijednosti atributa ne veće od vrijednosti koja se razmatra.


Rice. 2.4. Ogive raspodjele porodica prema veličini stambenog prostora po osobi

Prilikom konstruiranja kumulata intervalne varijacione serije, varijante niza se crtaju duž ose apscise, a akumulirane frekvencije se crtaju duž ordinatne ose.

Varijacija određuje razlike u vrijednostima karakteristike među različitim jedinicama date populacije u istom periodu (trenutku). Varijacije su uzrokovane različitim uslovima postojanja različitih jedinica stanovništva. Na primjer, čak i blizanci u toku svog života stiču razlike u visini, težini, kao i u karakteristikama kao što su nivo obrazovanja, prihodi, broj djece itd.

Varijacije nastaju kao rezultat činjenice da se same vrijednosti atributa formiraju pod ukupnim utjecajem različitih uvjeta, koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Dakle, vrijednost svake opcije je objektivna.

Varijacija je karakteristična na sve pojave prirode i društva, bez izuzetka, osim na zakonom utvrđena normativna značenja individualnih društvenih karakteristika. Studije varijacija u statistici su od velike važnosti, one pomažu da se shvati suština fenomena koji se proučava. Pronalaženje varijacije, otkrivanje njenih uzroka, utvrđivanje uticaja pojedinačnih faktora daju važne informacije za implementaciju naučno zasnovanih upravljačkih odluka.

Prosječna vrijednost daje generaliziranu karakteristiku karakteristike populacije, ali ne otkriva njenu strukturu. Prosječna vrijednost ne pokazuje kako se varijante prosječne karakteristike nalaze oko nje, da li su raspoređene blizu prosjeka ili odstupaju od njega. Prosjek u dvije populacije može biti isti, ali u jednoj verziji sve pojedinačne vrijednosti se neznatno razlikuju od njega, au drugoj su te razlike velike, tj. u prvom slučaju varijacija karakteristike je mala, au drugom je velika to je vrlo važno za karakterizaciju značajnosti prosječne vrijednosti.

Da bi rukovodilac organizacije, menadžer ili istraživač proučavao varijaciju i upravljao njome, statistika je razvila posebne metode za proučavanje varijacija (sistem indikatora). Uz njihovu pomoć pronalazi se varijacija i karakteriziraju njena svojstva. Indikatori varijacije uključuju : opseg varijacije, prosječno linearno odstupanje, koeficijent varijacije.

Varijacijski nizovi i njegovi oblici

Varijacijska serija- ovo je uređena distribucija jedinica populacije, često prema rastućim (rjeđe opadajućim) vrijednostima karakteristike i računajući broj jedinica sa određenom vrijednošću karakteristike. Kada je broj populacijskih jedinica velik, rangirana serija postaje glomazna i njena izgradnja traje dugo. U takvoj situaciji, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava.

Postoje sljedeće oblici varijantnih serija :

  1. Rangirana serija predstavlja listu pojedinačnih jedinica populacije u rastućem (opadajućem) redoslijedu karakteristike koja se proučava.
  2. Diskretne serije varijacija - ovo je tabela koja se sastoji od dva reda ili grafikona: specifične vrijednosti varijabilne karakteristike x i broja jedinica populacije sa datom vrijednošću f - frekvencijska karakteristika. Konstruira se kada atribut poprimi najveći broj vrijednosti.
  3. Intervalne serije.

Opseg varijacije je određen kao apsolutna vrijednost razlike između maksimalne i minimalne vrijednosti (varijanti) karakteristike:

Raspon varijacija pokazuje samo ekstremna odstupanja karakteristike i ne odražavaju pojedinačna odstupanja svih opcija u seriji. Karakterizira granice promjene promjenjive karakteristike i ovisi o fluktuacijama dvije ekstremne opcije i apsolutno nije povezan s frekvencijama u nizu varijacija, odnosno s prirodom distribucije, što ovoj vrijednosti daje slučajan karakter. Da biste analizirali varijaciju, potreban vam je indikator koji odražava sve fluktuacije u karakteristikama varijacije i daje opću karakteristiku. Najjednostavniji indikator ovog tipa je prosječno linearno odstupanje.

Varijacija nazivaju se redovi distribucije konstruisani prema kvantitativnim karakteristikama. Vrijednosti kvantitativnih karakteristika u pojedinim jedinicama populacije nisu konstantne i međusobno se manje-više razlikuju.

Varijacija- fluktuacija, promjenjivost vrijednosti neke karakteristike među jedinicama stanovništva. Pojedinačne numeričke vrijednosti neke karakteristike pronađene u populaciji koja se proučava nazivaju se opcije vrijednosti. Nedovoljnost prosječne vrijednosti za potpunu karakterizaciju populacije prisiljava nas da prosječne vrijednosti dopunimo indikatorima koji nam omogućavaju da procijenimo tipičnost ovih prosjeka mjerenjem varijabilnosti (varijacije) karakteristike koja se proučava.

Prisustvo varijabilnosti je posledica uticaja velikog broja faktora na formiranje nivoa osobine. Ovi faktori djeluju nejednakom snagom iu različitim smjerovima. Indeksi varijacije se koriste za opisivanje mjere varijabilnosti osobina.

Ciljevi statističkog proučavanja varijacije:

  • 1) proučavanje prirode i stepena varijacije karakteristika u pojedinim jedinicama stanovništva;
  • 2) utvrđivanje uloge pojedinih faktora ili njihovih grupa u varijaciji pojedinih karakteristika populacije.

U statistici se koriste posebne metode za proučavanje varijacije, zasnovane na upotrebi sistema indikatora, With kojim se mjeri varijacija.

Istraživanje varijacija je važno. Mjerenje varijacija je neophodno kada se vrši opservacija uzorka, analiza korelacije i varijanse, itd. Ermolaev O.Yu. Matematička statistika za psihologe: Udžbenik [Tekst]/ O.Yu. Ermolaev. - M.: Izdavačka kuća Flint Moskovskog psihološko-socijalnog instituta, 2012. - 335 str.

Po stepenu varijacije može se suditi o homogenosti populacije, stabilnosti pojedinačnih vrijednosti karakteristika i tipičnosti prosjeka. Na njihovoj osnovi se razvijaju indikatori bliskosti veze između karakteristika i indikatora za procjenu tačnosti posmatranja uzorka.

Pravi se razlika između varijacije u prostoru i varijacije u vremenu.

Varijacija u prostoru se podrazumijeva kao varijabilnost vrijednosti atributa među jedinicama stanovništva koje predstavljaju pojedinačne teritorije. Vremenska varijacija se odnosi na promjene vrijednosti karakteristike u različitim vremenskim periodima.

Za proučavanje varijacija u redovima distribucije, sve varijante vrijednosti atributa su raspoređene u rastućem ili opadajućem redoslijedu. Ovaj proces se naziva rangiranje serije.

Najjednostavniji znaci varijacije su minimum i maksimum- najmanja i najveća vrijednost atributa u agregatu. Broj ponavljanja pojedinačnih varijanti vrijednosti karakteristika naziva se frekvencija ponavljanja (fi). Pogodno je zamijeniti frekvencije sa frekvencijama - wi. Učestalost je relativni pokazatelj učestalosti, koji se može izraziti u dijelovima jedinice ili kao postotak i omogućava upoređivanje serija varijacija s različitim brojem opažanja. Izraženo formulom:

gdje su Xmax, Xmin maksimalne i minimalne vrijednosti karakteristike u agregatu; n - broj grupa.

Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori. Apsolutni indikatori varijacije uključuju opseg varijacije, prosječnu linearnu devijaciju, disperziju i standardnu ​​devijaciju. Relativni indikatori oscilacije uključuju koeficijent oscilacije, relativno linearno odstupanje i koeficijent varijacije.

Primjer pronalaženja niza varijacija

Vježbajte. Za ovaj uzorak:

  • a) Pronađite varijacioni niz;
  • b) Konstruisati funkciju distribucije;

br.=42. Elementi uzorka:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Rješenje.

  • a) konstrukcija rangirane serije varijacija:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) konstrukcija diskretne varijacione serije.

Izračunajmo broj grupa u nizu varijacija koristeći Sturgessovu formulu:

Uzmimo da je broj grupa 7.

Znajući broj grupa, izračunavamo veličinu intervala:

Radi praktičnosti konstruisanja tabele, uzet ćemo broj grupa jednak 8, interval će biti 1.

Rice. 1 Obim prodaje robe od strane prodavnice za određeni vremenski period

Varijacijska serija - ovo je statistička serija koja pokazuje distribuciju fenomena koji se proučava prema vrijednosti bilo koje kvantitativne karakteristike. Na primjer, pacijenti prema dobi, trajanju liječenja, novorođenčadi po težini itd.

Opcija - pojedinačne vrijednosti karakteristike kojima se vrši grupiranje (označeno V ) .

Učestalost- broj koji pokazuje koliko često se određena opcija pojavljuje (označeno P ) . Pokazuje se zbir svih frekvencija ukupan broj zapažanja i određen je n . Razlika između najveće i najmanje varijante varijantnog niza naziva se raspon ili amplituda .

Postoje serije varijacija:

1. Diskontinuirano (diskretno) i kontinuirano.

Niz se smatra kontinuiranim ako se karakteristika grupisanja može izraziti u razlomcima (težina, visina, itd.), diskontinuiranom ako je karakteristika grupisanja izražena samo kao cijeli broj (dani invaliditeta, broj otkucaja pulsa, itd.) .

2.Jednostavno i uravnoteženo.

Jednostavna varijantna serija je serija u kojoj se kvantitativna vrijednost promjenljive karakteristike javlja jednom. U ponderiranoj seriji varijacija, kvantitativne vrijednosti varijabilne karakteristike se ponavljaju sa određenom učestalošću.

3. Grupirani (intervalni) i negrupisani.

Grupisana serija ima opcije kombinovane u grupe koje ih ujedinjuju po veličini unutar određenog intervala. U negrupisanim serijama, svaka pojedinačna opcija odgovara određenoj frekvenciji.

4. Parni i neparni.

U parnim nizovima varijacija, zbir frekvencija ili ukupan broj opažanja izražava se parnim brojem, u neparnim - neparnim brojem.

5. Simetrično i asimetrično.

U simetričnoj seriji varijacija, sve vrste prosječnih vrijednosti se poklapaju ili su vrlo bliske (mod, medijan, aritmetička sredina).

U zavisnosti od prirode pojava koje se proučavaju, od specifičnih zadataka i ciljeva statističkih istraživanja, kao i od sadržaja izvornog materijala, u sanitarnoj statistici Koriste se sljedeće vrste prosjeka:

strukturna sredstva (mod, medijan);

aritmetička sredina;

harmonična sredina;

geometrijska sredina;

prosečno progresivna.

Moda (M O ) - vrijednost varirajuće karakteristike, koja se češće sreće u populaciji koja se proučava, tj. opcija koja odgovara najvišoj frekvenciji. Oni ga pronalaze direktno iz strukture varijacionih serija, bez pribjegavanja bilo kakvim proračunima. Obično je to vrijednost vrlo bliska aritmetičkoj sredini i vrlo je zgodna u praksi.

Medijan (M e ) - dijeljenje niza varijacija (rangiranih, tj. vrijednosti opcije su raspoređene u rastućem ili opadajućem redoslijedu) na dvije jednake polovine. Medijan se izračunava pomoću takozvane neparne serije, koja se dobija sekvencijalnim zbrajanjem frekvencija. Ako zbroj frekvencija odgovara parnom broju, tada se aritmetička sredina dvije prosječne vrijednosti konvencionalno uzima kao medijan.

Mod i medijan se koriste u slučaju otvorene populacije, tj. kada najveće ili najmanje opcije nemaju tačne kvantitativne karakteristike (na primjer, do 15 godina, 50 i više, itd.). U ovom slučaju, aritmetička sredina (parametarske karakteristike) se ne može izračunati.

Prosjek Ja sam aritmetičar - najčešća vrijednost. Aritmetička sredina se često označava sa M.

Postoje jednostavne i ponderisane aritmetičke sredine.

Jednostavna aritmetička sredina izračunato:

- u slučajevima kada je populacija predstavljena jednostavnom listom znanja o osobini za svaku jedinicu;

- ako se ne može odrediti broj ponavljanja svake opcije;

- ako je broj ponavljanja svake opcije blizak jedno drugom.

Jednostavna aritmetička sredina izračunava se pomoću formule:

gdje je V - pojedinačne vrijednosti karakteristike; n - broj pojedinačnih vrijednosti;
- znak sumiranja.

Dakle, prosti prosjek je omjer zbira varijanti i broja opservacija.

primjer: odrediti prosječnu dužinu boravka u krevetu za 10 pacijenata sa upalom pluća:

16 dana - 1 pacijent; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

krevet-dan

Ponderisan aritmetički prosjek izračunava se u slučajevima kada se pojedinačne vrijednosti karakteristike ponavljaju. Može se izračunati na dva načina:

1. Direktno (aritmetička sredina ili direktna metoda) prema formuli:

,

gdje je P učestalost (broj slučajeva) opažanja svake opcije.

Dakle, ponderisana aritmetička sredina je odnos zbira proizvoda varijante i učestalosti i broja posmatranja.

2. Izračunavanjem odstupanja od uslovnog prosjeka (pomoću metode momenata).

Osnova za izračunavanje ponderisanog aritmetičkog prosjeka je:

― grupisani materijal prema varijantama kvantitativne karakteristike;

— sve opcije treba da budu raspoređene u rastućem ili opadajućem redosledu vrednosti atributa (rangirani niz).

Za izračunavanje pomoću metode momenta, preduvjet je ista veličina svih intervala.

Koristeći metodu trenutaka, aritmetička sredina se izračunava pomoću formule:

,

gdje je M o uslovni prosjek, koji se često uzima kao vrijednost karakteristike koja odgovara najvišoj frekvenciji, tj. koji se češće ponavlja (Moda).

i je vrijednost intervala.

a je uslovno odstupanje od uslova prosjeka, koji je uzastopni niz brojeva (1, 2, itd.) sa znakom + za varijante velikih uslovnih prosjeka i sa znakom – (–1, –2, itd. .) za varijante koje su ispod konvencionalnog prosjeka. Uslovno odstupanje od varijante uzeto kao uslovni prosek je 0.

P - frekvencije.

- ukupan broj zapažanja ili n.

primjer: odrediti prosječnu visinu dječaka od 8 godina direktno (tabela 1).

Tabela 1

Visina u cm

dečaci P

Central

opcija V

Centralna opcija - sredina intervala - definirana je kao poluzbroj početnih vrijednosti dvije susjedne grupe:

;
itd.

Proizvod VP se dobija množenjem centralnih varijanti sa frekvencijama
;
itd. Zatim se dodaju i dobiju dobijeni proizvodi
, koji se dijeli sa brojem opservacija (100) i dobije se ponderirana aritmetička sredina.

cm.

Isti problem ćemo riješiti metodom momenata za koju je sastavljena sljedeća tabela 2:

Tabela 2

Visina u cm (V)

dečaci P

n=100

Uzimamo 122 kao M o, jer od 100 posmatranja, 33 osobe imale su visinu od 122 cm. Nalazimo uslovna odstupanja (a) od uslovnog prosjeka u skladu sa gore navedenim. Zatim dobijamo proizvod uslovnih odstupanja po frekvencijama (aP) i zbrojimo dobijene vrednosti (
). Rezultat je 17. Konačno, zamjenjujemo podatke u formulu:

Prilikom proučavanja varirajuće karakteristike, ne može se ograničiti samo na izračunavanje prosječnih vrijednosti. Takođe je potrebno izračunati indikatore koji karakterišu stepen raznolikosti karakteristika koje se proučavaju. Vrijednost jedne ili druge kvantitativne karakteristike nije ista za sve jedinice statističke populacije.

Karakteristika serije varijacija je standardna devijacija ( ), koji pokazuje širenje (disperziju) proučavanih karakteristika u odnosu na aritmetičku sredinu, tj. karakterizira varijabilnost serije varijacija. Može se odrediti direktno pomoću formule:

Standardna devijacija jednaka je kvadratnom korijenu zbroja proizvoda kvadrata odstupanja svake opcije od aritmetičke sredine (V–M) 2 sa njenim frekvencijama podijeljenim sa zbirom frekvencija (
).

Primjer izračuna: odrediti prosječan broj bolovanja izdatih u ambulanti dnevno (tabela 3).

Tabela 3

Broj dana bolovanja

izdati listovi

doktor na dan (V)

Broj ljekara (P)

;

U nazivniku, kada je broj zapažanja manji od 30, potrebno je od
oduzmi jedan.

Ako je niz grupiran u jednakim intervalima, tada se standardna devijacija može odrediti metodom momenata:

,

gdje je i vrijednost intervala;

- uslovno odstupanje od uslovnog prosjeka;

P - varijanta frekvencije odgovarajućih intervala;

- ukupan broj zapažanja.

Primjer proračuna : Odrediti prosječnu dužinu boravka pacijenata na terapeutskom krevetu (metodom trenutaka) (tabela 4):

Tabela 4

Broj dana

ostani u krevetu (V)

bolestan (P)

;

Belgijski statističar A. Quetelet je otkrio da se varijacije u fenomenima mase povinuju zakonu raspodjele grešaka, koji su gotovo istovremeno otkrili K. Gauss i P. Laplace. Kriva koja predstavlja ovu distribuciju ima oblik zvona. Prema normalnom zakonu raspodjele, varijabilnost pojedinačnih vrijednosti karakteristike je u granicama
, koji pokriva 99,73% svih jedinica u populaciji.

Izračunato je da ako dodate i oduzmete 2 aritmetičkoj sredini , tada je 95,45% svih članova varijacionog niza unutar dobijenih vrijednosti i, konačno, ako dodamo i oduzmemo 1 aritmetičkoj sredini , tada će 68,27% svih članova ovog varijantnog niza biti unutar dobijenih vrijednosti. U medicini sa veličinom
1povezan sa konceptom norme. Odstupanje od aritmetičke sredine je veće od 1 , ali manje od 2 je subnormalan, a odstupanje je veće od 2 abnormalno (iznad ili ispod normale).

U zdravstvenoj statistici, pravilo tri sigma se koristi kada se proučava fizički razvoj, procjenjuje rad zdravstvenih ustanova i procjenjuje zdravlje stanovništva. Isto pravilo se široko koristi u nacionalnoj ekonomiji kada se određuju standardi.

Dakle, standardna devijacija služi za:

— mjerenja disperzije serije varijacije;

— karakteristike stepena raznolikosti karakteristika, koje su određene koeficijentom varijacije:

Ako je koeficijent varijacije veći od 20% - jaka raznolikost, od 20 do 10% - prosječna, manje od 10% - slaba raznolikost osobina. Koeficijent varijacije je u određenoj mjeri kriterij za pouzdanost aritmetičke sredine.

Nazovimo različite vrijednosti uzorka opcije niz vrijednosti i označavaju: X 1 , X 2,…. Prije svega, mi ćemo proizvoditi rasponu opcije, tj. njihov raspored u rastućem ili opadajućem redosledu. Za svaku opciju je naznačena sopstvena težina, tj. broj koji karakteriše doprinos date opcije ukupnoj populaciji. Frekvencije ili frekvencije djeluju kao težine.

Frekvencija n i opcija x i je broj koji pokazuje koliko puta se data opcija pojavljuje u populaciji uzorka koja se razmatra.

Frekvencija ili relativna frekvencija w i opcija x i je broj jednak omjeru frekvencije varijante prema zbroju frekvencija svih varijanti. Učestalost pokazuje koliki udio jedinica u populaciji uzorka ima datu varijantu.

Niz opcija s njihovim odgovarajućim težinama (frekvencijama ili frekvencijama), napisan u rastućem (ili opadajućem) redoslijedu, naziva se varijantne serije.

Varijacijski nizovi su diskretni i intervalni.

Za diskretnu varijantnu seriju specificiraju se tačkaste vrijednosti karakteristike, za intervalnu seriju karakteristične vrijednosti su navedene u obliku intervala. Varijacijska serija može prikazati distribuciju frekvencija ili relativne frekvencije (frekvencije), ovisno o tome koja je vrijednost naznačena za svaku opciju – frekvencija ili frekvencija.

Diskretna varijantna serija distribucije frekvencije ima oblik:

Frekvencije se nalaze po formuli, i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Primjer 4.1. Za dati skup brojeva

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

konstruirati diskretne varijacione serije frekvencijskih i frekvencijskih distribucija.

Rješenje . Obim stanovništva je jednak n= 10. Red diskretne frekvencije ima oblik

Intervalne serije imaju sličan oblik snimanja.

Intervalni varijacioni niz distribucije frekvencije je napisano kao:

Zbir svih frekvencija jednak je ukupnom broju posmatranja, tj. ukupna zapremina: n = n 1 +n 2 + … + n m.

Interval varijacije serije distribucije relativnih frekvencija (frekvencija) ima oblik:

Frekvencija se nalazi po formuli, i = 1, 2, …, m.

Zbir svih frekvencija jednak je jedan: w 1 +w 2 + … + w m = 1.

U praksi se najčešće koriste intervalne serije. Ako postoji mnogo statističkih podataka uzorka i njihove se vrijednosti razlikuju jedna od druge za proizvoljno malu količinu, tada će diskretna serija za te podatke biti prilično glomazna i nezgodna za daljnja istraživanja. U ovom slučaju se koristi grupisanje podataka, tj. Interval koji sadrži sve vrijednosti atributa dijeli se na nekoliko parcijalnih intervala i izračunavanjem frekvencije za svaki interval dobija se intervalna serija. Zapišimo detaljnije shemu za konstruiranje intervalnog niza, uz pretpostavku da će dužine parcijalnih intervala biti iste.

2.2 Konstrukcija intervalne serije

Da biste napravili intervalnu seriju potrebno vam je:

Odrediti broj intervala;

Odrediti dužinu intervala;

Odredite lokaciju intervala na osi.

Za utvrđivanje broj intervala k Postoji Sturgesova formula prema kojoj

,

Gdje n- zapremina celokupnog agregata.

Na primjer, ako postoji 100 vrijednosti neke karakteristike (varijante), onda se preporučuje da se broj intervala uzme jednak intervalima za konstruiranje intervalne serije.

Međutim, vrlo često u praksi broj intervala bira sam istraživač, vodeći računa da taj broj ne bi trebao biti jako velik kako serija ne bi bila glomazna, ali ni jako mala da se ne bi izgubila neka svojstva distribucija.

Dužina intervala h određena sljedećom formulom:

,

Gdje x max i x min je najveća i najmanja vrijednost opcija, respektivno.

Veličina pozvao obim red.

Da bi se sami konstruirali intervali, oni se kreću na različite načine. Jedan od najjednostavnijih načina je sljedeći. Za početak prvog intervala se uzima
. Tada se preostale granice intervala nalaze po formuli. Očigledno, kraj posljednjeg intervala a m+1 mora zadovoljiti uslov

Nakon što se pronađu sve granice intervala, određuju se frekvencije (ili frekvencije) ovih intervala. Da biste riješili ovaj problem, pregledajte sve opcije i odredite broj opcija koje spadaju u određeni interval. Pogledajmo kompletnu konstrukciju intervalne serije koristeći primjer.

Primjer 4.2. Za sljedeće statističke podatke, snimljene uzlaznim redoslijedom, konstruirajte intervalni niz sa brojem intervala jednakim 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Rješenje. Ukupno n=50 vrijednosti varijanti.

Broj intervala je preciziran u iskazu problema, tj. k=5.

Dužina intervala je
.

Definirajmo granice intervala:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Da bismo odredili učestalost intervala, brojimo broj opcija koje spadaju u dati interval. Na primjer, prvi interval od 2,5 do 19,5 uključuje opcije 11, 12, 12, 14, 14, 15. Njihov broj je 6, pa je frekvencija prvog intervala n 1 =6. Frekvencija prvog intervala je . Drugi interval od 19,5 do 36,5 uključuje opcije 21, 21, 22, 23, 25, čiji je broj 5. Dakle, učestalost drugog intervala je n 2 =5, i frekvencija . Nakon što smo pronašli frekvencije i frekvencije za sve intervale na sličan način, dobili smo sljedeći intervalni niz.

Intervalni niz frekvencijske distribucije ima oblik:

Zbir frekvencija je 6+5+9+11+8+11=50.

Intervalni niz frekvencijske distribucije ima oblik:

Zbir frekvencija je 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Prilikom konstruisanja intervalnih serija, u zavisnosti od specifičnih uslova problema koji se razmatra, mogu se primeniti i druga pravila, i to

1. Serija varijacija intervala može se sastojati od parcijalnih intervala različitih dužina. Nejednake dužine intervala omogućavaju da se istaknu svojstva statističke populacije s neravnomjernom raspodjelom karakteristike. Na primjer, ako granice intervala određuju broj stanovnika u gradovima, onda je u ovom problemu preporučljivo koristiti intervale nejednake dužine. Očigledno je da je za male gradove važna mala razlika u broju stanovnika, ali za velike gradove razlika od desetina ili stotina stanovnika nije značajna. Intervalne serije sa nejednakim dužinama parcijalnih intervala proučavaju se uglavnom u opštoj teoriji statistike i njihovo razmatranje je van okvira ovog priručnika.

2. U matematičkoj statistici se ponekad razmatraju intervalne serije za koje se pretpostavlja da je lijeva granica prvog intervala jednaka –∞, a desna granica posljednjeg intervala +∞. Ovo se radi kako bi se statistička distribucija približila teorijskoj.

3. Prilikom konstruisanja intervalnog niza može se ispostaviti da se vrijednost neke opcije tačno poklapa sa granicom intervala. Najbolje što možete učiniti u ovom slučaju je sljedeće. Ako postoji samo jedna takva podudarnost, onda smatrajte da je opcija koja se razmatra sa svojom frekvencijom pala u interval koji se nalazi bliže sredini niza intervala, ako postoji nekoliko takvih opcija, onda su ili sve dodijeljene intervalima; desno od ovih opcija, ili su sve dodijeljene lijevo.

4. Nakon određivanja broja intervala i njihove dužine, raspored intervala se može izvršiti na drugi način. Pronađite aritmetičku sredinu svih razmatranih vrijednosti opcija X sri i izgraditi prvi interval na takav način da ovaj prosjek uzorka bude unutar nekog intervala. Tako dobijamo interval od X sri – 0,5 h prije X prosječno + 0,5 h. Zatim lijevo i desno, dodajući dužinu intervala, gradimo preostale intervale do x min i x max neće pasti u prvi i zadnji interval, respektivno.

5. Intervalne serije sa velikim brojem intervala pogodno se pišu okomito, tj. upišite intervale ne u prvi red, već u prvu kolonu, a frekvencije (ili frekvencije) u drugu kolonu.

Podaci uzorka mogu se smatrati vrijednostima neke slučajne varijable X. Slučajna varijabla ima svoj zakon raspodjele. Iz teorije vjerovatnoće je poznato da se zakon raspodjele diskretne slučajne varijable može specificirati u obliku distributivnog niza, a za kontinuirani - korištenjem funkcije gustine raspodjele. Međutim, postoji univerzalni zakon raspodjele koji vrijedi i za diskretne i za kontinuirane slučajne varijable. Ovaj zakon raspodjele je dat kao funkcija raspodjele F(x) = P(X<x). Za uzorke podataka možete odrediti analognu funkciju distribucije - empirijsku funkciju distribucije.


Povezane informacije.


Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”