Definicija varijacionih serija. Varijacijska serija

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

​ Varijaciona serija - serija u kojoj se porede (po stepenu povećanja ili smanjenja) opcije i odgovarajući frekvencije

Opcije su pojedinačni kvantitativni izrazi karakteristike. Određeno latinično pismo V . Klasično razumijevanje pojma „varijanta“ pretpostavlja da se svaka jedinstvena vrijednost karakteristike naziva varijanta, bez uzimanja u obzir broja ponavljanja.

Na primjer, u seriji varijacija indikatora sistoličkog krvnog tlaka mjerenih kod deset pacijenata:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Na raspolaganju je samo 6 vrijednosti:

110, 120, 130, 140, 160, 170.

Učestalost je broj koji pokazuje koliko puta se opcija ponavlja. Označava se latiničnim slovom P . Zbir svih frekvencija (koji je, naravno, jednak broju svih proučavanih) označava se kao n.

    U našem primjeru, frekvencije će poprimiti sljedeće vrijednosti:
  • za opciju 110 frekvencija P = 1 (vrijednost 110 javlja se kod jednog pacijenta),
  • za opciju 120 frekvencija P = 2 (vrijednost 120 javlja se kod dva pacijenta),
  • za opciju 130 frekvencija P = 3 (vrijednost 130 javlja se kod tri pacijenta),
  • za opciju 140 frekvencija P = 2 (vrijednost 140 javlja se kod dva pacijenta),
  • za opciju 160 frekvencija P = 1 (vrijednost 160 javlja se kod jednog pacijenta),
  • za opciju 170 frekvencija P = 1 (vrijednost 170 javlja se kod jednog pacijenta),

Vrste varijantnih serija:

  1. jednostavno- ovo je serija u kojoj se svaka opcija javlja samo jednom (sve frekvencije su jednake 1);
  2. suspendovan- serija u kojoj se jedna ili više opcija pojavljuju više puta.

Varijaciona serija se koristi za opisivanje velikih nizova brojeva; upravo u tom obliku su u početku predstavljeni prikupljeni podaci većine medicinskih studija. Da bi se okarakterisala serija varijacija, izračunavaju se posebni indikatori, uključujući prosječne vrijednosti, indikatore varijabilnosti (tzv. disperzije) i indikatore reprezentativnosti podataka uzorka.

Indikatori serije varijacija

1) Aritmetička sredina je opšti pokazatelj koji karakteriše veličinu karakteristike koja se proučava. Aritmetička sredina se označava kao M , je najčešći tip prosjeka. Aritmetička sredina izračunava se kao omjer zbira vrijednosti indikatora svih jedinica posmatranja i broja svih proučavanih subjekata. Metoda za izračunavanje aritmetičke sredine razlikuje se za jednostavnu i ponderisanu seriju varijacija.

Formula za proračun jednostavan aritmetički prosjek:

Formula za proračun ponderisani aritmetički prosjek:

M = Σ(V * P)/ n

​ 2) Mod je još jedna prosječna vrijednost serije varijacija, koja odgovara opciji koja se najčešće ponavlja. Ili, drugačije rečeno, ovo je opcija koja odgovara najvišoj frekvenciji. Označeno kao Mo . Režim se računa samo za ponderisane serije, pošto se u jednostavnim serijama nijedna opcija ne ponavlja i sve frekvencije su jednake jedinici.

Na primjer, u nizu varijacija vrijednosti otkucaja srca:

80, 84, 84, 86, 86, 86, 90, 94;

vrijednost moda je 86, pošto se ova opcija pojavljuje 3 puta, stoga je njena frekvencija najveća.

3) Medijan - vrijednost opcije koja dijeli niz varijacija na pola: na obje njegove strane nalazi se jednak broj opcija. Medijan se, kao i aritmetička sredina i mod, odnosi na prosječne vrijednosti. Označeno kao Ja

4) Prosjek standardna devijacija (sinonimi: standardna devijacija, sigma devijacija, sigma) - mjera varijabilnosti serije varijacija. To je integralni indikator koji objedinjuje sve slučajeve odstupanja od prosjeka. Zapravo, odgovara na pitanje: koliko se i koliko često varijante šire od aritmetičke sredine. Označeno grčkim slovom σ ("sigma").

Ako je veličina populacije veća od 30 jedinica, standardna devijacija se izračunava pomoću sljedeće formule:

Za male populacije - 30 jedinica posmatranja ili manje - standardna devijacija se izračunava koristeći drugu formulu:

Varijacija nazivaju se redovi distribucije konstruisani na kvantitativnoj osnovi. Vrijednosti kvantitativnih karakteristika u pojedinim jedinicama populacije nisu konstantne i međusobno se manje-više razlikuju.

Varijacija- fluktuacija, promjenjivost vrijednosti neke karakteristike među jedinicama stanovništva. Odvojeno numeričke vrijednosti karakteristike pronađene u populaciji koja se proučava nazivaju se opcije vrijednosti. Neuspjeh prosječne veličine Za pune karakteristike populacija nas prisiljava da prosječne vrijednosti dopunimo indikatorima koji nam omogućavaju da procijenimo tipičnost ovih prosjeka mjerenjem varijabilnosti (varijacije) karakteristike koja se proučava.

Prisustvo varijacije je posljedica uticaja velikog broja faktora na formiranje nivoa osobine. Ovi faktori djeluju s nejednakom snagom iu različitim smjerovima. Indeksi varijacije se koriste za opisivanje mjere varijabilnosti osobina.

Zadaci statistička studija varijacije:

  • 1) proučavanje prirode i stepena varijacije karakteristika u pojedinim jedinicama stanovništva;
  • 2) utvrđivanje uloge pojedinih faktora ili njihovih grupa u variranju pojedinih karakteristika populacije.

U statistici se koriste posebne metode za proučavanje varijacije, zasnovane na upotrebi sistema indikatora, With kojim se mjeri varijacija.

Istraživanje varijacija je važno. Mjerenje varijacija je neophodno kada se vrši opservacija uzorka, analiza korelacije i varijanse, itd. Ermolaev O.Yu. Matematička statistika za psihologe: Udžbenik [Tekst]/ O.Yu. Ermolaev. - M.: Izdavačka kuća Flint Moskovskog psihološko-socijalnog instituta, 2012. - 335 str.

Po stepenu varijacije može se suditi o homogenosti populacije, stabilnosti pojedinačnih vrijednosti karakteristika i tipičnosti prosjeka. Na njihovoj osnovi se razvijaju indikatori bliskosti veze između karakteristika i indikatora za procjenu tačnosti posmatranja uzorka.

Pravi se razlika između varijacije u prostoru i varijacije u vremenu.

Varijacija u prostoru se podrazumijeva kao fluktuacija vrijednosti atributa među populacijskim jedinicama koje predstavljaju pojedinačne teritorije. Varijacija tokom vremena znači promjenu vrijednosti karakteristike u različiti periodi vrijeme.

Za proučavanje varijacija u redovima distribucije, sve varijante vrijednosti atributa su raspoređene u rastućem ili opadajućem redoslijedu. Ovaj proces se naziva rangiranje serije.

Najjednostavniji znaci varijacije su minimum i maksimum- najmanje i najveća vrijednost znakova u zbiru. Broj ponavljanja pojedinačnih varijanti vrijednosti karakteristika naziva se frekvencija ponavljanja (fi). Pogodno je zamijeniti frekvencije sa frekvencijama - wi. Učestalost je relativni pokazatelj učestalosti, koji se može izraziti u dijelovima jedinice ili procentima i omogućava poređenje varijantne serije sa različitim brojem zapažanja. Izraženo formulom:

gdje su Xmax, Xmin maksimalne i minimalne vrijednosti karakteristike u agregatu; n - broj grupa.

Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori. TO apsolutni pokazatelji Varijacije uključuju raspon varijacije, prosječnu linearnu devijaciju, disperziju, standardnu ​​devijaciju. Relativni indikatori oscilacije uključuju koeficijent oscilacije, relativno linearno odstupanje i koeficijent varijacije.

Primjer pronalaženja niza varijacija

Vježbajte. Za ovaj uzorak:

  • a) Pronađite varijacioni niz;
  • b) Konstruisati funkciju distribucije;

br.=42. Elementi uzorka:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Rješenje.

  • a) konstrukcija rangirane serije varijacija:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) konstrukcija diskretne serije varijacija.

Izračunajmo broj grupa u nizu varijacija koristeći Sturgessovu formulu:

Uzmimo broj grupa jednak 7.

Znajući broj grupa, izračunavamo veličinu intervala:

Radi praktičnosti konstruisanja tabele, uzet ćemo broj grupa jednak 8, interval će biti 1.

Rice. 1 Obim prodaje robe od strane prodavnice za određeni vremenski period

Varijacijska serija - ovo je statistička serija koja pokazuje distribuciju proučavanog fenomena prema vrijednosti bilo koje kvantitativne karakteristike. Na primjer, pacijenti prema dobi, trajanju liječenja, novorođenčadi po težini itd.

Opcija - pojedinačne vrijednosti karakteristike kojima se vrši grupiranje (označeno V ) .

Učestalost- broj koji pokazuje koliko često se određena opcija pojavljuje (označeno P ) . Pokazuje se zbir svih frekvencija ukupan broj zapažanja i određen je n . Razlika između najveće i najmanje varijante varijacionog niza naziva se raspon ili amplituda .

Postoje serije varijacija:

1. Diskontinuirano (diskretno) i kontinuirano.

Niz se smatra kontinuiranim ako se karakteristika grupisanja može izraziti u razlomcima (težina, visina, itd.), diskontinuiranom ako je karakteristika grupisanja izražena samo kao cijeli broj (dani invaliditeta, broj otkucaja pulsa, itd.) .

2.Jednostavno i uravnoteženo.

Jednostavna varijantna serija je serija u kojoj se kvantitativna vrijednost promjenljive karakteristike javlja jednom. U ponderiranoj seriji varijacija, kvantitativne vrijednosti varijabilne karakteristike se ponavljaju sa određenom učestalošću.

3. Grupirani (intervalni) i negrupisani.

Grupisana serija ima opcije kombinovane u grupe koje ih ujedinjuju po veličini unutar određenog intervala. U negrupisanim serijama, svaka pojedinačna opcija odgovara određenoj frekvenciji.

4. Parni i neparni.

U parnim nizovima varijacija izražava se zbir frekvencija ili ukupan broj opažanja čak broj, u neparnim - neparnim.

5. Simetrično i asimetrično.

U simetričnoj seriji varijacija, sve vrste prosječnih vrijednosti se poklapaju ili su vrlo bliske (mod, medijan, aritmetička sredina).

U zavisnosti od prirode pojava koje se proučavaju, od specifičnih zadataka i ciljeva statističkih istraživanja, kao i od sadržaja izvornog materijala, u sanitarnoj statistici Koriste se sljedeće vrste prosjeka:

strukturna sredstva (mod, medijan);

aritmetička sredina;

harmonijska sredina;

geometrijska sredina;

prosečno progresivna.

Moda (M O ) - vrijednost varirajuće karakteristike, koja se češće sreće u populaciji koja se proučava, tj. opcija koja odgovara najvišoj frekvenciji. Oni ga pronalaze direktno iz strukture varijacionih serija, bez pribjegavanja bilo kakvim proračunima. Obično je to vrijednost vrlo bliska aritmetičkoj sredini i vrlo je zgodna u praksi.

Medijan (M e ) - dijeljenje niza varijacija (rangiranih, tj. vrijednosti opcije su raspoređene u rastućem ili opadajućem redoslijedu) na dvije jednake polovine. Medijan se izračunava pomoću takozvane neparne serije, koja se dobija sekvencijalnim zbrajanjem frekvencija. Ako zbroj frekvencija odgovara parnom broju, tada se aritmetička sredina dvije prosječne vrijednosti konvencionalno uzima kao medijana.

Mod i medijan se koriste u slučaju otvorene populacije, tj. kada najveće ili najmanje opcije nemaju tačne kvantitativne karakteristike (na primjer, do 15 godina, 50 i više, itd.). U ovom slučaju, aritmetička sredina (parametarske karakteristike) se ne može izračunati.

Prosjek Ja sam aritmetičar - najčešća vrijednost. Aritmetička sredina se često označava sa M.

Postoje jednostavne i ponderisane aritmetičke sredine.

Jednostavna aritmetička sredina izračunato:

- u slučajevima kada je populacija predstavljena jednostavnom listom znanja o osobini za svaku jedinicu;

- ako se ne može odrediti broj ponavljanja svake opcije;

- ako je broj ponavljanja svake opcije blizak jedno drugom.

Jednostavna aritmetička sredina izračunava se pomoću formule:

gdje je V - pojedinačne vrijednosti karakteristike; n - broj pojedinačnih vrijednosti;
- znak sumiranja.

Dakle, prosti prosjek je omjer zbira varijanti i broja opservacija.

primjer: odrediti prosječnu dužinu boravka u krevetu za 10 pacijenata sa upalom pluća:

16 dana - 1 pacijent; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

krevet-dan

Ponderisan aritmetički prosjek izračunava se u slučajevima kada se pojedinačne vrijednosti karakteristike ponavljaju. Može se izračunati na dva načina:

1. Direktno (aritmetička sredina ili direktna metoda) prema formuli:

,

gdje je P učestalost (broj slučajeva) opažanja svake opcije.

Dakle, ponderisana aritmetička sredina je odnos zbira proizvoda varijante i učestalosti i broja posmatranja.

2. Izračunavanjem odstupanja od uslovnog prosjeka (pomoću metode momenata).

Osnova za izračunavanje ponderisanog aritmetičkog prosjeka je:

― grupisani materijal prema varijantama kvantitativne karakteristike;

— sve opcije treba da budu raspoređene u rastućem ili opadajućem redosledu vrednosti atributa (rangirani niz).

Za izračunavanje korištenjem metode momenta, preduvjet je ista veličina svih intervala.

Koristeći metodu trenutaka, aritmetička sredina se izračunava pomoću formule:

,

gdje je M o uslovni prosjek, koji se često uzima kao vrijednost karakteristike koja odgovara najvišoj frekvenciji, tj. koji se češće ponavlja (Moda).

i je vrijednost intervala.

a je uslovno odstupanje od uslova prosjeka, koji je uzastopni niz brojeva (1, 2, itd.) sa znakom + za varijante velikih uslovnih prosjeka i sa znakom – (–1, –2, itd. .) za varijante koje su ispod konvencionalnog prosjeka. Uslovno odstupanje od varijante uzeto kao uslovni prosek je 0.

P - frekvencije.

- ukupan broj zapažanja ili n.

primjer: odrediti prosječnu visinu dječaka od 8 godina direktno (tabela 1).

Tabela 1

Visina u cm

dečaci P

Central

opcija V

Centralna opcija - sredina intervala - definirana je kao poluzbroj početnih vrijednosti dvije susjedne grupe:

;
itd.

Proizvod VP se dobija množenjem centralnih varijanti sa frekvencijama
;
itd. Zatim se dodaju i dobiju dobijeni proizvodi
, koji se dijeli sa brojem opažanja (100) i dobije se ponderirana aritmetička sredina.

cm.

Isti problem ćemo riješiti metodom momenata za koju je sastavljena sljedeća tabela 2:

Tabela 2

Visina u cm (V)

dečaci P

n=100

Uzimamo 122 kao M o, jer od 100 posmatranja, 33 osobe imale su visinu od 122 cm. Nalazimo uslovna odstupanja (a) od uslovnog prosjeka u skladu sa gore navedenim. Zatim dobijamo proizvod uslovnih odstupanja po frekvencijama (aP) i zbrojimo dobijene vrednosti (
). Rezultat je 17. Konačno, zamjenjujemo podatke u formulu:

Prilikom proučavanja različite karakteristike, ne može se ograničiti samo na izračunavanje prosječnih vrijednosti. Takođe je potrebno izračunati indikatore koji karakterišu stepen raznolikosti karakteristika koje se proučavaju. Vrijednost jedne ili druge kvantitativne karakteristike nije ista za sve jedinice statističke populacije.

Karakteristika serije varijacija je standardna devijacija ( ), koji pokazuje širenje (disperziju) proučavanih karakteristika u odnosu na aritmetičku sredinu, tj. karakterizira varijabilnost serije varijacija. Može se odrediti direktno pomoću formule:

Standardna devijacija jednaka je kvadratnom korijenu zbroja proizvoda kvadrata odstupanja svake opcije od aritmetičke sredine (V–M) 2 sa njenim frekvencijama podijeljenim sa zbirom frekvencija (
).

Primjer izračuna: odrediti prosječan broj bolovanja izdatih u ambulanti dnevno (tabela 3).

Tabela 3

Broj dana bolovanja

izdati listovi

doktor po danu (V)

Broj ljekara (P)

;

U nazivniku, kada je broj zapažanja manji od 30, potrebno je od
oduzmi jedan.

Ako je red grupiran sa u jednakim intervalima, tada možete odrediti standardnu ​​devijaciju koristeći metodu trenutaka:

,

gdje je i vrijednost intervala;

- uslovno odstupanje od uslovnog prosjeka;

P - varijanta frekvencije odgovarajućih intervala;

- ukupan broj zapažanja.

Primjer izračuna : Odrediti prosječnu dužinu boravka pacijenata na terapijskom krevetu (metodom trenutaka) (tabela 4):

Tabela 4

Broj dana

ostani na krevetu (V)

bolestan (P)

;

Belgijski statističar A. Quetelet je otkrio da se varijacije u fenomenima mase povinuju zakonu raspodjele grešaka, koji su gotovo istovremeno otkrili K. Gauss i P. Laplace. Kriva koja predstavlja ovu distribuciju ima oblik zvona. Prema normalnom zakonu raspodjele, varijabilnost pojedinačnih vrijednosti karakteristike je u granicama
, koji pokriva 99,73% svih jedinica u populaciji.

Izračunato je da ako dodate i oduzmete 2 aritmetičkoj sredini , tada je 95,45% svih članova varijacionog niza unutar dobijenih vrijednosti i, konačno, ako dodamo i oduzmemo 1 aritmetičkoj sredini , tada će 68,27% svih članova ovog varijantnog niza biti unutar dobijenih vrijednosti. U medicini sa veličinom
1povezan sa konceptom norme. Odstupanje od aritmetičke sredine je više od 1 , ali manje od 2 je subnormalan, a odstupanje je veće od 2 abnormalno (iznad ili ispod normale).

U zdravstvenoj statistici, pravilo tri sigma se koristi kada se proučava fizički razvoj, procjenjuje rad zdravstvenih ustanova i procjenjuje zdravlje stanovništva. Isto pravilo se široko koristi u nacionalnoj ekonomiji kada se određuju standardi.

Dakle, standardna devijacija služi za:

— mjerenja disperzije serije varijacije;

— karakteristike stepena raznolikosti karakteristika koje su određene koeficijentom varijacije:

Ako je koeficijent varijacije veći od 20% - jaka raznolikost, od 20 do 10% - prosječna, manje od 10% - slaba raznolikost osobina. Koeficijent varijacije je u određenoj mjeri kriterij za pouzdanost aritmetičke sredine.

Varijacija određuje razlike u vrijednostima karakteristike među različitim jedinicama date populacije u istom periodu (trenutku). Varijacije su uzrokovane različitim uslovima postojanja različitih jedinica stanovništva. Na primjer, čak i blizanci u toku svog života stiču razlike u visini, težini, kao i u karakteristikama kao što su nivo obrazovanja, prihodi, broj djece itd.

Varijacije nastaju kao rezultat činjenice da se same vrijednosti atributa formiraju pod ukupnim utjecajem različitih uvjeta koji na različite načine se kombinuju u svakom pojedinačnom slučaju. Dakle, vrijednost svake opcije je objektivna.

Varijacija je karakteristična na sve pojave prirode i društva, bez izuzetka, osim na zakonom utvrđene normativne vrijednosti pojedinca društvene karakteristike. Studije varijacija u statistici imaju velika vrijednost, pomoći da se shvati suština fenomena koji se proučava. Pronalaženje varijacije, otkrivanje njenih uzroka, utvrđivanje uticaja pojedinačnih faktora daje važna informacija za implementaciju naučno utemeljenih upravljačkih odluka.

Prosječna vrijednost daje generaliziranu karakteristiku karakteristike populacije, ali ne otkriva njenu strukturu. Prosječna vrijednost ne pokazuje kako se varijante prosječne karakteristike nalaze oko nje, da li su raspoređene blizu prosjeka ili odstupaju od njega. Prosjek u dvije populacije može biti isti, ali u jednoj verziji sve pojedinačne vrijednosti se neznatno razlikuju od njega, au drugoj su te razlike velike, tj. u prvom slučaju varijacija karakteristike je mala, au drugom velika, što je veoma važno za karakterizaciju značajnosti prosječne vrijednosti.

Da bi rukovodilac organizacije, menadžer ili istraživač proučavao varijaciju i upravljao njome, statistika je razvila posebne metode za proučavanje varijacija (sistem indikatora). Uz njihovu pomoć pronalazi se varijacija i karakteriziraju njena svojstva. Indikatori varijacije uključuju : opseg varijacije, prosječno linearno odstupanje, koeficijent varijacije.

Varijacijski nizovi i njegovi oblici

Varijacijska serija- ovo je uređena distribucija jedinica populacije, često prema rastućim (rjeđe opadajućim) vrijednostima karakteristike i računajući broj jedinica sa određenom vrijednošću karakteristike. Kada je broj populacijskih jedinica velik, rangirana serija postaje glomazna i njena izgradnja traje dugo. U takvoj situaciji, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava.

Postoje sljedeće oblici varijacije serija :

  1. Rangirana serija predstavlja listu pojedinačnih jedinica populacije u rastućem (opadajućem) redoslijedu karakteristike koja se proučava.
  2. Diskretne serije varijacija - ovo je tabela koja se sastoji od dva reda ili grafikona: specifične vrijednosti varijabilne karakteristike x i broja jedinica populacije sa datom vrijednošću f - frekvencijska karakteristika. Konstruira se kada atribut poprimi najveći broj vrijednosti.
  3. Intervalne serije.

Opseg varijacije je određen kao apsolutna vrijednost razlike između maksimuma i minimalne vrijednosti(varijante) znaka:

Raspon varijacija pokazuje samo ekstremna odstupanja karakteristike i ne odražavaju pojedinačna odstupanja svih opcija u seriji. Karakterizira granice promjene promjenjive karakteristike i ovisi o fluktuacijama dvije ekstremne opcije i apsolutno nije povezan s frekvencijama u nizu varijacija, odnosno s prirodom distribucije, što ovoj vrijednosti daje slučajni karakter. Da biste analizirali varijaciju, potreban vam je indikator koji odražava sve fluktuacije u karakteristikama varijacije i daje opšte karakteristike. Najjednostavniji indikator ovog tipa je prosječno linearno odstupanje.

Nazovimo različite vrijednosti uzorka opcije niz vrijednosti i označite: X 1 , X 2,…. Prije svega ćemo proizvoditi rasponu opcije, tj. njihov raspored u rastućem ili opadajućem redosledu. Za svaku opciju je naznačena sopstvena težina, tj. broj koji karakteriše doprinos date opcije ukupnoj populaciji. Frekvencije ili frekvencije djeluju kao težine.

Frekvencija n i opcija x i je broj koji pokazuje koliko se puta pojavljuje ovu opciju u populaciji uzorka koja se razmatra.

Frekvencija ili relativna frekvencija w i opcija x i je broj jednak omjeru frekvencije varijante prema zbroju frekvencija svih varijanti. Učestalost pokazuje koliki udio jedinica u populaciji uzorka ima datu varijantu.

Niz opcija s njihovim odgovarajućim težinama (frekvencijama ili frekvencijama), napisan u rastućem (ili opadajućem) redoslijedu, naziva se varijantne serije.

Varijacijski nizovi su diskretni i intervalni.

Za diskretnu varijantnu seriju specificiraju se tačkaste vrijednosti karakteristike, za intervalnu seriju karakteristične vrijednosti su navedene u obliku intervala. Varijacijska serija može prikazati distribuciju frekvencija ili relativne frekvencije (frekvencije), ovisno o tome koja je vrijednost naznačena za svaku opciju – frekvencija ili frekvencija.

Diskretna varijantna serija distribucije frekvencije ima oblik:

Frekvencije se nalaze po formuli, i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Primjer 4.1. Za dati skup brojeva

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

konstruirati diskretne varijacijske serije frekvencijskih i frekvencijskih distribucija.

Rješenje . Obim stanovništva je jednak n= 10. Red diskretne frekvencije ima oblik

Intervalne serije imaju sličan oblik snimanja.

Intervalni varijacioni niz distribucije frekvencije je napisano kao:

Zbir svih frekvencija je jednak ukupan broj zapažanja, tj. ukupna zapremina: n = n 1 +n 2 + … + n m.

Interval varijacije serije distribucije relativnih frekvencija (frekvencija) ima oblik:

Frekvencija se nalazi po formuli, i = 1, 2, …, m.

Zbir svih frekvencija jednak je jedan: w 1 +w 2 + … + w m = 1.

U praksi se najčešće koriste intervalne serije. Ako postoji mnogo statističkih podataka uzorka i njihove se vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tada diskretne serije jer će ovi podaci biti prilično glomazni i nezgodni za dalja istraživanja. U ovom slučaju se koristi grupisanje podataka, tj. Interval koji sadrži sve vrijednosti atributa dijeli se na nekoliko parcijalnih intervala i izračunavanjem frekvencije za svaki interval dobija se intervalna serija. Zapišimo detaljnije shemu za konstruiranje intervalnog niza, uz pretpostavku da će dužine parcijalnih intervala biti iste.

2.2 Konstrukcija intervalne serije

Za izradu intervalne serije potrebno vam je:

Odrediti broj intervala;

Odrediti dužinu intervala;

Odredite lokaciju intervala na osi.

Za utvrđivanje broj intervala k Postoji Sturgesova formula prema kojoj

,

Gdje n- zapremina celokupnog agregata.

Na primjer, ako postoji 100 vrijednosti neke karakteristike (varijante), onda se preporučuje da se broj intervala uzme jednak intervalima za konstruiranje intervalne serije.

Međutim, vrlo često u praksi broj intervala bira sam istraživač, vodeći računa da taj broj ne bi trebao biti jako velik kako serija ne bi bila glomazna, ali ni jako mala da se ne bi izgubila neka svojstva distribucija.

Dužina intervala h određena sljedećom formulom:

,

Gdje x max i x min je najveći i najveći male vrijednosti opcije.

Veličina pozvao obim red.

Da bi se sami konstruirali intervali, oni se kreću na različite načine. Jedan od mnogih jednostavne načine je kako slijedi. Za početak prvog intervala se uzima
. Tada se preostale granice intervala nalaze po formuli. Očigledno, kraj posljednjeg intervala a m+1 mora zadovoljiti uslov

Nakon što se pronađu sve granice intervala, određuju se frekvencije (ili frekvencije) ovih intervala. Da biste riješili ovaj problem, pregledajte sve opcije i odredite broj opcija koje spadaju u određeni interval. Pogledajmo kompletnu konstrukciju intervalne serije koristeći primjer.

Primjer 4.2. Za sljedeće statističke podatke, snimljene uzlaznim redoslijedom, konstruirajte intervalni niz sa brojem intervala jednakim 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Rješenje. Ukupno n=50 vrijednosti varijanti.

Broj intervala je preciziran u iskazu problema, tj. k=5.

Dužina intervala je
.

Definirajmo granice intervala:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Da bismo odredili učestalost intervala, brojimo broj opcija koje spadaju u dati interval. Na primjer, prvi interval od 2,5 do 19,5 uključuje opcije 11, 12, 12, 14, 14, 15. Njihov broj je 6, pa je frekvencija prvog intervala n 1 =6. Frekvencija prvog intervala je . Drugi interval od 19,5 do 36,5 uključuje opcije 21, 21, 22, 23, 25, čiji je broj 5. Dakle, učestalost drugog intervala je n 2 =5, i frekvencija . Nakon što smo pronašli frekvencije i frekvencije za sve intervale na sličan način, dobili smo sljedeći intervalni niz.

Intervalni niz frekvencijske distribucije ima oblik:

Zbir frekvencija je 6+5+9+11+8+11=50.

Intervalni niz frekvencijske distribucije ima oblik:

Zbir frekvencija je 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Prilikom konstruisanja intervalnih serija, u zavisnosti od specifičnih uslova problema koji se razmatra, mogu se primeniti i druga pravila, i to

1. Serija varijacija intervala može se sastojati od parcijalnih intervala različitih dužina. Nejednake dužine intervala omogućavaju da se istaknu svojstva statističke populacije s neravnomjernom raspodjelom karakteristike. Na primjer, ako granice intervala određuju broj stanovnika u gradovima, onda je u ovom problemu preporučljivo koristiti intervale nejednake dužine. Očigledno, za ne veliki gradovi Bitna je i mala razlika u broju stanovnika, ali za velike gradove razlika od desetina ili stotina stanovnika nije značajna. Intervalne serije sa nejednakim dužinama parcijalnih intervala proučavaju se uglavnom u opštoj teoriji statistike i njihovo razmatranje je van okvira ovog priručnika.

2. B matematičke statistike ponekad se razmatraju intervalni nizovi za koje se pretpostavlja da je lijeva granica prvog intervala jednaka –∞, a desna granica posljednjeg intervala +∞. Ovo se radi kako bi se približili statistička distribucija na teorijsko.

3. Prilikom konstruisanja intervalnog niza može se ispostaviti da se vrijednost neke opcije tačno poklapa sa granicom intervala. Najbolje što možete učiniti u ovom slučaju je sljedeće. Ako postoji samo jedna takva podudarnost, onda smatrajte da je opcija koja se razmatra sa svojom frekvencijom pala u interval koji se nalazi bliže sredini niza intervala; ako postoji nekoliko takvih opcija, onda su ili sve dodijeljene intervalima na desno od ovih opcija, ili su sve dodijeljene lijevo.

4. Nakon određivanja broja intervala i njihove dužine, raspored intervala se može izvršiti na drugi način. Pronađite aritmetičku sredinu svih razmatranih vrijednosti opcija X Wed i izgraditi prvi interval na takav način da ovaj prosjek uzorka bude unutar nekog intervala. Tako dobijamo interval od X Wed – 0,5 h prije X prosječno + 0,5 h. Zatim lijevo i desno, dodajući dužinu intervala, gradimo preostale intervale do x min i x max neće pasti u prvi i zadnji interval, respektivno.

5. Interval serija na veliki broj Pogodno je pisati intervale okomito, tj. upišite intervale ne u prvi red, već u prvu kolonu, a frekvencije (ili frekvencije) u drugu kolonu.

Podaci uzorka se mogu smatrati vrijednostima neke slučajne varijable X. Slučajna varijabla ima svoj zakon raspodjele. Iz teorije vjerovatnoće je poznato da se zakon raspodjele diskretne slučajne varijable može specificirati u obliku distributivnog niza, a za kontinuirani - korištenjem funkcije gustine raspodjele. Međutim, postoji univerzalni zakon raspodjele koji vrijedi i za diskretne i za kontinuirane slučajne varijable. Ovaj zakon raspodjele je dat kao funkcija raspodjele F(x) = P(X<x). Za uzorke podataka možete odrediti analognu funkciju distribucije - empirijsku funkciju distribucije.


Povezane informacije.


Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”