Algoritam za konstruisanje intervalne varijacione serije sa jednakim intervalima.

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Prilikom obrade velikih količina informacija, što je posebno važno pri izvođenju savremenih naučnih razvoja, istraživač se suočava sa ozbiljnim zadatkom pravilnog grupisanja izvornih podataka. Ako su podaci po prirodi diskretni, onda, kao što smo vidjeli, ne nastaju nikakvi problemi - samo trebate izračunati učestalost svake karakteristike. Ako karakteristika koja se proučava ima kontinuirano karakter (ono što ima veća distribucija u praksi), tada odabir optimalnog broja intervala grupisanja karakteristika nikako nije trivijalan zadatak.

Za grupisanje kontinuiranih slučajnih varijabli, cijeli raspon varijacije karakteristike se dijeli na određeni broj intervala To.

Grupirani interval (kontinuirano) varijantne serije nazivaju se intervali rangirani po vrijednosti atributa (), gdje su brojevi opažanja koja spadaju u r"-ti interval, ili relativne frekvencije (), naznačeni zajedno sa odgovarajućim frekvencijama ():

Intervali karakterističnih vrijednosti

mi frekvencija

trakasti grafikon I kumulirati (ogiva), o kojima smo već detaljno raspravljali, odlično su sredstvo za vizualizaciju podataka, koje vam omogućava da dobijete primarnu ideju o strukturi podataka. Takvi grafovi (slika 1.15) se konstruišu za kontinuirane podatke na isti način kao i za diskretne podatke, samo uzimajući u obzir činjenicu da kontinuirani podaci u potpunosti ispunjavaju područje njihovih mogućih vrijednosti, uzimajući bilo koje vrijednosti.

Rice. 1.15.

Zbog toga stupci na histogramu i kumulatu moraju se dodirivati ​​i nemaju područja u kojima vrijednosti atributa ne spadaju u sve moguće(tj. histogram i kumulati ne bi trebali imati „rupe“ duž ose apscise, koje ne sadrže vrijednosti varijable koja se proučava, kao na slici 1.16). Visina trake odgovara učestalosti – broju zapažanja u datom intervalu, ili relativnoj frekvenciji – proporciji zapažanja. Intervali ne smije se ukrštati i obično su iste širine.

Rice. 1.16.

Histogram i poligon su aproksimacije krivulje gustine vjerovatnoće ( diferencijalna funkcija) f(x) teorijska raspodjela, razmatrana u okviru teorije vjerovatnoće. Stoga je njihova konstrukcija toliko važna u primarnoj statističkoj obradi kvantitativnih kontinuiranih podataka – po njihovom izgledu može se suditi o hipotetičkom zakonu raspodjele.

Kumulati – kriva akumuliranih frekvencija (frekvencija) intervala varijantne serije. Grafikon kumulativne funkcije raspodjele uspoređuje se s kumulatom F(x), o kojoj se također govori u okviru kursa teorije vjerovatnoće.

U osnovi, koncepti histograma i kumulata su posebno povezani sa kontinuiranim podacima i njihovim intervalnim serijama varijacije, budući da su njihovi grafikoni empirijske procjene funkcije gustoće vjerovatnoće i funkcije distribucije, respektivno.

Konstrukcija intervalne varijacione serije počinje određivanjem broja intervala k. A ovaj zadatak je možda najteži, najvažniji i kontroverzni u pitanju koje se proučava.

Broj intervala ne bi trebao biti premali, jer će to učiniti histogram previše glatkim ( preglađen), gubi sve karakteristike varijabilnosti originalnih podataka - na sl. 1.17 možete vidjeti kako isti podaci na kojima su prikazani grafovi na Sl. 1.15, koji se koristi za konstruisanje histograma sa manjim brojem intervala (lijevi grafikon).

U isto vrijeme, broj intervala ne bi trebao biti prevelik - inače nećemo moći procijeniti gustinu distribucije proučavanih podataka duž numeričke ose: histogram će biti nedovoljno izglađen. (podjednačeno), sa praznim intervalima, neujednačeni (vidi sliku 1.17, desni grafikon).

Rice. 1.17.

Kako odrediti najpoželjniji broj intervala?

Još 1926. godine Herbert Sturges je predložio formulu za izračunavanje broja intervala na koje je potrebno podijeliti izvorni skup vrijednosti karakteristike koja se proučava. Ova formula je zaista postala izuzetno popularna – većina statističkih udžbenika je nudi, a mnogi statistički paketi je koriste po defaultu. Koliko je to opravdano iu svim slučajevima veoma je ozbiljno pitanje.

Dakle, na čemu se zasniva Sturgesova formula?

Razmotrimo binomnu distribuciju, čija gornja granica uključuje zadnji broj rangirana serija.

Gradimo intervalni niz (tabela 2.3).

Intervalna serija distribucije firmi i prosječan broj menadžera u jednom od regiona Ruske Federacije u prvom kvartalu izvještajne godine

Zaključak. Najveća grupa preduzeća je grupa sa prosječnim brojem menadžera od 25-30 ljudi, koja uključuje 8 firmi (27%); Najmanja grupa sa prosječnim brojem menadžera od 40-45 ljudi uključuje samo jedno preduzeće (3%).

Koristeći početne podatke iz tab. 2.1, kao i intervalni niz distribucije firmi po broju menadžera (tabela 2.3), potrebno izgraditi analitičko grupisanje odnosa između broja menadžera i obima prodaje firmi i na osnovu toga izvesti zaključak o prisustvu (ili odsustvu) veze između ovih karakteristika.

Rješenje:

Analitičko grupisanje se zasniva na faktorskim karakteristikama. U našem zadatku faktorska karakteristika (x) je broj menadžera, a rezultujuća karakteristika (y) je obim prodaje (tabela 2.4).

Hajde da gradimo sada analitičko grupisanje(Tabela 2.5).

Zaključak. Na osnovu podataka konstruisanog analitičkog grupisanja, možemo reći da sa povećanjem broja menadžera prodaje raste i prosječan obim prodaje preduzeća u grupi, što ukazuje na postojanje direktne veze između ovih karakteristika.

Tabela 2.4

Pomoćna tabela za konstruisanje analitičkog grupisanja

Broj menadžera, ljudi,

Broj kompanije

Obim prodaje, milioni rubalja, god

" = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

at = ’ =10,31 30

Tabela 2.5

Zavisnost obima prodaje od broja menadžera kompanije u jednoj od regija Ruske Federacije u prvom kvartalu izvještajne godine

KONTROLNA PITANJA
  • 1. Šta je suština statističkog posmatranja?
  • 2. Navedite faze statističkog posmatranja.
  • 3. Koji su organizacioni oblici statističkog posmatranja?
  • 4. Navedite vrste statističkog posmatranja.
  • 5. Šta je statistički sažetak?
  • 6. Navedite vrste statističkih izvještaja.
  • 7. Šta je statističko grupisanje?
  • 8. Navedite vrste statističkih grupa.
  • 9. Šta je distributivna serija?
  • 10. Imenujte strukturne elemente distributivnog reda.
  • 11. Koja je procedura za konstruisanje serije distribucije?

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”