Statistički sažetak i grupisanje. Statističke distribucijske serije

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Tema 9. Distribucijska serija

Statističke distribucijske serije- ovo je primarna karakteristika masovne statističke populacije, uređena dekompozicija jedinica populacije koja se proučava u grupe prema karakteristikama grupisanja. Svaka statistička serija distribucije sastoji se od dva elementa:

1) pojedinačne vrijednosti različite karakteristike ( opcije );

2) količine koje pokazuju koliko se puta ponavlja ovu opciju (frekvencije ).

Bilješka. Zovu se frekvencije izražene u dijelovima jedinice ili kao postotak ukupne vrijednosti frekvencije ; ovo je izražen broj serija distribucije zbir frekvencija.

Ako se kao osnova za grupisanje uzme kvalitativna karakteristika, onda se takav niz raspodjele naziva atributivno(raspodjela po vrsti rada, spolu, zanimanju, vjeri, nacionalnosti, itd.). Ako je niz distribucije konstruiran na kvantitativnoj osnovi, onda se takav niz naziva varijacijski. Konstruirati varijacijski niz znači organizirati kvantitativnu distribuciju jedinica stanovništva prema karakterističnim vrijednostima, a zatim prebrojati broj jedinica stanovništva s tim vrijednostima (izgraditi grupnu tablicu).

Istaknite tri oblika varijacionih serija:

1) rangirana serija- ovo je distribucija pojedinačnih jedinica populacije u rastućem ili padajućem redoslijedu prema osobini koja se proučava; rangiranje vam omogućava da lako podijelite kvantitativne podatke u grupe, odmah otkrijete najmanje i najveća vrijednost karakteristika, istaknite vrijednosti koje se najčešće ponavljaju; ostali oblici varijantnih serija - grupni stolovi, sastavljen prema prirodi varijacije u vrijednostima karakteristike koja se proučava;

2) diskretne serije- ovo je varijantni niz čija se konstrukcija zasniva na karakteristikama sa diskontinuiranim promjenama, između kojih nema međuvrijednosti (diskretne karakteristike - tarifna kategorija, broj djece u porodici, broj zaposlenih u preduzeću itd. .); ove karakteristike mogu poprimiti samo konačan broj specifičnih vrijednosti;

Diskretna serija predstavlja grupni sto, koji se sastoji od dvije kolone: ​​prva kolona označava konkretnu vrijednost atributa, a druga - broj jedinica u populaciji sa određenom vrijednošću atributa;

3) ako se karakteristika kontinuirano mijenja (iznos prihoda, radni staž, trošak osnovnih sredstava preduzeća itd., koji u određenim granicama može poprimiti bilo koju vrijednost), tada je za ovu karakteristiku potrebno izgraditi intervalne serije (u jednakim ili nejednakim intervalima).

Grupni sto ovdje također ima dvije kolone. Prvi označava vrijednost atributa u intervalu "od - do" (opcije), drugi označava broj jedinica uključenih u interval (učestalost). Vrlo često se tabela dopunjava kolonom u kojoj se izračunavaju akumulirane frekvencije S, koje pokazuju koliko jedinica u populaciji ima karakterističnu vrijednost ne veću od ove vrijednosti. Frekvencije serije f mogu se zamijeniti pojedinostima w, izraženo u relativnim brojevima (udjelima ili procentima). Oni predstavljaju omjer frekvencija svakog intervala prema njihovom ukupnom zbroju (9.1):



(9.1)

Prilikom konstruiranja varijacionog niza sa vrijednostima intervala, prije svega, potrebno je uspostaviti vrijednost intervala i, koji je definiran kao omjer raspona varijacije R i broja grupa n (9.2):

gdje je R = x max - x min; n = 1 + 3,322 logN( Sturgessova formula); N- ukupan broj jedinice stanovništva.

Interval varijantne serije takođe se može konstruisati za karakteristike sa diskretnim varijacijama. Često je u statističkoj studiji neprikladno naznačiti posebnu vrijednost diskretnog atributa, jer ovo otežava razmatranje varijacije u osobini. Stoga se moguće diskretne vrijednosti atributa raspoređuju u grupe i izračunavaju se odgovarajuće frekvencije (partikule). Prilikom izgradnje intervalne serije prema diskretnoj osobini, granice susjednih intervala se ne ponavljaju jedna drugu: sljedeći interval počinje sljedećim po redu (nakon gornje vrijednosti prethodnog intervala) diskretna vrijednost sign.

Kada se uporede frekvencije serije sa nejednakim intervalima, izračunava se gustina distribucije da bi se okarakterisala njihova punoća. Prosječna gustina u intervalu je količnik učestalosti i posebnosti podijeljen vrijednošću intervala. U prvom slučaju, gustina je apsolutna, u drugom – relativna. Prosječna gustina pokazuje koliko jedinica ili postotaka ima po jedinici mjerenja opcija. Frekvencija, posebnost, gustina i akumulirana frekvencija su različite funkcije opcija veličine.

U toku analiza statistički podaci , predstavljen redovima distribucije, pored znanja o prirodi distribucije (ili strukturi stanovništva), mogu se izračunati i različiti statistički pokazatelji ( numeričke karakteristike), koji u generaliziranom obliku odražavaju karakteristike distribucije karakteristika koje se proučavaju. Ove karakteristike (indikatori) se mogu podijeliti u 3 glavne grupe

1) karakteristike distributivnog centra(srednja vrijednost, modus, medijan);

2) karakteristike stepena varijacije(opseg varijacije, prosječna linearna devijacija, disperzija, prosjek standardna devijacija, koeficijent varijacije);

3) karakteristike oblika (vrste) distribucije(indikatori ekscesa i asimetrije, karakteristike ranga, krive distribucije).

Najpouzdaniji način za identifikaciju obrazaca distribucije je sljedeći:
1) povećati broj posmatranih slučajeva (u skladu sa zakonom veliki brojevi, u takvim serijama postoje slučajna odstupanja od opšti obrazac pojedinačne vrijednosti će se poništiti);

2) u početku podijeliti populaciju na maksimalni mogući broj grupa, a zatim, postepeno smanjujući broj grupa, optimizirati grupisanje sa stanovišta identifikacije obrazaca distribucije.

Prilikom implementacije ovog pristupa, obrazac karakterističan za ovu distribuciju će se pojavljivati ​​sve jasnije, i slomljena linija, koji predstavlja poligon, približit će se nekoj glatkoj liniji iu granici bi se trebao pretvoriti u krivu liniju.

Pojedinačne vrijednosti varijabilne osobine koja se proučava, zabilježene kao rezultat promatranja, čine tzv primarni red.

Prvi korak u organizaciji primarne serije je rangiranje. Raspoređivanjem vrijednosti karakteristike primarne serije, na primjer, u rastućem redoslijedu, dobijamo rangirana serija.

Razmotrimo primarne serije dobijene prilikom registracije nivoa kvalifikacija radnika

Rangirana serija će izgledati ovako:

S obzirom na ovu rangiranu seriju, vidimo da se neke karakteristične vrijednosti ponavljaju među različitim radnicima (jedinicama stanovništva).

Formulirajmo rezultate opažanja kompaktnije, pridajući svakoj vrijednosti atributa u skladu sa brojem jedinica u populaciji koje imaju iste vrijednosti znakovi. Za naš primjer imamo:

Dobijamo rangiranu (uređenu) seriju koja karakteriše distribucija karakteristika koju proučavaju jedinice stanovništva. U statistici se takve serije obično nazivaju redovi distribucije.

Sa dovoljno velikim brojem jedinica stanovništva, čak i za nekontinuirano posmatranje, gore navedeni redosled podataka posmatranja može biti glomazan. Stoga je takvo rangiranje obično praćeno grupiranjem i sažetkom. Proučavana karakteristika u ovom slučaju je grupa.

Odavde opšta definicija:

Statističke serije raspodjele su uređeni raspored jedinica populacije koja se proučava u grupe prema karakteristikama grupisanja.

Svaka statistička serija distribucije sastoji se od dva elementa:

A) od naređenih vrijednosti karakteristike ili opcija;

B) broj jedinica u populaciji koje imaju date vrijednosti, tzv frekvencije. Zovu se frekvencije izražene u dijelovima jedinice ili kao postotak ukupne vrijednosti frekvencije.

Dakle, opcija je zasebna vrijednost (ili varijanta odvojena grupa) varijabilne karakteristike, koju uzima u seriji distribucije. Kada govorimo o frekvencijama, moramo imati na umu da zbir frekvencija čini obim populacije koja se proučava (ili, drugim riječima, volumen serije distribucije).

Slovo “X” obično označava varijantu karakteristike, a slovo f označava frekvenciju.

Po svom sadržaju karakteristike mogu biti atributivne ili kvantitativne.

Redovi distribucije konstruisani prema atributivnim (ili kvalitativnim) karakteristikama nazivaju se serija distribucije atributa.

Na primjer, raspodjela studenata po obliku studija, po fakultetima, po specijalnostima itd.

Redovi distribucije konstruisani na osnovu kvantitativnih karakteristika nazivaju se varijantne serije.

Na primjer, raspodjela zaposlenih po stažu, po nivou plate, produktivnost rada itd.

Karakteristike koje se proučavaju u statistici se mijenjaju.

Po prirodi promjene (varijacije) vrijednosti razlikuju se znakovi:

A) znakovi sa kontinuiranom promjenom;

B) znakovi sa kontinuiranom promjenom.

Znakovi s diskontinuiranim promjenama može uzeti samo konačan broj specifičnih vrijednosti (na primjer, tarifna kategorija radnika, broj strojeva, itd.).

Znakovi sa kontinuiranom promjenom može poprimiti bilo koje vrijednosti u određenim granicama (na primjer, radni staž, plata, kilometraža vozila itd.)

Prema načinu gradnje razlikuju se diskretna (diskontinuirana) varijantna serija zasnovana na diskontinuiranoj varijaciji karakteristike i intervalna (kontinuirana) serija zasnovana na kontinuiranoj promjeni vrijednosti karakteristike.

Prilikom konstruiranja diskretne serije varijacija u prvoj koloni (liniji) su naznačene specifične vrijednosti svake pojedinačne vrijednosti atributa (tj. svake opcije), a u drugoj koloni (liniji) - frekvencije ili frekvencije.

Na primjer, serija koja karakterizira distribuciju radnika po tarifnim kategorijama.

Prilikom konstruiranja intervalne varijacione serije Pojedinačne vrijednosti opcije su naznačene u vrijednostima "od - do".

Intervali se mogu uzeti ili jednaki ili nejednaki. Za svaku od njih su naznačene učestalosti i učestalosti (tj. apsolutni ili relativni broj populacijskih jedinica za koje je vrijednost varijanti unutar datog intervala).

Prvi i zadnji interval serije u mnogim slučajevima se uzimaju kao otvoreni, tj. za prvi interval je naznačena samo gornja granica (“do...”), a za posljednji samo donja granica (“od ... i iznad”, “iznad...”). Upotreba otvorenih intervala je zgodna kada u zbiru postoji mali broj jedinica, sa vrlo malim ili vrlo velike vrijednosti karakteristika, oštro različita od svih ostalih vrijednosti.

Prilikom konstruiranja intervalnih varijacionih serija postavlja se pitanje na koji broj grupa treba podijeliti materijal statističko posmatranje i pitanje veličine intervala svake pojedinačne grupe.

Ova pitanja su već istražena u metodi grupisanja (vidi temu 3). Tamo su također razmatrana pitanja važna za sastavljanje intervalne serije, kao što su:

1) Određivanje početka intervala;

2) Brojanje frekvencije.

Treba imati na umu da se nizovi intervalnih varijacija mogu konstruisati i za karakteristike sa diskretnom varijacijom. Često je u statističkoj studiji neprikladno naznačiti posebnu vrijednost diskretnog atributa, jer ovo otežava razmatranje varijacije u osobini. Stoga se moguće diskretne vrijednosti atributa raspoređuju u grupe i izračunavaju se odgovarajuće frekvencije (frekvencije).

Kada se konstruiše niz intervala na osnovu diskretnog atributa, granice susjednih intervala se ne ponavljaju: sljedeći interval počinje sljedećom po redu (nakon gornje vrijednosti prethodnog intervala) diskretnom vrijednošću atributa.

Da biste izračunali generalizirane karakteristike distribucijskih serija, možete koristiti i frekvencije i frekvencije.

Frekvencije kao razlomci jedinice: w1=f1/∑f, w2=f2/∑f, itd.

Frekvencije u procentima w1=(f1/∑f)*100, w2=(f2/∑f)*100, itd.


Povezane informacije.


Prikazani su u obliku distributivnih serija i predstavljeni su u obliku.

Distribucijska serija je jedna od vrsta grupiranja.

Raspon distribucije— predstavlja uređenu raspodjelu jedinica populacije koja se proučava u grupe prema određenim varijabilnim karakteristikama.

Ovisno o karakteristikama na kojima se formira distribucijski niz, razlikuju se atributivne i varijacione redovi distribucije:

  • Atributivno- nazivaju se redovi distribucije konstruisani prema kvalitativnim karakteristikama.
  • Redovi distribucije konstruirani uzlaznim ili silaznim redoslijedom vrijednosti kvantitativne karakteristike nazivaju se varijacijski.
Varijaciona serija distribucije sastoji se od dva stupca:

Prva kolona daje kvantitativne vrijednosti varijabilnih karakteristika koje se nazivaju opcije i naznačeni su. Diskretna opcija - izražena kao cijeli broj. Opcija intervala se kreće od i do. Ovisno o vrsti opcija, možete konstruirati diskretnu ili intervalnu seriju varijacija.
Druga kolona sadrži broj određene opcije, izraženo u terminima frekvencija ili frekvencija:

Frekvencije- to su apsolutni brojevi koji pokazuju koliko puta se data vrijednost neke karakteristike pojavljuje u agregatu, koji označavaju . Zbir svih frekvencija mora biti jednak broju jedinica u cijeloj populaciji.

Frekvencije() su frekvencije izražene kao procenat ukupnog broja. Zbir svih frekvencija izraženih u procentima mora biti jednak 100% u razlomcima od jedan.

Grafički prikaz distributivnih serija

Distribucijske serije su vizualno predstavljene pomoću grafičkih slika.

Serija distribucije je prikazana kao:
  • Poligon
  • Histogrami
  • Kumulira
  • Ogives

Poligon

Prilikom konstruiranja poligona, vrijednosti varijabilne karakteristike se iscrtavaju na horizontalnoj osi (x-osa), a frekvencije ili frekvencije se crtaju na vertikalnoj osi (y-osa).

Poligon na sl. 6.1 je zasnovan na podacima mikropopisa stanovništva Rusije 1994. godine.

6.1. Distribucija veličine domaćinstva

Stanje: Dati su podaci o raspodjeli 25 zaposlenih u jednom od preduzeća po tarifnim kategorijama:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Zadatak: Konstruirajte diskretnu seriju varijacija i prikažite je grafički kao poligon distribucije.
Rješenje:
IN u ovom primjeru opcija je tarifna kategorija zaposlenog. Za određivanje učestalosti potrebno je izračunati broj zaposlenih sa odgovarajućom tarifnom kategorijom.

Poligon se koristi za diskretne serije varijacija.

Da bismo konstruirali poligon distribucije (Slika 1), crtamo kvantitativne vrijednosti varijabilnih karakteristika - varijanti - duž ose apscise (X), a frekvencije ili frekvencije duž ose ordinate.

Ako su vrijednosti neke karakteristike izražene u obliku intervala, onda se takav niz naziva interval.
Intervalne serije distribucije su prikazane grafički u obliku histograma, kumulata ili oliva.

Statistička tabela

Stanje: Podaci o visini depozita su dati 20 pojedinci u jednoj banci (hiljadu rubalja) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Zadatak: Konstruirajte niz intervalnih varijacija sa jednakim intervalima.
Rješenje:

  1. Početna populacija se sastoji od 20 jedinica (N = 20).
  2. Koristeći Sturgessovu formulu, određujemo potreban iznos korištene grupe: n=1+3,322*lg20=5
  3. Izračunajmo vrijednost jednak interval: i=(152 - 2) /5 = 30 hiljada rubalja
  4. Podijelimo početnu populaciju u 5 grupa sa intervalom od 30 hiljada rubalja.
  5. Rezultate grupisanja predstavljamo u tabeli:

Kod takvog snimanja kontinuirane karakteristike, kada se ista vrijednost javlja dva puta (kao gornja granica jednog intervala i donja granica drugog intervala), tada ova vrijednost spada u grupu u kojoj ova vrijednost djeluje kao gornja granica.

trakasti grafikon

Za konstruiranje histograma, vrijednosti granica intervala su naznačene duž osi apscise i na temelju njih se konstruiraju pravokutnici čija je visina proporcionalna frekvencijama (ili frekvencijama).

Na sl. 6.2. prikazuje histogram distribucije ruskog stanovništva 1997. godine po starosnim grupama.

Rice. 6.2. Distribucija ruskog stanovništva po starosnim grupama

Stanje: Dat je raspored 30 zaposlenih u kompaniji po mjesečnoj plati

Zadatak: Grafički prikažite niz varijacija intervala u obliku histograma i kumulirajte.
Rješenje:

  1. Nepoznata granica otvorenog (prvog) intervala određena je vrijednošću drugog intervala: 7000 - 5000 = 2000 rubalja. Sa istom vrijednošću nalazimo donju granicu prvog intervala: 5000 - 2000 = 3000 rubalja.
  2. Da bismo konstruirali histogram u pravokutnom koordinatnom sistemu, crtamo duž apscisne ose segmente čije vrijednosti odgovaraju intervalima varikozne serije.
    Ovi segmenti služe kao donja baza, a odgovarajuća frekvencija (frekvencija) služi kao visina formiranih pravougaonika.
  3. Napravimo histogram:

Za konstruisanje kumulata potrebno je izračunati akumulirane frekvencije (frekvencije). One se određuju sekvencijalnim zbrajanjem učestalosti (učestalosti) prethodnih intervala i označavaju se S. Akumulirane frekvencije pokazuju koliko jedinica populacije ima karakterističnu vrijednost ne veću od one koja se razmatra.

Kumulira

Distribucija karakteristike u nizu varijacija prema akumuliranim frekvencijama (frekvencijama) prikazana je pomoću kumulata.

Kumulira ili se kumulativna kriva, za razliku od poligona, konstruira iz akumuliranih frekvencija ili frekvencija. U ovom slučaju, vrijednosti karakteristike se postavljaju na os apscise, a akumulirane frekvencije ili frekvencije se postavljaju na os ordinate (slika 6.3).

Rice. 6.3. Kumulati distribucije veličine domaćinstva

4. Izračunajmo akumulirane frekvencije:
Kumulativna frekvencija prvog intervala se izračunava na sljedeći način: 0 + 4 = 4, za drugi: 4 + 12 = 16; za treći: 4 + 12 + 8 = 24, itd.

Prilikom konstruiranja kumulata, akumulirana frekvencija (frekvencija) odgovarajućeg intervala dodjeljuje se njegovoj gornjoj granici:

Ogiva

Ogiva je konstruisan slično kumulatu s jedinom razlikom što se akumulirane frekvencije postavljaju na os apscise, a karakteristične vrijednosti na os ordinate.

Tip kumulata je krivulja koncentracije ili Lorentzov dijagram. Za konstruiranje krivulje koncentracije na obje ose pravokutnog koordinatnog sistema iscrtava se skala u procentima od 0 do 100. Istovremeno, akumulirane frekvencije su naznačene na osi apscise, a akumulirane vrijednosti udjela (u procentima) po zapremini karakteristike su naznačene na osi ordinata.

Ujednačena distribucija karakteristike odgovara dijagonali kvadrata na grafu (slika 6.4). Sa neujednačenom distribucijom, graf predstavlja konkavnu krivulju u zavisnosti od nivoa koncentracije osobine.

6.4. Kriva koncentracije

Najvažnija faza u proučavanju društveno-ekonomskih pojava i procesa je sistematizacija primarnih podataka i, na osnovu toga, dobijanje zbirne karakteristike cjelokupnog objekta korištenjem općih indikatora, što se postiže sumiranjem i grupiranjem primarne statističke građe.

Statistički sažetak - je kompleks sekvencijalnih operacija za generalizaciju specifičnih pojedinačnih činjenica koje formiraju skup radi identifikacije tipične karakteristike i obrasce svojstvene fenomenu koji se proučava u cjelini. Provođenje statističkog sažetka uključuje sljedeće korake :

  • izbor karakteristika grupisanja;
  • utvrđivanje redosleda formiranja grupe;
  • razvoj sistema statističkih indikatora za karakterizaciju grupa i objekta u cjelini;
  • razvoj statističkih tabela za predstavljanje zbirnih rezultata.

Statističko grupisanje naziva se podjela jedinica populacije koja se proučava u homogene grupe prema određenim karakteristikama bitnim za njih. Grupacije su najvažniji statistički metod za sumiranje statističkih podataka, osnova za pravilno izračunavanje statističkih pokazatelja.

Razlikovati sledeće vrste grupisanja: tipološka, ​​strukturalna, analitička. Sve ove grupacije objedinjuje činjenica da su jedinice objekta podijeljene u grupe prema nekim karakteristikama.

Funkcija grupisanja je karakteristika po kojoj se jedinice populacije dijele u posebne grupe. Od pravi izbor Karakteristika grupiranja zavisi od zaključaka statističke studije. Kao osnovu za grupisanje potrebno je koristiti značajne, teorijski zasnovane karakteristike (kvantitativne ili kvalitativne).

Kvantitativne karakteristike grupisanja imaju numerički izraz (obim trgovine, starost osobe, prihod porodice, itd.), i kvalitativni znaci grupisanja odražavaju stanje jedinice stanovništva (pol, Porodični status, granska pripadnost preduzeća, njegov oblik vlasništva itd.).

Nakon što se utvrdi osnova grupisanja, mora se odlučiti o broju grupa u koje treba podijeliti populaciju koja se proučava. Broj grupa zavisi od ciljeva studije i tipa indikatora koji leži u osnovi grupisanja, obima populacije i stepena varijacije karakteristike.

Na primjer, grupisanje preduzeća prema vrsti vlasništva uzima u obzir opštinsku, federalnu i federalnu imovinu. Ako se grupisanje vrši na kvantitativnoj osnovi, onda je potrebno preokrenuti Posebna pažnja o broju jedinica objekta koji se proučava i stepenu varijabilnosti karakteristike grupisanja.

Nakon što je određen broj grupa, moraju se odrediti intervali grupisanja. Interval - to su vrijednosti različite karakteristike koje se nalaze unutar određenih granica. Svaki interval ima svoju vrijednost, gornju i donju granicu ili barem jednu od njih.

Donja granica intervala naziva se najmanja vrijednost karakteristike u intervalu, i gornja granica - najveća vrijednost karakteristike u intervalu. Vrijednost intervala je razlika između gornje i donje granice.

Intervali grupisanja, ovisno o njihovoj veličini, su: jednaki i nejednaki. Ako se varijacija neke karakteristike manifestira unutar relativno uskih granica i distribucija je ujednačena, tada se grupa gradi u jednakim intervalima. Vrijednost jednakog intervala određena je sljedećom formulom :

gdje je Xmax, Xmin - maksimum i minimalna vrijednost karakteristike u agregatu; n - broj grupa.

Najjednostavnije grupisanje u kojem je svaka odabrana grupa okarakterisana jednim indikatorom predstavlja seriju distribucije.

Statističke distribucijske serije - ovo je uređena raspodjela jedinica stanovništva u grupe prema određenoj osobini. U zavisnosti od karakteristike na kojoj se formira distribucioni niz, razlikuju se atributivni i varijacioni distributivni redovi.

Atributivno nazivaju se distributivni nizovi izgrađeni prema kvalitativnim karakteristikama, odnosno karakteristikama koje nemaju numerički izraz(distribucija po vrsti rada, po polu, po zanimanju itd.). Redovi atributa distribucije karakterišu sastav stanovništva prema određenim bitnim karakteristikama. Preuzeti kroz nekoliko perioda, ovi podaci omogućavaju proučavanje promjena u strukturi.

Varijabilne serije nazivaju se redovi distribucije konstruisani na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija. Opcije nazivaju se pojedinačne vrijednosti karakteristike koje uzima u nizu varijacija, odnosno specifična vrijednost varijabilne karakteristike.

Frekvencije nazivaju se brojevi pojedinačnih varijanti ili svake grupe varijantnog niza, odnosno to su brojevi koji pokazuju koliko se često pojedine varijante pojavljuju u distributivnom nizu. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen. Frekvencije nazivaju se frekvencije izražene u dijelovima jedinice ili kao postotak ukupne vrijednosti. Prema tome, zbir frekvencija je jednak 1 ili 100%.

U zavisnosti od prirode varijacije neke karakteristike razlikuju se tri oblika varijacionih serija: rangirani niz, diskretni niz i intervalni niz.

Serija rangiranih varijacija - ovo je raspodjela pojedinačnih jedinica populacije u rastućem ili padajućem redoslijedu karakteristike koja se proučava. Rangiranje vam omogućava da lako podijelite kvantitativne podatke u grupe, odmah otkrijete najmanje i najveće vrijednosti karakteristike i istaknete vrijednosti koje se najčešće ponavljaju.

Diskretne serije varijacija karakterizira raspodjelu jedinica stanovništva prema diskretnoj karakteristici koja uzima samo cjelobrojne vrijednosti. Na primjer, tarifna kategorija, broj djece u porodici, broj zaposlenih u preduzeću itd.

Ako karakteristika ima kontinuiranu promjenu, koja u određenim granicama može poprimiti bilo koje vrijednosti („od - do“), tada je za ovu karakteristiku potrebno izgraditi intervalne varijacione serije . Na primjer, iznos prihoda, radni staž, trošak osnovnih sredstava preduzeća itd.

Primjeri rješavanja zadataka na temu “Statistički sažetak i grupiranje”

Problem 1 . Postoje podaci o broju knjiga koje su studenti dobili putem pretplate u protekloj akademskoj godini.

Konstruirajte rangirane i diskretne serije distribucije varijacija, označavajući elemente serije.

Rješenje

Ovaj set predstavlja mnogo opcija za broj knjiga koje studenti dobijaju. Izbrojimo broj takvih opcija i uredimo ih u obliku varijacijskih rangiranih i varijacijskih diskretnih distribucijskih serija.

Problem 2 . Postoje podaci o troškovima osnovnih sredstava za 50 preduzeća, hiljada rubalja.

Konstruirajte seriju distribucije, naglašavajući 5 grupa preduzeća (u jednakim intervalima).

Rješenje

Za rješavanje biramo najveće i najmanju vrijednost vrijednost osnovnih sredstava preduzeća. To su 30,0 i 10,2 hiljade rubalja.

Nađimo veličinu intervala: h = (30,0-10,2):5= 3,96 hiljada rubalja.

Tada će prva grupa uključivati ​​preduzeća čija osnovna sredstva iznose od 10,2 hiljade rubalja. do 10,2+3,96=14,16 hiljada rubalja. Takvih preduzeća biće 9. U drugu grupu biće preduzeća čija osnovna sredstva iznose od 14,16 hiljada rubalja. do 14,16+3,96=18,12 hiljada rubalja. Takvih preduzeća će biti 16. Slično tome, naći ćemo i broj preduzeća uključenih u treću, četvrtu i petu grupu.

Rezultirajuću seriju distribucije stavljamo u tabelu.

Problem 3 . Po redu preduzeća lake industrije industrija je dobila sljedeće podatke:

Grupirajte preduzeća po broju radnika, formirajući 6 grupa u jednakim intervalima. Izračunajte za svaku grupu:

1. broj preduzeća
2. broj radnika
3. obim proizvedenih proizvoda godišnje
4. prosječna stvarna proizvodnja po radniku
5. obim osnovnih sredstava
6. prosječna veličina osnovnih sredstava jednog preduzeća
7. prosječna vrijednost proizvoda koje proizvodi jedno preduzeće

Rezultate proračuna prikažite u tabelama. Izvucite zaključke.

Rješenje

Za rješavanje izabraćemo najveću i najmanju vrijednost prosječnog broja radnika u preduzeću. To su 43 i 256.

Nađimo veličinu intervala: h = (256-43):6 = 35,5

Tada će u prvu grupu spadati preduzeća čiji je prosječan broj radnika od 43 do 43 + 35,5 = 78,5 ljudi. Takvih preduzeća biće 5. U drugu grupu biće preduzeća čiji će prosečan broj radnika biti od 78,5 do 78,5+35,5=114 ljudi. Takvih preduzeća će biti 12. Slično tome, naći ćemo i broj preduzeća uključenih u treću, četvrtu, petu i šestu grupu.

Rezultirajuću seriju distribucije stavljamo u tabelu i izračunavamo potrebne indikatore za svaku grupu:

Zaključak : Kao što se vidi iz tabele, druga grupa preduzeća je najbrojnija. Uključuje 12 preduzeća. Najmanje grupe su peta i šesta grupa (po dva preduzeća). Ovo su najveća preduzeća (po broju radnika).

Budući da je druga grupa najveća, obim proizvoda koje godišnje proizvode preduzeća ove grupe i obim osnovnih sredstava znatno su veći od ostalih. Istovremeno, prosječna stvarna proizvodnja po radniku u preduzećima ove grupe nije najveća. Preduzeća četvrte grupe tu prednjače. Ova grupa takođe čini prilično veliki obim osnovnih sredstava.

U zaključku, napominjemo da su prosječna veličina osnovnih sredstava i prosječan iznos proizvodnje jednog preduzeća direktno proporcionalni veličini preduzeća (u smislu broja radnika).

SVRURUSKA DOPISKA

FINANSIJSKO-EKONOMSKI INSTITUT

NASTAVNI RAD

DISCIPLINOM

"STATISTIKA"

TEMA: "STATISTIČKE DISTRIBUCIONE SERIJE, NJIHOVA ZNAČAJ I PRIMENA U STATISTICI"

Završeno: student

grupe 01FFB

Vorobiev V.A.

2003 .

Uvod. 3

1. Pojam statističkih serija distribucije, njihove vrste. 5

1.1. Serija distribucije atributa. 6

1.2. Varijabilne distribucijske serije. 7

1.3. Izračunavanje prosjeka 9

1.4. Izračunavanje moda i medijana 10

1.5. Grafička slika statistički podaci 12

1.6. Izračunavanje indeksa varijacije 16

2. Računski dio 18

3. Analitički dio 24

Zaključak. 28

Literatura 29

UVOD

Statističke serije distribucije su jedan od najvažnijih elemenata statistike. Oni predstavljaju komponenta metoda statistički izvještaji i grupisanja, ali, zapravo, nijedno od statističkih studija ne može se izvesti bez inicijalne prezentacije informacija dobijenih kao rezultat statističkog posmatranja u obliku statističkih serija distribucije.

Primarni podaci se obrađuju kako bi se dobile generalizovane karakteristike proučavane pojave prema vrsti bitnih karakteristika za dalju analizu i predviđanje; vrši se sažetak i grupisanje; statistički podaci se prikazuju korištenjem redova distribucije u tabelama, zbog čega se informacije prikazuju u vizualnom, racionalnom obliku, pogodnom za korištenje i daljnje istraživanje; Različiti tipovi grafova su napravljeni za najvizuelniju percepciju i analizu informacija. Na osnovu statističkih serija distribucije izračunavaju se glavne količine statističkih istraživanja: indeksi, koeficijenti; apsolutne, relativne, prosječne vrijednosti itd., uz pomoć kojih se može izvršiti prognoza kao konačni rezultat statističkog istraživanja.

Relevantnost ove teme je zbog činjenice da su statističke distributivne serije osnovni metoda za svakoga Statistička analiza. Razumijevanje ovu metodu a veštine za njegovo korišćenje su neophodne za sprovođenje statističkih istraživanja.

Teorijski dio nastavnog rada pokriva sljedeće aspekte:

1) Pojam statističkih serija distribucije, njihove vrste;

2) serije distribucije atributa i varijacija;

3) Izračunavanje prosječnih vrijednosti, moda i medijana;

4) Grafički prikaz distributivnih serija;

Računski dio nastavnog rada uključuje rješavanje zadatka na temu iz verzije računskog zadatka:

1. Rad sa tabelom “Odabrani podaci o prosječnom godišnjem trošku osnovnih sredstava”

Analitički dio rada uključuje izračunavanje prosječnih vrijednosti, modova i medijana na osnovu podataka prikazanih u tabeli „Rezultati ankete uzorka budžeta stanovništva Ruske Federacije“, koja prikazuje distribuciju stanovništva Ruske Federacije. po prosječnom dohotku po glavi stanovnika. Kao izvor statističkih podataka korišten je Ruski statistički godišnjak. Statistički zbornik 2001".

Prilikom rada sa tabelarnim podacima korišćen je personalni računar sa sledećom konfiguracijom: procesor Intel Pentium Seleron 848 MHz, 128 MB RAM, Microsoft Windows XP Professional verzija 2000, Excel procesor tabela Microsoft Office 2000.

Prilikom pisanja rad na kursu korišteni udžbenici osnovni kurs, dalje čitanje i internet resursi.

1. POJAM STATISTIČKIH DISTRIBUCIJSKIH NIZOVA I NJIHOVE VRSTE.

Rezultati sažimanja i grupisanja materijala statističkih opservacija prikazani su u obliku statističkih serija distribucije. Statističke serije raspodjele predstavljaju uređenu raspodjelu jedinica populacije koja se proučava u grupe prema grupisanju (varijantnim) karakteristikama. Oni karakteriziraju sastav (strukturu) fenomena koji se proučava, omogućavaju nam da prosudimo homogenost populacije, granice njene promjene i obrasce razvoja promatranog objekta. U zavisnosti od karakteristike, statističke distributivne serije se dele na:

Atributivno (kvalitativno);

Varijabilno (kvantitativno)

a) diskretno;

b) interval.

1.1. Serija distribucije atributa

Atributivni nizovi se formiraju prema kvalitativnim karakteristikama, a to mogu biti položaj radnika u trgovini, profesija, pol, obrazovanje itd.

Tabela 1.

Distribucija zaposlenih u preduzeću prema obrazovanju .

U ovom primeru, karakteristika grupisanja je obrazovanje zaposlenih u preduzeću (viša, srednja). Ove distribucijske serije su atributivne, budući da varirajuća karakteristika nije predstavljena kvantitativnom, već indikatori kvaliteta. Najveći broj radnici sa srednjom stručnom spremom (oko 40%); preostali zaposleni su podeljeni u grupe prema ovom kvalitativnom kriterijumu: sa prosekom specijalno obrazovanje- 25%; sa nepotpunim visokim obrazovanjem - 20%; sa najvišim - 15%.

1.2. Varijabilne distribucijske serije

Varijacijski nizovi se konstruiraju na osnovu kvantitativne karakteristike grupisanja. Varijacijski nizovi se sastoje od dva elementa: varijante i frekvencije.

Varijanta je posebna vrijednost varijabilne karakteristike koju uzima u seriji distribucije. Mogu biti pozitivne i negativne, apsolutne i relativne. Učestalost je broj pojedinačnih varijanti ili svake grupe serije varijacija. Frekvencije izražene u dijelovima jedinice ili kao postotak od ukupnog broja nazivaju se frekvencije. Zbir frekvencija naziva se volumen populacije i određuje broj elemenata cijele populacije.

Frekvencije su frekvencije izražene kao relativne vrijednosti (razlomci jedinica ili postoci). Zbir frekvencija jednak je jedan ili 100%. Zamjena frekvencija frekvencijama omogućava da se uporede serije varijacija s različitim brojem opažanja.

Varijacijski nizovi, ovisno o prirodi varijacije, dijele se na diskretne (diskontinuirane) i intervalne (kontinuirane). Diskretne distribucijske serije su zasnovane na diskretnim (diskontinuiranim) karakteristikama koje imaju samo cjelobrojne vrijednosti (na primjer, tarifna kategorija radnika, broj djece u porodici).

Intervalne distribucijske serije su bazirane na vrijednosti atributa koji se kontinuirano mijenja, koji prihvata sve (uključujući i frakcione) kvantitativne izraze, tj. vrijednost karakteristika u takvim serijama je specificirana kao interval.

Ako ima dovoljno velika količina varijante vrijednosti atributa, primarni niz je teško vizualizirati, a njegovo direktno ispitivanje ne daje ideju o raspodjeli jedinica prema vrijednosti atributa u agregatu. Stoga je prvi korak u redoslijedu primarne serije njeno rangiranje – sređivanje svih opcija u rastućem (opadajućem) redoslijedu.

Za gradnju diskretne serije sa malim brojem opcija, sve opcije koje se pojavljuju za vrijednosti atributa se zapisuju

, a zatim se izračunava učestalost ponavljanja varijante. Serija distribucije se obično sastavlja u obliku tabele koja se sastoji od dva stupca (ili reda), od kojih jedan predstavlja opcije, a drugi - frekvencije.

Za konstruisanje niza distribucija karakteristika koje se kontinuirano mijenjaju, ili diskretnih predstavljenih u obliku intervala, potrebno je uspostaviti optimalan broj grupa (intervala) na koje treba podijeliti sve jedinice populacije koja se proučava.

1.3. Izračunavanje prosječnih vrijednosti.

U pravilu se prosječne vrijednosti izračunavaju kako bi se dobile generalizirane kvantitativne karakteristike nivoa bilo koje promjenjive karakteristike na osnovu skupa jedinica određene pojave ili procesa koje su homogene po svojim osnovnim svojstvima. U statistici, svi prosjeci su označeni sa `X. Postoji nekoliko vrsta prosjeka.

Basic prosječne veličine je zakon prosječne moći. izgleda ovako:

gdje je `X prosječna vrijednost;

X - promjena vrijednosti varijanti atributa;

n - broj karakteristika ili opcija;

m je eksponent prosjeka.

U zavisnosti od vrijednosti prosječnog eksponenta, on ima sljedeće oblike:

A). Aritmetička sredina je neponderisana, gde je m = 1. Ima oblik.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”