Kako konstruisati intervalnu statističku seriju. Algoritam za konstruisanje intervalne varijacione serije sa jednakim intervalima

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Za diskretne karakteristike se konstruiše diskretna serija varijacija.

Da biste konstruirali diskretnu varijantnu seriju, potrebno je izvršiti sljedeće korake: 1) rasporediti jedinice posmatranja u rastućem redoslijedu proučavane vrijednosti karakteristike,

2) odrediti sve moguće vrijednosti atributa x i, rasporediti ih u rastućem redoslijedu,

vrijednost atributa, i .

učestalost vrijednosti atributa i označiti f i . Zbir svih frekvencija serije jednak je broju elemenata u populaciji koja se proučava.

Primjer 1 .

Spisak ocjena koje su studenti dobili na ispitima: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Evo broja X - razredje diskretna slučajna varijabla, a rezultirajuća lista procjena jestatistički (uočljivi) podaci .

    rasporediti jedinice posmatranja uzlaznim redoslijedom prema vrijednosti proučavane karakteristike:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) odredite sve moguće vrijednosti atributa x i, poredajte ih uzlaznim redoslijedom:

IN u ovom primjeru sve procjene se mogu podijeliti u četiri grupe sa sljedećim vrijednostima: 2; 3; 4; 5.

Značenje slučajna varijabla, što odgovara posebnoj grupi posmatranih podataka, naziva se vrijednost atributa, opciju (opciju) i označiti x i .

Poziva se broj koji pokazuje koliko puta se odgovarajuća vrijednost neke karakteristike pojavljuje u određenom broju zapažanja učestalost vrijednosti atributa i označiti f i .

Za naš primjer

rezultat 2 se javlja - 8 puta,

rezultat 3 se javlja - 12 puta,

rezultat 4 se javlja - 23 puta,

rezultat 5 se javlja - 17 puta.

Ukupno ima 60 ocjena.

4) primljene podatke upisati u tabelu od dva reda (kolone) - x i i f i.

Na osnovu ovih podataka moguće je konstruisati diskretni varijacioni niz

Diskretne serije varijacija – ovo je tabela u kojoj su prisutne vrijednosti karakteristike koja se proučava prikazane kao pojedinačne vrijednosti u rastućem redoslijedu i njihove frekvencije

  1. Konstrukcija intervalne varijacione serije

Pored diskretnih varijantne serije Uobičajeni način grupisanja podataka je niz intervalnih varijacija.

Intervalni niz se konstruiše ako:

    znak ima kontinuiranu prirodu promjene;

    Bilo je puno diskretnih vrijednosti (više od 10)

    frekvencije diskretne vrijednosti vrlo mali (ne prelazi 1-3 sa relativno većim brojem jedinica posmatranja);

    mnoge diskretne vrijednosti karakteristike sa istim frekvencijama.

Intervalna varijantna serija je način grupisanja podataka u obliku tablice koja ima dvije kolone (vrijednosti karakteristike u obliku intervala vrijednosti i učestalost svakog intervala).

Za razliku od diskretnog niza vrijednosti atributa intervalne serije nisu predstavljeni pojedinačnim vrijednostima, već intervalom vrijednosti („od - do“).

Poziva se broj koji pokazuje koliko je jedinica posmatranja upalo u svaki odabrani interval učestalost vrijednosti atributa i označiti f i . Zbir svih frekvencija serije jednak je broju elemenata (jedinica posmatranja) u populaciji koja se proučava.

Ako jedinica ima karakterističnu vrijednost jednaku gornjoj granici intervala, tada je treba dodijeliti sljedećem intervalu.

Na primjer, dijete visine 100 cm će pasti u 2. interval, a ne u prvi; a dijete visine 130 cm će pasti u posljednji interval, a ne u treći.

Na osnovu ovih podataka može se konstruisati niz intervalnih varijacija.

Svaki interval ima donju granicu (xn), gornju granicu (xv) i širinu intervala ( i).

Granica intervala je vrijednost atributa koja leži na granici dva intervala.

visina djece (cm)

visina djece (cm)

količina djece

više od 130

Ako interval ima gornju i donju granicu, onda se zove zatvoreni interval. Ako interval ima samo donju ili samo gornju granicu, onda je - otvoreni interval. Samo prvi ili poslednji interval može biti otvoren. U gornjem primjeru, posljednji interval je otvoren.

Širina intervala (i) – razlika između gornje i donje granice.

i = x n - x in

Pretpostavlja se da je širina otvorenog intervala ista kao i širina susjednog zatvorenog intervala.

visina djece (cm)

količina djece

Širina intervala (i)

za proračune 130+20=150

20 (jer je širina susjednog zatvorenog intervala 20)

Sve intervalne serije dijele se na intervalne serije sa u jednakim intervalima i intervalne serije sa nejednakim intervalima . U razmaknutim redovima sa jednakim intervalima, širina svih intervala je ista. U intervalnim serijama sa nejednakim intervalima širina intervala je različita.

U primjeru koji se razmatra - intervalni niz sa nejednakim intervalima.

Prikazani su u obliku distributivnih serija i predstavljeni su u obliku.

Distribucijska serija je jedna od vrsta grupiranja.

Raspon distribucije— predstavlja uređenu raspodjelu jedinica populacije koja se proučava u grupe prema određenim varijabilnim karakteristikama.

Ovisno o karakteristikama na kojima se formira distribucijski niz, razlikuju se atributivne i varijacione redovi distribucije:

  • Atributivno- nazivaju se redovi distribucije konstruisani prema kvalitativnim karakteristikama.
  • Redovi distribucije konstruirani uzlaznim ili silaznim redoslijedom vrijednosti kvantitativne karakteristike nazivaju se varijacijski.
Varijaciona serija distribucije sastoji se od dva stupca:

Prva kolona daje kvantitativne vrijednosti varijabilnih karakteristika koje se nazivaju opcije i naznačeni su. Diskretna opcija - izražena kao cijeli broj. Opcija intervala se kreće od i do. Ovisno o vrsti opcija, možete konstruirati diskretnu ili intervalnu seriju varijacija.
Druga kolona sadrži broj određene opcije, izraženo u terminima frekvencija ili frekvencija:

Frekvencije- to su apsolutni brojevi koji pokazuju koliko puta se data vrijednost neke karakteristike pojavljuje u agregatu, koji označavaju . Zbir svih frekvencija mora biti jednak broju jedinica u cijeloj populaciji.

Frekvencije() su frekvencije izražene kao procenat ukupnog broja. Zbir svih frekvencija izraženih u procentima mora biti jednak 100% u razlomcima od jedan.

Grafički prikaz distributivnih serija

Distribucijske serije su vizualno predstavljene pomoću grafičkih slika.

Serija distribucije je prikazana kao:
  • Poligon
  • Histogrami
  • Kumulira
  • Ogives

Poligon

Prilikom konstruiranja poligona, vrijednosti varijabilne karakteristike se iscrtavaju na horizontalnoj osi (x-osa), a frekvencije ili frekvencije se crtaju na vertikalnoj osi (y-osa).

Poligon na sl. 6.1 je zasnovan na podacima mikropopisa stanovništva Rusije 1994. godine.

6.1. Distribucija veličine domaćinstva

Stanje: Dati su podaci o raspodjeli 25 zaposlenih u jednom od preduzeća po tarifnim kategorijama:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Zadatak: Konstruirajte diskretnu seriju varijacija i prikažite je grafički kao poligon distribucije.
Rješenje:
U ovom primjeru, opcije su platni razred zaposlenog. Za određivanje učestalosti potrebno je izračunati broj zaposlenih sa odgovarajućom tarifnom kategorijom.

Poligon se koristi za diskretne serije varijacija.

Da bismo konstruirali poligon distribucije (Slika 1), crtamo kvantitativne vrijednosti varijabilnih karakteristika - varijanti - duž ose apscise (X), a frekvencije ili frekvencije duž ose ordinate.

Ako su vrijednosti neke karakteristike izražene u obliku intervala, onda se takav niz naziva interval.
Intervalne serije distribucije su prikazane grafički u obliku histograma, kumulata ili oliva.

Statistička tabela

Stanje: Podaci o visini depozita su dati 20 pojedinci u jednoj banci (hiljadu rubalja) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Zadatak: Konstruirajte niz intervalnih varijacija sa jednakim intervalima.
Rješenje:

  1. Početna populacija se sastoji od 20 jedinica (N = 20).
  2. Koristeći Sturgessovu formulu, određujemo potreban iznos korištene grupe: n=1+3,322*lg20=5
  3. Izračunajmo vrijednost jednakog intervala: i=(152 - 2) /5 = 30 hiljada rubalja
  4. Podijelimo početnu populaciju u 5 grupa sa intervalom od 30 hiljada rubalja.
  5. Rezultate grupisanja predstavljamo u tabeli:

Kod takvog snimanja kontinuirane karakteristike, kada se ista vrijednost javlja dva puta (kao gornja granica jednog intervala i donja granica drugog intervala), tada ova vrijednost spada u grupu u kojoj ova vrijednost djeluje kao gornja granica.

trakasti grafikon

Za konstruiranje histograma, vrijednosti granica intervala su naznačene duž osi apscise i na temelju njih se konstruiraju pravokutnici čija je visina proporcionalna frekvencijama (ili frekvencijama).

Na sl. 6.2. prikazuje histogram distribucije ruskog stanovništva 1997. godine po starosnim grupama.

Rice. 6.2. Distribucija ruskog stanovništva po starosnim grupama

Stanje: Dat je raspored 30 zaposlenih u kompaniji po mjesečnoj plati

Zadatak: Grafički prikažite niz varijacija intervala u obliku histograma i kumulirajte.
Rješenje:

  1. Nepoznata granica otvorenog (prvog) intervala određena je vrijednošću drugog intervala: 7000 - 5000 = 2000 rubalja. Sa istom vrijednošću nalazimo donju granicu prvog intervala: 5000 - 2000 = 3000 rubalja.
  2. Da bismo konstruirali histogram u pravokutnom koordinatnom sistemu, crtamo duž apscisne ose segmente čije vrijednosti odgovaraju intervalima varikozne serije.
    Ovi segmenti služe kao donja baza, a odgovarajuća frekvencija (frekvencija) služi kao visina formiranih pravougaonika.
  3. Napravimo histogram:

Za konstruisanje kumulata potrebno je izračunati akumulirane frekvencije (frekvencije). One se određuju sekvencijalnim zbrajanjem učestalosti (učestalosti) prethodnih intervala i označavaju se S. Akumulirane frekvencije pokazuju koliko jedinica populacije ima karakterističnu vrijednost ne veću od one koja se razmatra.

Kumulira

Distribucija karakteristike u nizu varijacija prema akumuliranim frekvencijama (frekvencijama) prikazana je pomoću kumulata.

Kumulira ili se kumulativna kriva, za razliku od poligona, konstruira iz akumuliranih frekvencija ili frekvencija. U ovom slučaju, vrijednosti karakteristike se postavljaju na os apscise, a akumulirane frekvencije ili frekvencije se postavljaju na os ordinate (slika 6.3).

Rice. 6.3. Kumulati distribucije veličine domaćinstva

4. Izračunajmo akumulirane frekvencije:
Kumulativna frekvencija prvog intervala se izračunava na sljedeći način: 0 + 4 = 4, za drugi: 4 + 12 = 16; za treći: 4 + 12 + 8 = 24, itd.

Prilikom konstruiranja kumulata, akumulirana frekvencija (frekvencija) odgovarajućeg intervala dodjeljuje se njegovoj gornjoj granici:

Ogiva

Ogiva je konstruisan slično kumulatu s jedinom razlikom što se akumulirane frekvencije postavljaju na os apscise, a karakteristične vrijednosti na os ordinate.

Tip kumulata je krivulja koncentracije ili Lorentzov dijagram. Za konstruiranje krivulje koncentracije, na obje ose pravokutnog koordinatnog sistema iscrtava se skala u procentima od 0 do 100. Istovremeno, akumulirane frekvencije su naznačene na osi apscise, a akumulirane vrijednosti udjela (u procentima) po zapremini karakteristike su naznačene na osi ordinata.

Ujednačena distribucija karakteristike odgovara dijagonali kvadrata na grafu (slika 6.4). Sa neujednačenom distribucijom, graf predstavlja konkavnu krivulju u zavisnosti od nivoa koncentracije osobine.

6.4. Kriva koncentracije Grupisanje- ovo je podjela populacije na grupe koje su homogene prema nekom svojstvu.

Svrha usluge. Koristeći online kalkulator možete:

  • izgraditi seriju varijacija, izgraditi histogram i poligon;
  • pronaći indikatore varijacije (prosjek, način (uključujući i grafički), medijan, raspon varijacije, kvartili, decili, kvartilni koeficijent diferencijacije, koeficijent varijacije i drugi indikatori);

Instrukcije. Da biste grupisali niz, morate odabrati vrstu dobivene serije varijacija (diskretna ili intervalna) i navesti količinu podataka (broj redova). Rezultirajuće rješenje se pohranjuje u Word datoteku (pogledajte primjer grupiranja statističkih podataka).

Broj ulaznih podataka
",0);">

Ako je grupisanje već izvršeno i diskretne serije varijacija ili intervalne serije, tada trebate koristiti online kalkulator Indeksi varijacije. Testiranje hipoteze o vrsti distribucije vrši se korištenjem usluge Proučavanje obrasca distribucije.

Vrste statističkih grupa

Varijacijska serija. U slučaju posmatranja diskretne slučajne varijable, ista se vrijednost može naići nekoliko puta. Takve vrijednosti x i slučajne varijable se bilježe pokazujući n i koliko se puta pojavljuje u n opservacijama, ovo je učestalost ove vrijednosti.
U slučaju kontinuirane slučajne varijable, u praksi se koristi grupisanje.
  1. Tipološko grupisanje- ovo je podjela kvalitativno heterogene populacije koja se proučava na klase, socio-ekonomske tipove, homogene grupe jedinica. Da biste izgradili ovo grupiranje, koristite parametar Diskretne serije varijacija.
  2. Grupacija se naziva strukturalna, u kojem je homogena populacija podijeljena u grupe koje karakteriziraju njenu strukturu prema nekim varijabilnim karakteristikama. Da biste izgradili ovo grupiranje, koristite parametar serije Interval.
  3. Grupiranje koje otkriva odnose između fenomena koji se proučavaju i njihovih karakteristika naziva se analitička grupa(vidi analitičko grupisanje serija).

Principi za konstruisanje statističkih grupa

Niz zapažanja poredanih uzlaznim redom naziva se serija varijacija. Funkcija grupisanja je karakteristika po kojoj se populacija dijeli na odvojene grupe. Zove se osnova grupe. Grupisanje se može zasnivati ​​i na kvantitativnim i na kvalitativnim karakteristikama.
Nakon utvrđivanja osnove grupisanja, treba odlučiti o broju grupa na koje treba podijeliti populaciju koja se proučava.

Prilikom korišćenja personalnih računara za obradu statističkih podataka, grupisanje objektnih jedinica vrši se standardnim procedurama.
Jedan takav postupak temelji se na korištenju Sturgessove formule za određivanje optimalnog broja grupa:

k = 1+3,322*log(N)

Gdje je k broj grupa, N je broj populacijskih jedinica.

Dužina parcijalnih intervala se izračunava kao h=(x max -x min)/k

Zatim se broji broj opažanja koja spadaju u ove intervale, koji se uzimaju kao frekvencije n i . Nekoliko frekvencija, čije su vrijednosti manje od 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Kao nove vrijednosti uzimaju se srednje vrijednosti intervala x i =(c i-1 +c i)/2.

Pozicioniranje podataka statističko posmatranje, karakterizirajući ovu ili onu pojavu, prije svega ih je potrebno naručiti, tj. daju sistematski karakter

engleski statističar. UJReichman je o neuređenim zbirkama slikovito rekao da je susret s masom negeneraliziranih podataka ekvivalentan situaciji u kojoj je osoba bačena u gustiš bez kompasa. Kakva je sistematizacija statističkih podataka u obliku distributivnih serija?

Statističke serije distribucija su uređeni statistički agregati (tablica 17). Najjednostavniji tip statističke serije distribucije je rangirana serija, tj. niz brojeva u rastućem ili opadajućem redosledu, koji variraju karakteristike. Ovakva serija ne dozvoljava da se sudi o obrascima koji su svojstveni distribuiranim podacima: koja vrednost ima grupisanu većinu indikatora, kakva odstupanja postoje od ove vrednosti; kao velika slika distribucije. U tu svrhu, podaci se grupišu, pokazujući koliko se često pojedina zapažanja javljaju u ukupnom broju (Shema 1a 1).

. Tabela 17

. Opšti oblik statističke serije distribucije

. Šema 1. Statistička šema distribucijske serije

Raspodjela jedinica stanovništva prema karakteristikama koje nemaju kvantitativni izraz naziva se atributivne serije(na primjer, distribucija preduzeća prema njihovoj proizvodnoj oblasti)

Serije distribucije jedinica stanovništva prema karakteristikama, koje imaju kvantitativni izraz, nazivaju se varijantne serije. U takvim serijama vrijednosti karakteristike (opcije) su u rastućem ili opadajućem redoslijedu

U seriji varijacione distribucije razlikuju se dva elementa: varijanta i frekvencija . Opcija- ovo je posebno značenje karakteristika grupisanja frekvencija- broj koji pokazuje koliko puta se svaka opcija pojavljuje

IN matematičke statistike izračunava se još jedan element serije varijacija - djelimično. Potonji se definira kao omjer učestalosti slučajeva datog intervala i ukupnog zbira frekvencija; dio se određuje u dijelovima jedinice, postocima (%) u ppm (% o)

Dakle, serija distribucije varijacija je serija u kojoj su opcije raspoređene u rastućem ili opadajućem redoslijedu, a njihove frekvencije ili frekvencije su naznačene. Varijacijski nizovi su diskretni (intervali) i ostali intervali (kontinuirani).

. Diskretne serije varijacija- to su distributivni nizovi u kojima varijanta kao vrijednost kvantitativne karakteristike može poprimiti samo određenu vrijednost. Opcije se razlikuju jedna od druge za jednu ili više jedinica

Dakle, broj dijelova proizvedenih po smjeni od strane određenog radnika može se izraziti samo jednim određenim brojem (6, 10, 12, itd.). Primjer diskretne serije varijacija može biti raspodjela radnika prema broju proizvedenih dijelova (Tablica 18 18).

. Tabela 18

. Diskretna serijska distribucija _

. Intervalna (kontinuirana) serija varijacija- takve distribucijske serije u kojima su vrijednosti opcija date u obliku intervala, tj. vrijednosti karakteristika mogu se razlikovati jedna od druge za proizvoljno mali iznos. Kada se konstruiše varijantni niz karakteristika NEP perivarijanta, nemoguće je navesti svaku vrednost varijante, pa je populacija raspoređena po intervalima. Potonji mogu biti jednaki ili nejednaki. Za svaku od njih su naznačene frekvencije ili frekvencije (Tabela 1 9 19).

U intervalnim serijama distribucije sa nejednakim intervalima, izračunavaju se matematičke karakteristike kao što su gustina distribucije i relativna gustina distribucije na datom intervalu. Prva karakteristika je određena omjerom frekvencije prema vrijednosti istog intervala, druga - odnosom frekvencije prema vrijednosti istog intervala. Za gornji primjer, gustina distribucije u prvom intervalu će biti 3: 5 = 0,6, a relativna gustina u ovom intervalu je 7,5: 5 = 1,55%.

. Tabela 19

. Intervalne distribucijske serije _

U mnogim slučajevima, kada statistička populacija uključuje veliki ili, još više, beskonačan broj varijanti, što se najčešće dešava uz kontinuirane varijacije, praktično je nemoguće i nepraktično formirati grupu jedinica za svaku varijantu. U takvim slučajevima, kombinovanje statističkih jedinica u grupe moguće je samo na osnovu intervala, tj. takva grupa koja ima određene granice za vrijednosti različite karakteristike. Ove granice su označene sa dva broja koja označavaju gornju i donju granicu svake grupe. Korištenje intervala dovodi do formiranja intervalne serije raspodjele.

Interval rad je varijacioni niz čije su varijante predstavljene u obliku intervala.

Intervalni niz se može formirati sa jednakim i nejednakim intervalima, dok izbor principa za konstruisanje ove serije zavisi uglavnom od stepena reprezentativnosti i pogodnosti statističke populacije. Ako je populacija dovoljno velika (reprezentativna) po broju jedinica i potpuno je homogena po svom sastavu, onda je preporučljivo formiranje intervalne serije bazirati na jednakosti intervala. Obično se, koristeći ovaj princip, formira intervalna serija za one populacije kod kojih je raspon varijacije relativno mali, tj. maksimalne i minimalne opcije se obično nekoliko puta razlikuju jedna od druge. U ovom slučaju, vrijednost jednakih intervala se izračunava omjerom raspona varijacije karakteristike prema datom broju formiranih intervala. Odrediti jednako I interval, može se koristiti Sturgessova formula (obično sa malim varijacijama u karakteristikama intervala i veliki broj jedinice u statističkom agregatu):

gdje je x i - jednaka vrijednost intervala; X max, X min - maksimalne i minimalne opcije u statističkom agregatu; n . - broj jedinica u agregatu.

Primjer. Preporučljivo je izračunati veličinu jednakog intervala prema gustoći radioaktivne kontaminacije cezijem - 137 u 100 naselja Krasnopoljskog okruga Mogiljevske regije, ako je poznato da je početna (minimalna) opcija jednaka I km / km 2, finale ( maksimalno) - 65 ki/km 2. Koristeći formulu 5.1. dobijamo:

Shodno tome, da bi se formirao intervalni niz sa jednakim intervalima u smislu gustine kontaminacije cezijem - 137 naselja u Krasnopoljskom regionu, veličina jednakog intervala može biti 8 ki/km 2 .

U uslovima neravnomerne distribucije, tj. kada su maksimalne i minimalne opcije stotine puta, pri formiranju intervalne serije možete primijeniti princip nejednako intervalima. Nejednaki intervali se obično povećavaju kako se krećemo velike vrijednosti sign.

Oblik intervala može biti zatvoren ili otvoren. Zatvoreno Uobičajeno je da se pozivaju intervali koji imaju i donju i gornju granicu. Otvori intervali imaju samo jednu granicu: u prvom intervalu postoji gornja granica, u posljednjem je donja granica.

Preporučljivo je vrednovati intervalne serije, posebno sa nejednakim intervalima, uzimajući u obzir gustina distribucije, najjednostavniji način da izračunate koji je omjer lokalne frekvencije (ili frekvencije) i veličine intervala.

Da biste praktično formirali intervalnu seriju, možete koristiti izgled tabele. 5.3.

Tabela 5.3. Postupak formiranja intervalne serije naselja u Krasnopoljskom regionu prema gustini radioaktivne kontaminacije cezijem –137

Glavna prednost intervalne serije je njen maksimum kompaktnost. istovremeno, u nizu intervalne distribucije, pojedinačne varijante karakteristike su skrivene u odgovarajućim intervalima

Kada se grafički prikazuje intervalni niz u sistemu pravokutnih koordinata, gornje granice intervala se iscrtavaju na osi apscise, a lokalne frekvencije niza na osi ordinata. Grafička konstrukcija intervalne serije razlikuje se od konstrukcije poligona distribucije po tome što svaki interval ima donju i gornju granicu, a dvije apscise odgovaraju jednoj vrijednosti ordinate. Dakle, na grafu niza intervala nije označena tačka, kao u poligonu, već linija koja spaja dvije tačke. Ove horizontalne linije su međusobno povezane vertikalnim linijama i dobija se lik stepenastog poligona, koji se obično naziva histogram distribucija (slika 5.3).

At grafička konstrukcija intervalne serije preko dovoljno velike statističke populacije, histogram se približava simetrično oblik distribucije. U onim slučajevima kada je statistička populacija po pravilu mala, asimetrično trakasti grafikon.

U nekim slučajevima je preporučljivo formirati veći broj akumuliranih frekvencija, tj. kumulativno red. Kumulativni niz može se formirati na osnovu diskretne ili intervalne serije raspodjele. Kada je grafički prikazan kumulativne serije u sistemu pravougaonih koordinata, varijante su iscrtane na osi apscisa, a akumulirane frekvencije (frekvencije) su iscrtane na osi ordinata. Rezultirajuća kriva linija se obično naziva kumulativno distribucija (slika 5.4).

Formiranje i grafička slika razne vrste Varijaciona serija doprinosi pojednostavljenom proračunu glavnih statističkih karakteristika, koje su detaljno obrađene u temi 6, pomaže da se bolje razume suština zakona distribucije statističke populacije. Analiza serije varijacija dobiva posebno značenje u slučajevima kada je potrebno identifikovati i pratiti odnos između opcija i frekvencija (frekvencija). Ova zavisnost se manifestuje u činjenici da je broj predmeta po opciji na određeni način povezan sa veličinom ove opcije, tj. sa povećanjem vrijednosti promjenjive karakteristike, frekvencije (frekvencije) ovih vrijednosti doživljavaju određene, sistematske promjene. To znači da brojevi u stupcu frekvencije (frekvencije) ne fluktuiraju haotično, već se mijenjaju u određenom smjeru, određenim redoslijedom i redoslijedom.

Ako frekvencije pokazuju određenu sistematičnost u svojim promjenama, onda to znači da smo na putu da identifikujemo obrazac. Sistem, red, redosled u promenama frekvencije je odraz opštih uzroka, opšti uslovi, karakterističan za cjelokupnu populaciju.

Ne treba pretpostaviti da je obrazac distribucije uvijek dat u gotovom obliku. Postoji dosta serija varijacija u kojima frekvencije bizarno skaču, ponekad rastu, ponekad opadaju. U takvim slučajevima, preporučljivo je saznati s kakvom se distribucijom istraživač bavi: ili ova distribucija uopće nema inherentne obrasce ili njena priroda još nije otkrivena: prvi slučaj je rijedak, ali drugi slučaj je prilično česta i vrlo raširena pojava.

Dakle, prilikom formiranja intervalne serije ukupan broj statističke jedinice mogu biti male, a svaki interval sadrži mali broj opcija (na primjer, 1-3 jedinice). U takvim slučajevima ne može se računati na ispoljavanje bilo kakvog obrasca. Da bi se na osnovu nasumičnih opažanja dobio prirodni rezultat, potrebno je da zakon stupi na snagu veliki brojevi, tj. tako da za svaki interval ne bi bilo nekoliko, već desetine i stotine statističkih jedinica. U tu svrhu moramo pokušati povećati broj zapažanja što je više moguće. Ovo je najviše na pravi način otkrivanje obrazaca u masovnim procesima. ako se ne čini prava prilika povećati broj opservacija, tada se identifikacija obrasca može postići smanjenjem broja intervala u seriji distribucije. Smanjenjem broja intervala u nizu varijacija, povećava se broj frekvencija u svakom intervalu. To znači da su slučajne fluktuacije svakog od njih statistička jedinica preklapaju jedni druge, "izglađuju", pretvarajući se u uzorak.

Formiranje i konstrukcija varijacionih serija omogućava nam da dobijemo samo opštu, približnu sliku distribucije statističke populacije. Na primjer, histogram samo u grubom obliku izražava odnos između vrijednosti karakteristike i njenih frekvencija (frekvencija). Stoga su varijacioni nizovi u suštini samo osnova za dalje, dubinsko proučavanje unutrašnje pravilnosti statike. distribucija.

TEST PITANJA ZA TEMU 5

1. Šta je varijacija? Šta uzrokuje varijacije u osobini u statističkoj populaciji?

2. Koje vrste varirajućih karakteristika se mogu pojaviti u statistici?

3. Šta je varijacioni niz? Koje vrste varijacionih serija mogu postojati?

4. Šta je rangirana serija? Koje su njegove prednosti i mane?

5. Šta je diskretne serije i koje su njegove prednosti i mane?

6. Kakav je postupak formiranja intervalnog niza, koje su njegove prednosti i nedostaci?

7. Šta je grafički prikaz rangiranih, diskretnih, intervalnih serija distribucije?

8. Šta je kumulat distribucije i šta ga karakteriše?

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”