Konstrukcija rangiranih, intervalnih i kumulativnih serija. Statistički sažetak i grupisanje

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Prilikom rada sa podacima, često postoji potreba da se otkrije koje mjesto određeni indikator zauzima u zbirnoj listi u smislu veličine. U statistici se to zove rangiranje. Excel ima alate koji korisnicima omogućavaju brzo i jednostavno izvođenje ove procedure. Hajde da saznamo kako ih koristiti.

Funkcije rangiranja

Za obavljanje rangiranja u Excelu predviđene su posebne funkcije. U starijim verzijama aplikacije postojao je jedan operater dizajniran da riješi ovaj problem - RANK. Iz razloga kompatibilnosti, ostavljen je u posebnoj kategoriji formula u modernim verzijama programa, ali u njima je ipak preporučljivo raditi s novijim analogama, ako je moguće. To uključuje statističke operatere RANK.RV i RANK.SR. O razlikama i algoritmu za rad s njima ćemo dalje govoriti.

Metoda 1: funkcija RANK.RV

Operator RANG.RV obrađuje podatke i šalje ih u navedenu ćeliju serijski broj dati argument iz agregatne liste. Ako nekoliko vrijednosti ima isti nivo, tada operator prikazuje najvišu vrijednost sa liste. Ako, na primjer, dvije vrijednosti imaju istu vrijednost, tada će objema biti dodijeljen drugi broj, a sljedeća najveća vrijednost će imati četvrti broj. Inače, RANK operator radi isto u starijim verzijama Excela, pa se ove funkcije mogu smatrati identičnima.

Sintaksa ovog operatora je napisana na sljedeći način:

Argumenti "broj" i "referenca" su obavezni, ali "red" nije obavezan. Kao argument „broj“ potrebno je da unesete vezu do ćelije koja sadrži vrednost čiji serijski broj želite da saznate. Argument "link" sadrži adresu cijelog raspona koji se rangira. Argument "red" može imati dvije vrijednosti - "0" i "1". U prvom slučaju red se broji u opadajućem, au drugom slučaju u rastućem. Ako ovaj argument nije naveden, program ga automatski smatra nulom.

Ova formula se može napisati ručno u ćeliju u kojoj želite da se prikaže rezultat obrade, ali je za mnoge korisnike pogodnije postaviti unose kroz prozor čarobnjaka za funkcije.


lekcija: Čarobnjak za funkcije u Excelu

Metoda 2: funkcija RANK.SR

Druga funkcija koja obavlja operaciju rangiranja u Excelu je RANK.SR. Za razliku od funkcija RANK i RANK.RV, ako se vrijednosti nekoliko elemenata poklapaju, ovaj operator proizvodi prosječan nivo. To jest, ako su dvije vrijednosti jednake veličine i dolaze iza vrijednosti označene brojem 1, tada će objema biti dodijeljen broj 2,5.

Sintaksa RANK.SR je vrlo slična šemi prethodne izjave. izgleda ovako:

Formula se može unijeti ručno ili putem čarobnjaka za funkcije. On najnoviju verziju Ući ćemo u detalje.

  1. Odabiremo ćeliju na listu za prikaz rezultata. Na isti način kao i prethodni put, idite na čarobnjak za funkcije putem dugmeta „Ubaci funkciju“.
  2. Nakon otvaranja prozora Čarobnjaka za funkcije, odaberite naziv RANK.SR u listi kategorije “Statistički” i kliknite na dugme “OK”.
  3. Prozor argumenata je aktiviran. Argumenti ovog operatora su potpuno isti kao i argumenti funkcije RANK.RV:
    • Broj (adresa ćelije koja sadrži element čiji nivo treba odrediti);
    • Link (koordinate opsega unutar kojeg se vrši rangiranje);
    • Red (opcijski argument).

    Unos podataka u polja se odvija na potpuno isti način kao i kod prethodnog operatora. Nakon što su sva podešavanja završena, kliknite na dugme “OK”.

  4. Kao što vidite, nakon što su radnje završene, rezultat proračuna je prikazan u ćeliji označenoj u prvom paragrafu ovog uputstva. Sam zbir predstavlja mjesto koje određena vrijednost zauzima među ostalim vrijednostima u rasponu. Za razliku od rezultata RANK.RV, rezultat RANK.SR operatora može imati razlomku vrijednost.
  5. Kao i kod prethodne formule, promjenom referenci iz relativne u apsolutnu i markera za isticanje, možete rangirati cijeli raspon podataka pomoću automatskog popunjavanja. Algoritam akcija je potpuno isti.

lekcija: Ostale statističke funkcije u programu Microsoft Excel

lekcija: Kako se automatski popunjava u Excelu

Kao što vidite, u Excel-u postoje dvije funkcije za određivanje rangiranja određene vrijednosti u rasponu podataka: RANK.RV i RANK.SR. Za starije verzije programa koristi se RANK operator, koji je, zapravo, potpuni analog funkcije RANK.RV. Glavna razlika između formula RANG.RV i RANG.SR je u tome što prva od njih označava najviši nivo ako se vrijednosti poklapaju, a druga prikazuje prosjek kao decimalni razlomak. Ovo je jedina razlika između ovih operatora, ali se mora uzeti u obzir pri odabiru funkcije koju korisnik treba koristiti.

Drago nam je da smo mogli da Vam pomognemo da rešite problem.

Postavite svoje pitanje u komentarima, detaljno opišite suštinu problema. Naši stručnjaci će pokušati odgovoriti što je prije moguće.

Da li vam je ovaj članak pomogao?

Hajde da naučimo rangirati numeričke podatke u Excelu koristeći standardno sortiranje, kao i funkciju RANK i njene posebne slučajeve (RANG.RV i RANG.SR), što će pomoći u automatizaciji sortiranja.

Pozdrav svima, dragi čitaoci bloga TutorExcel.Ru.

Problem rangiranja brojčanih podataka se stalno pojavljuje u radu s ciljem pronalaženja najvećih ili najmanjih vrijednosti na listi.
U Excelu možete riješiti ovaj zadatak na 2 načina: pomoću standardnog alata sortiranje i uz pomoć funkcije.

Na primjer, uzmimo jednostavnu tablicu s popisom brojčanih vrijednosti, u kojoj ćemo dalje rangirati podatke:

Sortiranje podataka

Počnimo s najjednostavnijom i najpristupačnijom opcijom - sortiranjem.

Već smo djelomično ispitali kako se podaci mogu strukturirati korištenjem filtera i sortiranja.
Ukratko, da biste sortirali, morate odabrati raspon sa podacima i odabrati Dom -> Uređivanje -> Sortiranje i filtriranje, a zatim označite po kojem kriteriju želite sortirati.

U ovom slučaju mi ​​ćemo izabrati Sortiraj u opadajućem redoslijedu, gdje će vrijednosti biti raspoređene od najveće do najmanje:


Nedostatak ove metode je promjena strukture izvornih podataka, jer se u procesu sortiranja podataka mogu zamijeniti redovi i stupci, što je u nekim slučajevima nezgodno ili nemoguće učiniti.
Još jedan važan nedostatak ove opcije je nedostatak mogućnosti automatizacije sortiranja. Stoga, svaki put kada se podaci mijenjaju, sortiranje će se morati ponoviti.

Kao rješenje ovog problema, razmotrimo još jednu metodu rangiranja, koja se, međutim, može razmatrati odvojeno od rješavanja ovog problema.

Rangiranje podataka

Ako nije moguće promijeniti strukturu dokumenta, možemo kreirati dodatnu seriju podataka koja će sadržavati serijske brojeve izvornih podataka.
Funkcija će nam pomoći da dobijemo ove serijske brojeve RANK(i RANK.RV I RANK.SR).

RANK funkcija u Excelu

Sintaksa i opis funkcije:

  • Broj(potreban argument) - broj za koji se rangira;
  • Veza(potreban argument) - niz ili referenca na niz brojeva;
  • Red(opcijski argument) - način naručivanja. Ako je argument 0 ili nije naveden, tada je vrijednost 1 dodijeljena maksimalnom elementu na listi (relativno govoreći, sortiramo u opadajućem redoslijedu), u suprotnom vrijednost 1 se dodjeljuje minimalnom elementu (sortiramo u rastućem redoslijedu) .

Ova funkcija je dostupna u svim verzijama Excela, ali od Excela 2010 je zamijenjena RANK.RV I RANK.SR, A RANK ostavljeno za kompatibilnost sa Excelom 2007, hajde da pobliže pogledamo kako oni rade.

Funkcije RANK.RV i RANK.SR u Excelu

Sintaksa i opis funkcija:

RANK.RV(broj; veza;)
Vraća rang broja na listi brojeva: njegov redni broj u odnosu na druge brojeve na listi; ako više vrijednosti ima isti rang, vraća se najviši rang iz tog skupa vrijednosti.

Argumenti za sve tri funkcije su isti, tj. U osnovi su skoro isti, postoje male razlike u detaljima.
Koristeći izvornu tablicu kao primjer, pogledajmo kako svaka funkcija radi s podacima:


Kao što vidimo, razlika je samo u tipu rangiranja odgovarajućih elemenata podataka.

U slučaju da RANK.RV jednakim elementima se dodjeljuje najviši rang.
U našem primjeru, kategorije Laptopovi I Multicookers odgovara istoj vrijednosti elementa - 710, što je 3 u opadajućem redoslijedu, odnosno objema vrijednostima je dodijeljen najviši rang - 3.
Za RANK.SR za iste vrijednosti utvrđuje se njihov prosječni rang, tj. prosek između 3 i 4 serijska broja je 3,5.

Tu prestaju razlike među njima, pa ovisno o vašim zadacima, možete koristiti jednu ili drugu funkciju.
Ako trebate sortirati vrijednosti u rastućem redoslijedu, onda kao argument Red morate navesti vrijednost 1:

Automatsko sortiranje

Hajde da malo zakomplikujemo zadatak i zamislimo da u budućnosti trebamo kreirati sortiranu tabelu koja će se automatski ažurirati kada se podaci u izvornoj tabeli promene.

Na primjer, to se može učiniti korištenjem funkcije VLOOKUP ili kombinacijom INDEX i MATCH, međutim, ako postoji identične vrijednosti na listi nećemo moći ispravno izvući podatke i dobićemo grešku:


U ovom slučaju možete koristiti jednostavnu tehniku ​​u obliku malog trika.
Dodajmo svakoj vrijednosti originalne tablice nepodudaranje slučajni brojevi blizu nule, na primjer, za ove svrhe koristim funkcije ROW ili COLUMN, podijeljene s očigledno velikom vrijednošću.

Ovaj korak će nam omogućiti da dobijemo različite brojeve u izvornim podacima, izbjegnemo podudaranja ranga i greške prilikom izvlačenja podataka:

Sada svi elementi tabele (čak i oni koji se inicijalno podudaraju) imaju svoj pojedinačni rang, koji se razlikuje od ostalih, tako da se greške mogu izbeći prilikom automatskog rangiranja podataka.

Preuzmite primjer fajla.

Hvala vam na pažnji!
Ako imate pitanja, pišite u komentarima.

Sretno i vidimo se uskoro na stranicama bloga TutorExcel.Ru!

Za rangiranje podataka u Excelu koriste se statističke funkcije RANK, RANK.RV, RANK.SR. Svi oni vraćaju broj broja u rangiranoj listi numeričkih vrijednosti. Pogledajmo pobliže sintaksu i primjere.

Primjer funkcije RANK u Excelu

Funkcija se koristi prilikom rangiranja na listi brojeva. Odnosno, omogućava vam da saznate vrijednost broja u odnosu na druge numeričke vrijednosti. Ako sortirate listu uzlaznim redoslijedom, funkcija će vratiti poziciju broja. Na primjer, u nizu brojeva (30;2;26), broj 2 će imati rang 1; 26 –2; 30 –3 (kao najveća vrijednost na listi).

Sintaksa funkcije:

  1. Broj. Za koje je potrebno odrediti broj na rang listi.
  2. Veza. Niz brojeva ili raspon ćelija s numeričkim vrijednostima. Ako navedete samo brojeve kao argument, funkcija će vratiti grešku. Nenumeričkim vrijednostima nije dodijeljen broj.
  3. Red. Način redoslijeda brojeva na listi. Opcije: argument je "0" ili je izostavljen - vrijednost 1 se dodjeljuje maksimalnom broju na listi (kao da je lista sortirana u opadajućem redoslijedu); argument je jednak bilo kojem broju različitom od nule - rangirani broj 1 se dodjeljuje najmanjem broju na listi (kao da je lista sortirana uzlaznim redoslijedom).

Odredimo rang brojeva na listi bez ponavljanja:

Argument koji određuje kako su brojevi poredani je "0". Stoga su u ovoj funkciji brojevi dodijeljeni vrijednostima od najviše do najniže. Maksimalnom broju 87 dodjeljuje se broj 1.

Treća kolona prikazuje formulu sa rastućim rangom.

Odredimo brojeve vrijednosti na listi gdje postoje duple vrijednosti.

Brojevi koji se ponavljaju označeni su žutom bojom. Za njih je određen isti broj. Na primjer, broju 7 u drugoj koloni je dodijeljen broj 9 (i u drugom i u devetom redu); u trećoj koloni - 3. Ali nijedan od brojeva u drugoj koloni neće biti 10, a nijedan od brojeva u trećem neće biti 4.

Da bi se spriječilo ponavljanje rangova (ponekad to sprječava korisnika da riješi zadatak), koristi se sljedeća formula:

Ograničenja se mogu postaviti za način rada funkcije. Na primjer, trebate rangirati samo vrijednosti od 0 do 30. Da biste riješili problem, koristite funkciju IF (=IF(A2

Vrijednosti koje ispunjavaju navedeni uvjet označene su sivom bojom. Za brojeve veće od 30, prikazuje se prazan red.

Primjer funkcije RANK.RV u Excelu

U verzijama Excela od 2010. godine pojavila se funkcija RANK.RV. Ovo je apsolutni analog prethodne funkcije. Sintaksa je ista. Slova “RV” u imenu označavaju da ako formula otkrije identične vrijednosti, funkcija će vratiti najviši rangirani broj (to jest, prvi element otkriven na listi jednakih).

Kao što se može vidjeti iz primjera, ovu funkciju rukuje dupliranim brojevima na listi potpuno isto kao u redovnoj formuli. Ako je potrebno izbjeći ponavljanje redova, koristimo drugu formulu (vidi gore).

Primjer funkcije RANK.SR u Excelu

Vraća brojeve numeričke vrijednosti na listi (redni broj u odnosu na druge vrijednosti). Odnosno, obavlja isti zadatak. Vraća prosjek samo ako se pronađu identične vrijednosti.

Evo rezultata funkcije:

Formula u "opadajućoj" koloni je: =RANK.SR(A2,$A$2:$A$9,0). Dakle, funkcija je dodijelila prosječan broj 1,5 vrijednosti 87.

Recimo da postoje tri vrijednosti koje se ponavljaju na listi brojeva (označeno narandžastom bojom).

Funkcija je svakom od njih dodijelila rang 5, što je prosjek od 4, 5 i 6.

Uporedimo rad dvije funkcije:

Podsjećamo, ove dvije funkcije rade samo u programu Excel 2010 i novijim. U ranijim verzijama, mogli ste koristiti formulu niza za ovu svrhu.

Preuzmite primjere funkcije rangiranja RANK u Excelu.

Dakle, svi gore opisani primjeri omogućuju vam automatizaciju rada rangiranja podataka i sastavljanja rangiranja vrijednosti bez korištenja sortiranja.

Prva faza statističkog proučavanja varijacije je konstrukcija varijantne serije - uredan raspored jedinica populacije prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima karakteristike i prebrojavanju broja jedinica sa određenom vrijednošću karakteristike.

Postoje tri oblika varijacionih serija: rangirane serije, diskretne serije, intervalne serije. Varijacijska serija se često naziva blizu distribucije. Ovaj termin se koristi u proučavanju varijacija i kvantitativnih i nekvantitativnih osobina. Serija distribucije je strukturno grupisanje(vidi Poglavlje 6).

Rangirani red - Ovo je lista pojedinačnih jedinica populacije u rastućem (opadajućem) redoslijedu karakteristike koja se proučava.

Primjer rangirane serije je tabela. 5.5.

Tabela 5.5

Velike banke Sankt Peterburga, rangirane po veličiniakcijski kapital na dan 01.07.96

Ako je broj populacijskih jedinica dovoljno velik, rangirana serija postaje glomazna, a njena izgradnja, čak i uz pomoć kompjutera, traje dugo. U takvim slučajevima, niz varijacija se konstruiše grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava.

Ako karakteristika poprimi mali broj vrijednosti, konstruiše se diskretni varijacioni niz. Primjer takve serije je distribucija fudbalskih utakmica po broju postignutih golova (tabela 5.1). Diskretna serija varijacija - ovo je tabela koja se sastoji od dva reda ili stupca: specifične vrijednosti različite karakteristike Xi i broj populacijskih jedinica sa datom karakterističnom vrijednošću f i frekvencije (f je početno slovo engleske riječi frekvencija).

Određivanje broja grupa

Broj grupa u diskretnoj seriji varijacija određen je brojem stvarno postojećih vrijednosti varijabilne karakteristike. Ako znak može potrajati, iako diskretne vrijednosti, ali njihov broj je vrlo velik (na primjer, broj stoke 1. januara godine u različitim poljoprivrednim preduzećima može se kretati od nula do desetina hiljada grla), tada se konstruiše intervalna serija varijacija. Intervalni niz varijacija je također konstruiran za proučavanje karakteristika koje mogu poprimiti bilo koje, i cijele i razlomke, vrijednosti u području svog postojanja. To su, na primjer, profitabilnost prodatih proizvoda, trošak jedinice proizvodnje, prihod po 1 stanovniku grada, udio osoba sa visokim obrazovanjem među stanovništvom različitih teritorija i općenito sve sekundarne karakteristike, vrijednosti ​od kojih se izračunavaju dijeljenjem vrijednosti jedne primarne karakteristike vrijednošću druge (vidi Poglavlje 3).

Serija intervalnih varijacija je tabela (koja se sastoji od dvije kolone (ili reda) - intervali karakteristike, čija se varijacija proučava, i broj jedinica stanovništva koje spadaju u ovaj interval (učestalosti), ili proporcija ovog broja od ukupan broj agregati (frekvencije).

Prilikom konstruisanja intervalne varijacione serije potrebno je odabrati optimalan broj grupa (intervali atributa) i odrediti dužinu intervala. Budući da se prilikom analize varijacione serije upoređuju frekvencije u različitim intervalima, potrebno je da vrijednost intervala bude konstantna. Optimalan broj grupa je odabran tako da se raznolikost vrijednosti atributa u agregatu u dovoljnoj mjeri odrazi i, istovremeno, obrazac distribucije ne bude iskrivljen slučajnim fluktuacijama frekvencije. Ako ima premalo grupa, obrazac varijacije se neće pojaviti; ako ima previše grupa, slučajni skokovi frekvencije će iskriviti oblik distribucije.

Najčešće se broj grupa u nizu varijacija utvrđuje pridržavanjem formule koju preporučuje američka statističarka Sturgess. (Sturgess):

Gdje k- broj grupa; n- veličina populacije.

Ova formula pokazuje da je broj grupa funkcija količine podataka.

Pretpostavimo da je potrebno konstruisati varijacioni niz distribucije preduzeća u regionu prema prinosu žitarica za određenu godinu. Broj poljoprivrednih preduzeća koja su imala žitarice je 143; najniža vrijednost prinosa je 10,7 c/ha, a najveća 53,1 c/ha. Imamo:

Pošto je broj grupa ceo broj, preporučuje se da se izgradi 8 ili 9 grupa.

Određivanje veličine intervala

Znajući broj grupa, izračunajte veličinu intervala:

U našem primjeru, vrijednost intervala je:

a) sa 8 grupa

b) sa 9 grupa

Za konstruiranje serije i analizu varijacije mnogo je bolje imati, ako je moguće, zaokružene vrijednosti za vrijednost intervala i njegovih granica. Stoga bi najbolje rješenje bilo da se konstruiše varijantni niz sa 9 grupa sa intervalom od 5 c/ha. Ova serija varijacija data je u tabeli. 5.6, a njegov grafički prikaz je dat na Sl. 5.1.

Granice intervala se mogu specificirati na različite načine: gornja granica prethodnog intervala ponavlja donju granicu sljedećeg, kao što je prikazano u tabeli. 5.6, ili se ne ponavlja.

U potonjem slučaju, drugi interval će biti označen kao 15,1-20, treći kao 20,1-25, itd., tj. Pretpostavlja se da se sve vrijednosti prinosa moraju zaokružiti na jednu desetinu. Osim toga, nepoželjna komplikacija nastaje sa sredinom intervala 15,1-20, koji, strogo govoreći, više neće biti jednak 17,5, već 17,55; shodno tome, kada zamijenimo zaokruženi interval 40-60 sa 40,1-6,0 umjesto zaokružene vrijednosti njegovih srednjih 50, dobijamo 50,5. Stoga je poželjno ostaviti intervale sa ponavljanom zaokruženom granicom i složiti se da jedinice stanovništva koje imaju karakteristiku vrijednost jednaka granici intervala, uključeni su u interval u kojem je ta tačna vrijednost prvi put naznačena. Tako se u prvu grupu ubraja gazdinstvo sa prinosom od 15 c/ha, sa vrednošću od 20 c/ha u drugoj itd.

Rice. 5.1. Distribucija farmi prema prinosu

Tabela 5.6

Distribucija regionalnih farmi prema prinosu žitarica

Grupe farmi po prinosu,

c/ha Xj

Broj farmi

Sredina intervala

c/ha Xj"

Kumulativna frekvencija f 'j

Grafički prikaz serije varijacija

Grafički prikaz pruža značajnu pomoć u analizi niza varijacija i njegovih svojstava. Intervalni niz je prikazan trakastim grafikonom, u kojem su osnove šipki smještene na osi apscise intervali vrijednosti promjenjive karakteristike, a visine šipki su frekvencije koje odgovaraju skali duž ordinate osa. Grafički prikaz distribucije farmi u regionu prema prinosu zrna prikazan je na Sl. 5.1. Ova vrsta dijagrama se često naziva histogram(od grčke riječi “histos” - tkanina, struktura).

Tablični podaci 5.5 i sl. 5.1 prikazuju oblik raspodjele karakterističan za mnoge karakteristike: vrijednosti prosječnih intervala karakteristike su češće, a ekstremne vrijednosti su manje uobičajene; mali i velike vrijednosti sign. Oblik ove distribucije je blizak onom o kome se govori u kursu matematičke statistike zakon normalne distribucije. Veliki ruski matematičar A. M. Ljapunov (1857 - 1918) dokazao je da se normalna raspodjela formira ako na promjenljivu varijablu utiče veliki broj faktora, od kojih nijedan nema preovlađujući utjecaj. Slučajna kombinacija mnogo približno jednakih faktora koji utiču na varijaciju prinosa žitarica, kako prirodnih tako i agrotehničkih, ekonomskih, stvara raspodelu gazdinstava u regionu po prinosu koja je bliska normalnom zakonu raspodele.

Ako postoji diskretna serija varijacija ili se koriste sredine intervala, tada se grafički prikaz takve varijacijske serije naziva poligon(od grčke riječi - poligon). Svako od vas može lako da izgradi ovaj graf povezujući tačke sa koordinatama pravim linijama X, I /.

Preporučeni omjer visine poligona ili dijagrama prema njegovoj osnovi je približno 5:8.

Koncept frekvencije

Ako je u tabeli 5.6 izraziti broj gazdinstava sa datim nivoom prinosa u procentima od ukupnog broja, uzimajući ceo broj farmi (143) kao 100%, onda se prosečan prinos može izračunati na sledeći način:

Gdje w- učestalost 7. kategorije varijacione serije;

Kumulativna distribucija

Transformirani oblik varijacionog niza je broj akumuliranih frekvencija, dato u tabeli. 5.6, kolona 5. Ovo je niz vrijednosti za broj jedinica stanovništva sa vrijednostima karakteristike koje su manje i jednake donjoj granici odgovarajućeg intervala. Takva serija se zove kumulativno. Možete izgraditi kumulativnu distribuciju „ne manje od“, ili možete izgraditi „više od“ distribucije. U prvom slučaju naziva se kumulativni graf distribucije kumulirati, u drugom - ogiva(Sl. 5.2).

Gustina, distribucija

Ako se moraš nositi sa varijantne serije sa nejednakim intervalima, tada je za uporedivost potrebno frekvenciju ili frekvenciju svesti na jedinicu intervala. Rezultirajuća relacija se zove gustina distribucije:

Gustina distribucije se koristi i za izračunavanje opštih indikatora i za grafička slika varijantne serije sa nejednakim intervalima.

Rice. 5.2. Ogiva i kumulati distribucije po prinosu

5.7. Strukturne karakteristike varijacije red

Medijan distribucije

Prilikom proučavanja varijacije koriste se takve karakteristike varijacionog niza koje kvantitativno opisuju njegovu strukturu i strukturu. Ovo je npr. srednja- vrijednost promjenjivog atributa koji dijeli populaciju na dva jednaka dijela ~ sa vrijednostima atributa manjim od medijane I sa vrijednostima atributa većim od medijane (treća banka od pet u tabeli 5.5, tj. 196 milijardi rubalja).

Koristeći primjer tab. Slika 5.5 pokazuje fundamentalnu razliku između medijane i prosječne vrijednosti. Medijan ne ovisi o vrijednostima atributa na rubovima rangirane serije. Čak i kada bi kapital najveće banke u Sankt Peterburgu bio deset puta veći, srednja vrijednost se ne bi promijenila. Stoga se medijan često koristi kao pouzdaniji pokazatelj tipične vrijednosti neke karakteristike od aritmetičkog prosjeka, ako je niz vrijednosti heterogen i uključuje oštra odstupanja od prosjeka. IN ovu seriju prosječna vrijednost pod velikim uticajem formiran je vlasnički kapital od 269 milijardi rubalja najbolje opcije. 80% banaka ima kapital manji od prosječnog, a samo 20% više. Malo je vjerovatno da se takav prosjek može smatrati tipičnom vrijednošću. Ako postoji paran broj jedinica u populaciji, aritmetički prosjek dvije centralne opcije uzima se kao srednja vrijednost, na primjer, sa deset vrijednosti atributa - prosjekom pete i šeste vrijednosti u rangirana serija.

U nizu intervalnih varijacija, formula (5.14) se koristi za pronalaženje medijane.

gdje je Me medijan;

x 0 - donja granica intervala u kojem se nalazi medijana;

f M e-1 - akumulirana frekvencija u intervalu koji prethodi medijani;

f Me- frekvencija u srednjem intervalu;

i- veličina intervala;

k - broj grupa.

U tabeli 5,6 medijan je prosjek od 143 vrijednosti, tj. sedamdeset druga vrijednost prinosa od početka serije. Kao što se vidi iz serije akumuliranih frekvencija, nalazi se u četvrtom intervalu. Onda

Kod neparnog broja populacijskih jedinica, srednji broj je, kao što vidimo, jednak , kao u formuli (5.14), a , ali ova razlika je nebitna i obično se zanemaruje u praksi.

U seriji diskretnih varijacija, medijanom treba smatrati vrijednost karakteristike u grupi u kojoj je akumulirana frekvencija;

prelazi polovinu veličine populacije. Na primjer, za podatke u tabeli. 5.1 srednji broj postignutih golova po utakmici je 2.

Kvartili distribucije

Slično medijani, izračunavaju se vrijednosti karakteristike, dijeleći populaciju na četiri dijela jednaka po broju jedinica. Ove količine se nazivaju kvartila i označeni su velikim latiničnim slovom Q sa ikonom kvartilnog broja potpisa. To je jasno Q 2 odgovara Me. Za prvi i treći kvartil dajemo formule i proračune na osnovu podataka u tabeli. 5.6.

Jer Q 2 = Me = 29,5 c/ha, jasno je da je razlika između prvog kvartila i medijane manja nego između medijane i trećeg kvartila. Ova činjenica ukazuje na prisustvo određene asimetrije u srednjem području distribucije, što je uočljivo i na Sl. 5.1.

Karakteristične vrijednosti koje dijele niz sa pet jednaki dijelovi, zvao kvintile, na deset delova - decili, po sto delova - percentili. Budući da se ove karakteristike koriste samo kada je potrebno detaljno proučiti strukturu varijacionih serija, nećemo davati njihove formule i proračune.

Način distribucije

Nesumnjivo je bitna vrijednost karakteristike koja se javlja u seriji koja se proučava, u zbiru najčešće. Ova količina se obično naziva moda i označimo Mo. U diskretnoj seriji, mod se određuje bez proračuna kao vrijednost karakteristike s najvećom frekvencijom. Na primjer, prema tabeli. 5.1 najčešće 2 gola postignuta na fudbalskoj utakmici - 71 put. Način rada je broj 2. Obično postoje serije s jednom modalnom vrijednošću atributa. Ako su dvije ili više jednakih (pa čak i nekoliko različitih, ali veće od susjednih) vrijednosti karakteristike prisutne u nizu varijacija, smatra se bimodalnom („u obliku kamile”) odnosno multimodalnom. Ovo ukazuje na heterogenost populacije, koja vjerovatno predstavlja skup nekoliko populacija s različitim modalitetima.

Dakle, u gomili turista koji su došli različite zemlje, umjesto jedne moderne odjeće koja prevladava među lokalnim stanovništvom, možete pronaći mješavinu različitih „moda“ koje su usvojili različiti narodi svijeta.

U nizu intervalnih varijacija, posebno kod kontinuirane varijacije karakteristike, strogo govoreći, svaka vrijednost karakteristike javlja se samo jednom. Modalni interval je interval sa najvećom frekvencijom.Unutar ovog intervala se nalazi uslovna vrijednost atributa u čijoj blizini je gustina distribucije, tj. broj populacijskih jedinica po jedinici mjerenja različite karakteristike dostiže maksimum. Ovo je uslovna vrijednost i uzima se u obzir point mode. Logično je pretpostaviti da se takav tačkasti mod nalazi bliže granicama intervala iza kojih je frekvencija u susjednom intervalu veća od frekvencije u intervalu izvan druge granice modalnog intervala. Odavde imamo uobičajenu formulu (5.15):

Gdje x 0 - donja granica modalnog intervala;

f Mo - frekvencija u modalnom intervalu;

f Mo -1 - frekvencija u prethodnom intervalu;

f Mo +1 - učestalost u sljedećem intervalu nakon modalnog;

i - veličina intervala.

Prema tabeli. 5.6 izračunajmo način rada:

Izračunavanje režima u intervalnoj seriji je vrlo uslovno. Mo se može približno odrediti grafički (vidi sliku 5.1).

Aritmetička sredina je također relevantna za proučavanje strukture varijantne serije, iako je glavno značenje ovog generalizirajućeg indikatora drugačije. U distribuciji farmi prema prinosu (tabela 5.6), prosječni prinos se izračunava kao frekvencijski ponderirana sredina intervala X(prema formuli (5.2)):

Odnos između srednje vrijednosti, medijane i moda

Razlika između aritmetičke sredine, medijane i moda u ovoj distribuciji je mala. Ako je distribucija u obliku bliska normalnom zakonu, tada je medijan između moda i prosječne vrijednosti i bliži je prosjeku nego modu.

Za desnu asimetriju X̅ > Me > Mo;

sa lijevom asimetrijom X̅ < Ja< Mo.

Za umjereno asimetrične distribucije vrijedi jednakost:

5.8. Indikatori veličine i intenziteta varijacije

Apsolutne prosječne veličine varijacije

Sljedeća faza proučavanja varijacije neke osobine u cijelosti je mjerenje karakteristika jačine i veličine varijacije. Najjednostavniji od njih može biti obim ili amplituda varijacije - apsolutna razlika između maksimalne i minimalne vrijednosti karakteristike od vrijednosti dostupnih u populaciji koja se proučava. Dakle, opseg varijacije se izračunava po formuli

Budući da veličina raspona karakterizira samo maksimalnu razliku u vrijednostima neke karakteristike, ona ne može mjeriti prirodnu snagu njene varijacije u cijeloj populaciji. Indikator namijenjen za ovu svrhu mora uzeti u obzir i sumirati sve razlike u vrijednostima neke karakteristike u agregatu, bez izuzetka. Broj takvih razlika jednak je broju kombinacija dva iz svih jedinica populacije; prema tabeli. 5.6 to će biti: C^= 10 153. Međutim, nema potrebe razmatrati, izračunavati i usrednjavati sva odstupanja. Lakše je koristiti prosjek odstupanja pojedinačnih karakterističnih vrijednosti od prosjeka aritmetička vrijednost karakteristika, a ima ih samo 143. Ali prosječno odstupanje karakterističnih vrijednosti od aritmetičke sredine prema poznato svojstvo ovo drugo je nula. Dakle, indikator jačine varijacije nije algebarski prosječno odstupanje, A modul prosječne devijacije:

Prema tabeli. 5.6 srednji modul, ili prosječna linearna devijacija, u apsolutnoj vrijednosti se računa kao frekventno ponderisano odstupanje po modulu srednjih tačaka intervala od aritmetičke sredine, tj. prema formuli

To znači da je u prosjeku prinos na ispitivanom skupu gazdinstava odstupio od prosječnog prinosa u regionu za 6,85 c/ha. Lakoća izračunavanja i tumačenja iznosi pozitivne strane ovaj indikator, međutim, matematička svojstva modula su "loša": njihov ne može se staviti u skladu ni sa jednim vjerojatnosnim zakonom, uključujući normalnu distribuciju, čiji parametar nije prosječni modul devijacije, već standardna devijacija(u engleskim kompjuterskim programima koji se nazivaju “standardna devijacija”, skraćeno “s.d.” ili jednostavno « s», na jezicima ruskog govornog područja - SKO). U statističkoj literaturi, standardno odstupanje od prosječne vrijednosti obično se označava malim (malim) grčkim slovom sigma (st) ili s(vidi poglavlje 7):

za rangirane serije

za intervalne serije

Prema tabeli. 5.6 standardna devijacija prinosa zrna bila je:

Treba istaći da neko zaokruživanje srednje vrijednosti i sredine intervala, na primjer na cijele, malo utiče na vrijednost σ koja bi iznosila 8,55 c/ha.

Standardna devijacija veličine u stvarnim populacijama je uvijek veća od prosječnog modula devijacije. Omjer (y: A zavisi od prisustva oštrih, izraženih odstupanja u agregatima i može poslužiti kao pokazatelj „zagađenosti“ agregata elementima heterogenim sa grupom: što je ovaj odnos veći, to je „začepljenje“ jače. Za zakon normalne distribucije σ: a = 1,2.

Koncept varijanse

Kvadrat standardne devijacije daje vrijednost disperzija σ 2. Formula disperzije:

jednostavno (za negrupirane podatke):

ponderirano (za grupisane podatke):

Gotovo sve metode matematičke statistike zasnovane su na disperziji. Veliki praktični značaj ima pravilo za dodavanje varijansi (vidi Poglavlje 6).

Druge mjere varijacije

Još jedan pokazatelj jačine varijacije, koji je karakteriše ne u celini, već samo u njenom središnjem delu, jeste prosječna tromjesečna udaljenost, one. prosječna razlika između kvartila, dolje označena kao q:

Rasporediti poljoprivredna preduzeća po prinosu u tabeli. 5.2

q= (36,25 - 25,09): 2 = 5,58 c/ha. Jačina varijacije u središnjem dijelu populacije je obično manja nego u cjelokupnoj populaciji. Odnos između prosječnog modula odstupanja i prosječnog tromjesečnog odstupanja također služi za proučavanje strukture varijacije: velika vrijednost takvog omjera ukazuje na prisustvo slabo promjenjivog „jezgra“ i jako raspršenog okruženja, ili „haloa“, oko ovog jezgra u populaciji koja se proučava. Za podatke u tabeli. 5.6 odnos a: q= 1,23, što ukazuje na blagu razliku u jačini varijacije u centralnom dijelu populacije i na njenoj periferiji.

Za procjenu intenziteta varijacije i upoređivanje u različitim populacijama, a posebno za različite karakteristike, potrebno je relativne mjere varijacije. Izračunavaju se kao omjeri apsolutni pokazatelji jačine varijacije o kojima smo ranije govorili na aritmetičku srednju vrijednost osobine. Dobijamo sljedeće indikatore:

1) relativni raspon varijacije p:

2) relativno odstupanje u modulu T:

3) koeficijent varijacije kao relativna kvadratna devijacija v:

4) relativna kvartalna udaljenost d:

Gdje q - srednja kvartilna udaljenost.

Za varijaciju prinosa prema podacima u tabeli. 5.6 ovi indikatori su:

ρ = 42,4: 30,3 = 1,4 ili 140%;

T= 6,85: 30,3 = 0,226 ili 22,6%;

v = 8,44: 30,3 = 0,279 ili 27,9%;

d= 5,58: 30,3 = 0,184, odnosno 18,4%.

Procjena stepena intenziteta varijacije moguća je samo za svaku pojedinačnu karakteristiku populacije određenog sastava. Dakle, za skup poljoprivrednih preduzeća, varijacija u prinosu u istom prirodnom regionu može se oceniti kao slaba ako v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

Nasuprot tome, varijacije u visini u populaciji odraslih muškaraca ili žena, čak i po stopi od 7%, treba da budu procijenjene i percipirane od strane ljudi kao jake. Stoga se procjena intenziteta varijacije sastoji od poređenja uočene varijacije sa nekim od njenog uobičajenog intenziteta, koji se uzima kao standard. Navikli smo da se produktivnost, zarada ili dohodak po glavi stanovnika, broj dnevnih soba u zgradi može razlikovati za nekoliko ili čak desetine puta, ali već se uočava razlika u visini ljudi od najmanje jedan i po puta. kao veoma jaka.

Različita jačina i intenzitet varijacije su rezultat objektivnih razloga. Na primjer, prodajna cijena američkog dolara u komercijalnim bankama u Sankt Peterburgu 24. januara 1997. varirala je od 5675 do 5640 rubalja. sa prosječnom cijenom od 5664 rubalja. Relativni raspon varijacija ρ = 35:5664 = 0,6%. Ovako mala varijacija je zbog činjenice da bi, ukoliko bi došlo do značajne razlike u kursu dolara, odmah došlo do odliva kupaca iz „skuplje“ banke u „jeftinije“. Naprotiv, cijena kilograma krumpira ili govedine u različitim regijama Rusije jako varira - za desetine posto ili više. Ovo se objašnjava različitim troškovima isporuke robe iz regiona proizvodnje u region potrošača, tj. poslovica "junica preko mora vrijedi pola rublje, a rublja se prevozi."

5.9. Distribucijski momenti i indikatori njegov oblik

Centralni momenti distribucije

Za dalje proučavanje prirode varijacije koriste se prosječne vrijednosti različitih stupnjeva odstupanja pojedinačnih vrijednosti osobine od njegove aritmetičke sredine. Ovi indikatori se nazivaju centralne tačke distribucije reda koje odgovaraju stepenu do kojeg su odstupanja povećana (Tabela 5.7), ili jednostavno momentima (necentralni momenti se rijetko koriste i neće se ovdje razmatrati). Veličina trećeg momenta μ- zavisi, kao i njegov predznak, od prevlasti pozitivnih kocki devijacija nad negativnim kockama ili obrnuto. Uz normalnu i bilo koju drugu striktno simetričnu distribuciju, zbir pozitivnih kocki je striktno jednak zbiru negativnih kocki.

Indikatori asimetrije

Na osnovu momenta trećeg reda moguće je konstruisati indikator koji karakteriše stepen asimetrije distribucije:

As pozvao koeficijent asimetrije. Može se izračunati iz grupisanih i negrupisanih podataka. Prema tabeli. 5.6 indikator asimetrije je bio:

one. asimetrija je beznačajna. Engleski statističar K. Pearson, na osnovu razlike između prosječne vrijednosti i moda, predložio je još jedan indikator asimetrije

Tabela 5.7

Centralni momenti

Prema tabeli. 5.6 Pearsonov indikator je bio:

Pearsonov indeks zavisi od stepena asimetrije u srednjem delu distributivnog niza, a indeks asimetrije, zasnovan na momentu trećeg reda, zavisi od ekstremnih vrednosti karakteristike. Tako je u našem primjeru u srednjem dijelu distribucije asimetrija značajnija, što se može vidjeti iz grafikona (Sl. 5.1). Distribucije sa jakom desnom i lijevom (pozitivnom i negativnom) asimetrijom prikazane su na Sl. 5.3.

Karakteristike distributivnog ekscesa

Uz pomoć trenutka četvrtog reda karakterizira još složenije svojstvo distribucijskih redova od asimetrije, tzv višak.


Rice. 5.3. Asimetrija, distribucije

Indikator ekscesa se izračunava pomoću formule

(5.30)

Kurtoza se često tumači kao "strmina" distribucije, ali to je neprecizno i ​​nepotpuno. Grafikon distribucije može izgledati proizvoljno strm u zavisnosti od jačine varijacije osobine: što je varijacija slabija, to je kriva distribucije strmija na datoj skali. Da ne spominjemo činjenicu da se promjenom skale duž x-ose i ordinate svaka raspodjela može umjetno učiniti „strmom“ i „ravnom“. Da bismo pokazali od čega se sastoji eksces distribucije i da bismo ga ispravno interpretirali, potrebno je uporediti serije sa istom jačinom varijacije (ista vrijednost σ) i različitim indikatorima ekscesa. Kako ne bi došlo do brkanja ekscesa sa asimetrijom, sve upoređene serije moraju biti simetrične. Ovo poređenje je prikazano na sl. 5.4.

Sl.5.4. Kurtoza distribucija

Za seriju varijacija s normalnom distribucijom vrijednosti i Indeks ekscesa, izračunat po formuli (5.30), j je jednak tri.

Međutim, takav pokazatelj ne bi trebalo nazvati izrazom “višak”, što znači “višak”. Termin “kurtosis” ne treba primijeniti na sam omjer prema formuli (5.30), već na poređenje takvog omjera za distribuciju koja se proučava sa vrijednošću ovaj odnos normalna distribucija, tj. sa vrijednošću 3. Otuda i konačne formule za indikator ekscesa, tj. ekscesi u poređenju sa normalnom distribucijom sa istom jačinom varijacije imaju oblik:

za rangirane serije

za intervalne i diskretne varijacione serije

Prisustvo pozitivnog kurtozisa, kao i prethodno uočena značajna razlika između male kvartalne udaljenosti i velike standardne devijacije, znači da u proučavanoj masi fenomena postoji slabo variranje ovu karakteristiku"jezgro" okruženo difuznim "aureolom". Sa značajnom negativnom ekscesom, takva „jezgra“ uopće ne postoji.

Na osnovu vrijednosti indikatora asimetrije i kurtozisa distribucije može se suditi o blizini distribucije normalnoj, što može biti bitno za procjenu rezultata korelacije i regresiona analiza, mogućnosti za probabilističku procjenu prognoza (vidi poglavlja 7,8,9). Distribucija se može smatrati normalnom, tačnije, hipoteza o sličnosti stvarne distribucije sa normalnom ne može se odbaciti ako indikatori asimetrije i ekscesa ne prelaze svoje dvostruke standardne devijacije Stz. Ove standardne devijacije se izračunavaju pomoću formula:

5.10. Maksimalne moguće vrijednosti Indikatori varijacije i njihova primjena

Kada koristite bilo koju vrstu statističkih indikatora, korisno je znati koje su maksimalno moguće vrijednosti datog indikatora za sistem koji se proučava i koji je omjer stvarno uočenih vrijednosti prema maksimalno mogućim vrijednostima. Ovaj problem je posebno relevantan kada se proučavaju varijacije u volumetrijskim pokazateljima, kao što je obim proizvodnje određeni tip proizvodi, dostupnost određenih resursa, raspodjela kapitalnih ulaganja, prihoda i dobiti. Razmotrimo ovo pitanje teorijski i praktično na primjeru distribucije proizvodnje povrća između poljoprivrednih preduzeća u regionu.

Očigledno je da se minimalna moguća vrijednost indikatora varijacije postiže sa strogo ujednačenom raspodjelom zapreminske karakteristike među svim jedinicama stanovništva, odnosno sa istim obimom proizvodnje u svakom od poljoprivrednih preduzeća. U takvoj ograničavajućoj (naravno, vrlo malo vjerovatnoj u praksi) distribuciji nema varijacija i svi indikatori i varijacije su jednaki nuli.

Maksimalna moguća vrijednost indikatora varijacije postiže se takvom raspodjelom volumetrijske karakteristike u populaciji u kojoj je cijeli njen volumen koncentrisan u jednoj jedinici populacije; na primjer, cjelokupan obim proizvodnje povrća je u jednom poljoprivrednom preduzeću u regionu, dok na drugim gazdinstvima nema proizvodnje. Vjerovatnoća takve izuzetno moguće koncentracije volumena neke karakteristike u jednoj jedinici populacije nije tako mala; u svakom slučaju, mnogo je veća od vjerovatnoće striktno ujednačene distribucije.

Razmotrimo indikatore varijacije za naznačeni granični slučaj njegovog maksimuma. Označimo broj jedinica stanovništva P, prosječna vrijednost osobine X̅ , tada će se ukupni volumen karakteristike u agregatu izraziti kao X̅ P. Cijeli ovaj volumen je koncentrisan u jednoj jedinici agregata, dakle Xmax= x̅ p.xmin = 0, iz čega proizlazi da je maksimalna vrijednost amplitude (opseg varijacije) jednaka:

Da bismo izračunali maksimalne vrijednosti prosječnih odstupanja po modulu i kvadratu, napravićemo tablicu odstupanja (tablica 5.8).

Tabela 5.8

Moduli i kvadrati odstupanja od prosjeka na maksimumumoguća varijacija

Broj jedinica stanovništva

Karakteristične vrijednosti

Odstupanja od prosjeka

x i - x̅

Moduli odstupanja

|x i - x̅|

Kvadratna odstupanja

(Xi- X̅ ) 2

X̅ P

X̅ (P - 1)

-x̅

-x̅

-x̅

X̅ (P - 1)

X̅

X̅

X̅

X̅ 2 (P - 1) 2

X̅ 2

X̅ 2

X̅ 2

X̅ P

2X̅ (P - 1)

X̅ 2 [(P - 1) 2 +(n-1)]

Na osnovu izraza u poslednjem redu tabele. 5.8, dobijamo sljedeće maksimalne moguće vrijednosti indikatora varijacije.

Modul prosječne devijacije, ili prosječna linearna devijacija:

Standardna devijacija:

Relativno modularno (linearno) odstupanje:

Koeficijent varijacije:

Što se tiče kvartalne udaljenosti, sistem sa maksimalnom mogućom varijacijom ima degenerisanu strukturu distribucije atributa, u kojoj ne postoje karakteristike strukture („ne rade“): medijana, kvartili i sl.

Na osnovu dobijenih formula za maksimalno moguće vrijednosti glavnih pokazatelja varijacije, prije svega, slijedi zaključak o ovisnosti ovih vrijednosti od obima populacije. P. Ova zavisnost je sažeta u tabeli. 5.9.

Najuže granice promjene i slaba ovisnost o veličini populacije nalaze se u prosječnom modulu i relativnoj linearnoj devijaciji. Naprotiv, standardna devijacija i koeficijent varijacije jako zavise od broja populacijskih jedinica. Ovu zavisnost treba uzeti u obzir kada se poredi intenzitet varijacije u populacijama različitih veličina. Ako je u skupu od šest preduzeća koeficijent varijacije obima proizvodnje bio 0,58, a u skupu od 20 preduzeća 0,72, da li je fer zaključiti da je obim proizvodnje neujednačeniji u drugom skupu? Zaista, u prvom, manjem, bilo je 0,58: 2,24 = 25,9% od maksimalno mogućeg, tj. maksimalni nivo koncentracije proizvodnje u jednom od šest preduzeća, au drugoj, većoj populaciji, posmatrani koeficijent varijacije iznosio je svega 0,72: 4,36 = 16,5% od maksimalno mogućeg.

Tabela 5.9

Granične vrijednosti indikatora varijacije volumetrijske osobine pri različitim veličinama populacije

Broj agregata

Maksimalne vrijednosti indikatora

X̅

X̅

1,5X̅

1,73X̅

1,67X̅

2,24X̅

1,80X̅

3X̅

1,90X̅

4,36X̅

1,96X̅

7X̅

1,98X̅

9,95X̅

2X̅

Takav pokazatelj kao što je omjer stvarnog prosječnog modula odstupanja prema maksimalnom mogućem je također od praktične važnosti. Tako je za skup od šest preduzeća ovaj odnos bio: 0,47 : 1,67 = 0,281, odnosno 28,1%. Interpretacija dobijenog indikatora je sledeća: za prelazak sa posmatrane distribucije obima proizvodnje između preduzeća, na ujednačena distribucija bi trebalo redistribuirati

, ili 23,4% ukupne proizvodnje u agregatu. Ako je stepen stvarne koncentracije proizvodnje (stvarna vrijednost σ ili v) čini određeni udio granične vrijednosti pri monopolizaciji proizvodnje u jednom preduzeću, tada odnos stvarnog pokazatelja i granične vrijednosti može karakterizirati stepen koncentracije (ili monopolizacije) proizvodnje.

Omjer stvarnih vrijednosti pokazatelja varijacije ili promjene strukture prema maksimalno mogućim također se koristi u analizi strukturnih promjena (vidi Poglavlje 11).

1. Jeanie K. Prosječne vrijednosti. - M.: Statistika, 1970.

2. Krivenkova L. N., Yuzbashev M. M. Područje postojanja indikatora varijacije i njegova primjena // Bilten statistike. - 1991. - br. 6. - str. 66-70.

3. Paskhaver I. S. Prosječne vrijednosti u statistici. - M.: Statistika. 1979.

4. Shurakov V.V., Dayitbegov D.M. et al. Automatizovano radno mjesto statistička obrada podataka (poglavlje 4. Preliminarna statistička obrada podataka). - M.: Finansije i statistika, 1990.

Najvažniji dio Statistička analiza je konstrukcija distribucijskih serija (strukturno grupisanje) kako bi se istakle karakteristična svojstva i obrasci populacije koja se proučava. U zavisnosti od toga koja je karakteristika (kvantitativna ili kvalitativna) uzeta kao osnova za grupisanje podataka, prema tome se razlikuju tipovi distributivnih serija.

Ako se kao osnova za grupisanje uzme kvalitativna karakteristika, onda se takav niz raspodjele naziva atributivno(raspodjela po vrsti rada, spolu, zanimanju, vjeri, nacionalnosti, itd.).

Ako je niz distribucije konstruiran na kvantitativnoj osnovi, onda se takav niz naziva varijacijski. Konstruirati varijacijski niz znači organizirati kvantitativnu distribuciju jedinica stanovništva prema karakterističnim vrijednostima, a zatim prebrojati broj jedinica stanovništva s tim vrijednostima (izgraditi grupnu tablicu).

Postoje tri oblika varijacionih serija: rangirane serije, diskretne serije i intervalne serije.

Rangirana serija- ovo je raspodjela pojedinačnih jedinica populacije u rastućem ili padajućem redoslijedu karakteristike koja se proučava. Rangiranje vam omogućava da lako podijelite kvantitativne podatke u grupe, odmah otkrijete najmanje i najveće vrijednosti karakteristike i istaknete vrijednosti koje se najčešće ponavljaju.

Drugi oblici varijacijskih serija su grupne tablice sastavljene prema prirodi varijacije vrijednosti karakteristike koja se proučava. Prema prirodi varijacije razlikuju se diskretne (diskontinuirane) i kontinuirane karakteristike.

Diskretna serija- ovo je varijacioni niz čija se konstrukcija zasniva na karakteristikama sa diskontinualnim promjenom (diskretne karakteristike). Potonji uključuju tarifnu kategoriju, broj djece u porodici, broj zaposlenih u preduzeću itd. Ove karakteristike mogu uzeti samo konačan broj specifičnih vrijednosti.

Diskretna serija varijacija predstavlja tabelu koja se sastoji od dve kolone. Prva kolona označava specifičnu vrijednost atributa, a druga kolona označava broj jedinica u populaciji sa specifičnom vrijednošću atributa.

Ako se neka karakteristika stalno mijenja (iznos prihoda, radni staž, trošak osnovnih sredstava preduzeća itd., koji u određenim granicama može poprimiti bilo koju vrijednost), tada je za ovu karakteristiku potrebno izgraditi intervalne varijacione serije.

Grupna tabela ovdje također ima dvije kolone. Prvi označava vrijednost atributa u intervalu "od - do" (opcije), drugi označava broj jedinica uključenih u interval (učestalost).

Učestalost (učestalost ponavljanja) - broj ponavljanja određene varijante vrijednosti atributa, označava se fi, a zbir frekvencija jednak volumenu populacije koja se proučava.

gdje je k broj opcija za vrijednosti atributa

Vrlo često se tabela dopunjava kolonom u kojoj se izračunavaju akumulirane frekvencije S, koje pokazuju koliko jedinica u populaciji ima karakterističnu vrijednost ne veću od ove vrijednosti.

Frekvencije serije f mogu se zamijeniti frekvencijama w, izraženim u relativnim brojevima (razlomcima ili procentima). Oni predstavljaju omjer frekvencija svakog intervala prema njihovom ukupnom iznosu, tj.:

Prilikom konstruiranja varijacionog niza sa vrijednostima intervala, prije svega je potrebno ustanoviti vrijednost intervala i, koji je definiran kao omjer raspona varijacije R i broja grupa m:

gdje je R = xmax - xmin; m = 1 + 3,322 logn (Sturgessova formula); n je ukupan broj jedinica u populaciji.

Za utvrđivanje strukture populacije koriste se posebni prosječni pokazatelji koji uključuju medijanu i modus, odnosno tzv. strukturni prosjek. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranom nizu varijacija.

medijana (ja)- ovo je vrijednost koja odgovara opciji koja se nalazi u sredini rangirane serije.

Za rangiranu seriju s neparnim brojem pojedinačnih vrijednosti (na primjer, 1, 2, 3, 3, 6, 7, 9, 9, 10), medijana će biti vrijednost koja se nalazi u sredini serije, tj. peta magnituda.

Za rangiranu seriju s parnim brojem pojedinačnih vrijednosti (na primjer, 1, 5, 7, 10, 11, 14), medijan će biti aritmetička srednja vrijednost, koja se izračunava iz dvije susjedne vrijednosti.

Odnosno, da biste pronašli medijan, prvo morate odrediti njegov serijski broj (njegovu poziciju u rangiranoj seriji) koristeći formulu

gdje je n broj jedinica u agregatu.

Numerička vrijednost medijane je određena iz akumuliranih frekvencija u diskretnom nizu varijacija. Da biste to učinili, prvo morate naznačiti interval u kojem se nalazi medijana u intervalnoj seriji distribucije. Medijan je prvi interval u kojem zbir akumuliranih frekvencija prelazi polovinu opservacija od ukupnog broja svih opservacija.

Numerička vrijednost medijane

gdje je xMe donja granica srednjeg intervala; i - vrijednost intervala; S-1 je akumulirana frekvencija intervala koji prethodi medijani; f je frekvencija srednjeg intervala.

moda (pon.) Oni nazivaju vrijednost karakteristike koja se najčešće javlja u jedinicama populacije. Za diskretne serije Moda će biti opcija sa najvećom frekvencijom. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval koji ima najveću frekvenciju). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Da biste pronašli određenu vrijednost moda, trebate koristiti formulu

gdje je xMo donja granica modalnog intervala; iMo je vrijednost modalnog intervala; fMo - frekvencija modalnog intervala; fMo-1 - frekvencija intervala koji prethodi modalnom; fMo+1 - frekvencija intervala nakon modalnog.

Moda je široko rasprostranjena u marketinškim aktivnostima kada se proučava potražnja potrošača, posebno kada se utvrđuje ko koristi najtraženiji veličine odjeće i obuće, kada se reguliše politika cijena.

Glavni cilj analize varijacionih serija je da se identifikuje obrazac distribucije, uz isključivanje uticaja slučajnih faktora za datu distribuciju. To se može postići povećanjem obima populacije koja se proučava i istovremeno smanjenjem intervala serije. Kada pokušamo grafički prikazati ove podatke, dobićemo neku glatku zakrivljenu liniju, koja će biti određena granica za poligon frekvencije. Ova linija se zove kriva distribucije.

Drugim riječima, kriva distribucije postoji grafički prikaz u obliku kontinuirane linije promjena frekvencije u varijacionom nizu, koji je funkcionalno povezan sa promjenom opcije. Kriva distribucije odražava obrazac promjena frekvencije u odsustvu slučajnih faktora. Grafički prikaz olakšava analizu distribucijskih serija.

Poznato je dosta oblika krivulja distribucije, duž kojih se može poravnati varijacioni niz, ali u praksi statističkih istraživanja najčešće korišteni oblici su normalna raspodjela i Poissonova distribucija.

Normalna distribucija zavisi od dva parametra: aritmetičke sredine i standardne devijacije. Njegova kriva je izražena jednadžbom

gdje je y ordinata krive normalne distribucije; - standardizovana odstupanja; e i π su matematičke konstante; x - varijante varijacione serije; - njihova prosječna vrijednost; - standardna devijacija.

Ako trebate dobiti teorijske frekvencije f" kada poravnate niz varijacija duž krivulje normalne distribucije, tada možete koristiti formulu

gdje je zbir svih empirijskih frekvencija serije varijacija; h - veličina intervala u grupama; - standardna devijacija; - normalizovano odstupanje opcija od aritmetičke sredine; sve ostale količine se lako izračunavaju pomoću posebnih tabela.

Koristeći ovu formulu dobijamo teorijska (vjerovatnoća) raspodjela, zamjenjujući ih empirijska (stvarna) distribucija, ne bi trebalo da se razlikuju po karakteru jedni od drugih.

Međutim, u brojnim slučajevima, ako je serija varijacija distribucija prema diskretnoj karakteristici, gdje kako se vrijednosti karakteristike x povećavaju, frekvencije počinju naglo opadati, a aritmetička sredina je zauzvrat jednaka na ili blizu vrijednosti disperzije (), takav niz je poravnat Poissonovom krivom.

Poissonova kriva može se izraziti relacijom

gdje je Px vjerovatnoća pojavljivanja pojedinačnih vrijednosti x; - aritmetička sredina serije.

Prilikom izjednačavanja empirijskih podataka, teorijske frekvencije se mogu odrediti formulom

gdje su f" teorijske frekvencije; N je ukupan broj jedinica serije.

Upoređujući dobijene vrijednosti teoretskih frekvencija f" sa empirijskim (stvarnim) frekvencijama f, uvjeravamo se da njihove razlike mogu biti vrlo male.

Objektivna karakteristika korespondencije između teorijske i empirijske frekvencije može se dobiti korištenjem posebnih statističkih indikatora, koji se nazivaju kriteriji slaganja.

Za procjenu blizine empirijskih i teoretskih frekvencija koriste se Pearsonov test dobrobiti, Romanovsky test dobrosti i Kolmogorov test ispravnosti.

Najčešći je K. Pearsonov test dobrote prilagodbe, koji se može predstaviti kao zbir omjera kvadrata razlika između f" i f prema teorijskim frekvencijama:

Izračunata vrijednost kriterija mora se uporediti sa tabeliranom (kritičnom) vrijednošću. Tabelarna vrijednost se utvrđuje iz posebne tabele, zavisi od prihvaćene vjerovatnoće P i broja stepena slobode k (gdje je k = m - 3, gdje je m broj grupa u seriji distribucije za normalnu distribuciju). Prilikom izračunavanja kriterija Pearsonovog dogovora mora biti ispunjen sljedeći uvjet: broj opservacija mora biti dovoljno velik (n 50), a ako u nekim intervalima teorijske frekvencije< 5, то интервалы объединяют для условия > 5.

Ako je , tada neslaganja između empirijske i teorijske raspodjele frekvencija mogu biti slučajna i pretpostavka da je empirijska raspodjela blizu normalne ne može se odbaciti.

U slučaju da ne postoje tabele za procjenu slučajnosti neslaganja između teorijske i empirijske frekvencije, možete koristiti kriterijum dogovora V.I. Romanovski KR, koji je, koristeći vrijednost, predložio da se procijeni blizina empirijske distribucije krive normalne distribucije koristeći omjer

gdje je m broj grupa; k = (m - 3) - broj stupnjeva slobode pri izračunavanju frekvencija normalne distribucije.

Ako je gornja relacija< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, onda odstupanja mogu biti prilično značajna i hipotezu o normalnoj raspodjeli treba odbaciti.

Kriterijum sporazuma A.N. Kolmogorov koristi se za određivanje maksimalnog odstupanja između frekvencija empirijske i teorijske distribucije, izračunate po formuli

gdje je D maksimalna vrijednost razlike između akumuliranih empirijskih i teoretskih frekvencija; - zbir empirijskih frekvencija.

Koristeći tabele vrednosti verovatnoće, kriterijum se može koristiti da se pronađe vrednost koja odgovara verovatnoći P. Ako je vrednost verovatnoće P značajna u odnosu na pronađenu vrednost, onda možemo pretpostaviti da su neslaganja između teorijske i empirijske distribucije beznačajan.

Neophodan uslov pri korištenju Kolmogorovljevog testa ispravnosti je dovoljno veliki broj zapažanja (najmanje sto).

Praktična lekcija 1

VARIJACIJSKI SER DISTRIBUCIJE

Varijacijska serija ili blizu distribucije nazvati uređenom raspodjelom jedinica populacije prema rastućim (češće) ili opadajućim (rjeđe) vrijednostima karakteristike i brojanju broja jedinica s određenom vrijednošću karakteristike.

postoje 3 vrsta red distribucije:

1) rangirana serija– ovo je lista pojedinačnih jedinica stanovništva u rastućem redoslijedu prema osobini koja se proučava; ako je broj populacijskih jedinica dovoljno velik, rangirana serija postaje glomazna, te se u takvim slučajevima distribucijski niz konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava (ako karakteristika poprima mali broj vrijednosti, tada se konstruiše diskretni niz, a inače intervalni niz);

2) diskretne serije- ovo je tabela koja se sastoji od dvije kolone (reda) - specifične vrijednosti različite karakteristike X i i broj populacijskih jedinica sa datom karakterističnom vrijednošću f i– frekvencije; broj grupa u diskretnoj seriji određen je brojem stvarno postojećih vrijednosti različite karakteristike;

3) intervalne serije- ovo je tabela koja se sastoji od dvije kolone (reda) - intervala različite karakteristike X i i broj populacijskih jedinica koje spadaju u dati interval (učestalosti), ili udio ovog broja u ukupnom broju populacija (učestalosti).

Pozivaju se brojevi koji pokazuju koliko puta se pojedinačne opcije javljaju u datoj populaciji frekvencije ili vage opciju i označeni su malim slovom latinice f. Ukupan zbir frekvencija varijacionih serija jednak je volumenu date populacije, tj.

Gdje k– broj grupa, n– ukupan broj opservacija, odnosno veličina populacije.

Učestalosti (težine) se izražavaju ne samo u apsolutnim, već iu relativnim brojevima - u dijelovima jedinice ili kao postotak od ukupnog broja varijanti koje čine datu populaciju. U takvim slučajevima se nazivaju težine relativne frekvencije ili frekvencije. Ukupan zbir dijelova jednak je jedan

ili
,

ako su frekvencije izražene kao procenat ukupnog broja posmatranja P. Zamjena frekvencija frekvencijama nije potrebna, ali ponekad se pokaže korisnim, pa čak i neophodnim u slučajevima kada ih morate međusobno upoređivati varijantne serije, koji se uvelike razlikuju po obimu.

Ovisno o tome kako atribut varira - diskretno ili kontinuirano, u širokom ili uskom rasponu - statistička populacija se distribuira u bez intervala ili interval varijantne serije. U prvom slučaju, frekvencije se direktno odnose na rangirane vrijednosti atributa, koji dobijaju poziciju odvojene grupe ili klase varijacionih serija, u drugom - oni broje frekvencije vezane za pojedinačne intervale ili intervale (od - do), na koje je podijeljena ukupna varijacija karakteristike, u rasponu od minimalnih do maksimalnih varijanti date populacije . Ove praznine, ili intervali klasa, mogu, ali ne moraju biti jednake širine. Stoga razlikuju jednake i nejednake intervalne varijacione serije. U nejednako intervalnim serijama, priroda distribucije frekvencija se mijenja kako se mijenja širina intervala klasa. Grupiranje u nejednakim intervalima se relativno rijetko koristi u biologiji. U pravilu, biometrijski podaci se distribuiraju u redove s jednakim intervalima, što omogućava ne samo da se identificiraju obrasci varijacije, već i olakšava izračunavanje sažetka numeričke karakteristike varijacione serije, poređenje distributivnih serija međusobno.

Kada počinjete da konstruišete niz varijacija sa jednakim intervalima, važno je pravilno ocrtati širinu intervala klasa. Činjenica je da grubo grupisanje (kada se uspostavljaju veoma široki intervali klasa) iskrivljuje tipične karakteristike varijacije i dovodi do smanjenja tačnosti numeričkih karakteristika serije. Prilikom odabira pretjerano uskih intervala povećava se točnost generaliziranja numeričkih karakteristika, ali se ispostavlja da je serija previše rastegnuta i ne daje jasnu sliku varijacije.

Da bi se dobila jasno vidljiva serija varijacija i Da bi se osigurala dovoljna tačnost numeričkih karakteristika izračunatih iz njega, varijaciju karakteristike (u rasponu od minimalnih do maksimalnih opcija) treba podijeliti na toliki broj grupa ili klasa koji bi zadovoljili oba zahtjeva. Ovaj problem se rješava dijeljenjem raspona varijacije karakteristike brojem grupa ili klasa navedenih prilikom konstruiranja varijacionog niza:

,

Gdje h– veličina intervala; X m a x i X min – maksimalne i minimalne vrijednosti ukupno; k– broj grupa.

Prilikom konstruisanja serije intervalne distribucije potrebno je odabrati optimalan broj grupa (intervali atributa) i odrediti dužinu (opseg) intervala. Budući da se analizom distributivnog niza upoređuju frekvencije u različitim intervalima, potrebno je da dužina intervala bude konstantna. Ako se morate baviti intervalnim nizom distribucija s nejednakim intervalima, tada za uporedivost trebate smanjiti frekvenciju ili frekvenciju na jedinicu intervala, rezultirajuća vrijednost se naziva gustina ρ , to je
.

Optimalan broj grupa je odabran tako da se raznolikost vrijednosti atributa u agregatu dovoljno odrazi i da, istovremeno, obrazac distribucije ne bude iskrivljen slučajnim fluktuacijama frekvencije. Ako ima premalo grupa, obrazac varijacije se neće pojaviti; ako ima previše grupa, slučajni skokovi frekvencije će iskriviti oblik distribucije.

Najčešće se broj grupa u seriji distribucije određuje pomoću Sturgessove formule:

Gdje n– veličina populacije.

Grafički prikaz pruža značajnu pomoć u analizi distributivnih serija i njegovih svojstava. Intervalni niz je prikazan trakastim grafikonom, u kojem su osnove šipki koje se nalaze duž apscisne osi intervali vrijednosti promjenjive karakteristike, a visine šipki su frekvencije koje odgovaraju skali duž ordinate osa. Ova vrsta dijagrama se zove histogram.

Ako postoji diskretna distributivna serija ili se koriste sredine intervala, tada se grafički prikaz takve serije naziva poligon, koji se dobija povezivanjem pravih linija sa tačkama sa koordinatama X i I f i .

Ako se vrijednosti klasa nacrtaju duž apscisne ose, a akumulirane frekvencije se iscrtaju duž ordinatne ose, nakon čega slijedi povezivanje tačaka pravim linijama, graf tzv. kumulirati. Akumulirane frekvencije se pronalaze sekvencijalnim zbrajanjem, ili kumulacija frekvencije u pravcu od prve klase do kraja varijacionog niza.

Primjer. Postoje podaci o proizvodnji jaja od 50 kokošaka nosilja u jednoj godini koje se drže na farmi peradi (tabela 1.1).

Tabela 1.1

Proizvodnja jaja od koka nosilja

Kokoš nosilja br.

Proizvodnja jaja, kom.

Kokoš nosilja br.

Proizvodnja jaja, kom.

Kokoš nosilja br.

Proizvodnja jaja, kom.

Kokoš nosilja br.

Proizvodnja jaja, kom.

Kokoš nosilja br.

Proizvodnja jaja, kom.

Potrebno je konstruirati intervalnu distribucijsku seriju i grafički je prikazati u obliku histograma, poligona i kumulata.

Vidi se da osobina varira od 212 do 245 jaja dobijenih od koke nosilje u jednoj godini.

U našem primjeru, koristeći Sturgessovu formulu, određujemo broj grupa:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Izračunajmo dužinu (raspon) intervala koristeći formulu:

.

Napravimo intervalnu seriju sa 7 grupa i intervalom od 5 komada. jaja (tabela 1.2). Za konstruiranje grafikona u tabeli, izračunavamo sredinu intervala i akumuliranu frekvenciju.

Tabela 1.2

Intervalne serije distribucije proizvodnje jaja

Grupa kokošaka nosilja po proizvodnji jaja

X i

Broj kokošaka nosilja

f i

Sredina intervala

X ja

Kumulativna frekvencija

f i

Napravimo histogram distribucije proizvodnje jaja (slika 1.1).

Rice. 1.1. Histogram distribucije proizvodnje jaja

Ovi histogrami pokazuju oblik distribucije karakterističan za mnoge karakteristike: vrijednosti prosječnih intervala karakteristike su češće, a ekstremne (male i velike) vrijednosti karakteristike su manje uobičajene. Oblik ove distribucije je blizak normalnom zakonu raspodjele, koji se formira ako na promjenljivu varijablu utiče veliki broj faktora, od kojih nijedan nema preovlađujući značaj.

Poligon i kumulativna distribucija proizvodnje jaja izgledaju ovako (sl. 1.2 i 1.3).

Rice. 1.2. Distribucija proizvodnje jaja

Rice. 1.3. Kumulati distribucije proizvodnje jaja

Tehnologija za rešavanje problema u stolni procesor Microsoft Excel sljedeći.

1. Unesite početne podatke u skladu sa sl. 1.4.

2. Rangirajte seriju.

2.1. Odaberite ćelije A2:A51.

2.2. Kliknite levim tasterom miša na traku sa alatkama na dugmetu<Сортировка по возрастанию > .

3. Odredite veličinu intervala za konstruisanje serije intervalne distribucije.

3.1. Kopirajte ćeliju A2 u ćeliju E53.

3.2. Kopirajte ćeliju A51 u ćeliju E54.

3.3. Izračunajte opseg varijacije. Da biste to učinili, unesite formulu u ćeliju E55 =E54-E53.

3.4. Izračunajte broj grupa varijacija. Da biste to učinili, unesite formulu u ćeliju E56 =1+3.322*LOG10(50).

3.5. Unesite zaokruženi broj grupa u ćeliju E57.

3.6. Izračunajte dužinu intervala. Da biste to učinili, unesite formulu u ćeliju E58 =E55/E57.

3.7. Unesite zaokruženu dužinu intervala u ćeliju E59.

4. Konstruirajte intervalni niz.

4.1. Kopirajte ćeliju E53 u ćeliju B64.

4.2. Unesite formulu u ćeliju B65 =B64+$E$59.

4.3. Kopirajte ćeliju B65 u ćelije B66:B70.

4.4. Unesite formulu u ćeliju C64 =B65.

4.5. Unesite formulu u ćeliju C65 =C64+$E$59.

4.6. Kopirajte ćeliju C65 u ćelije C66:C70.

Rezultati rješenja se prikazuju na ekranu u sljedećem obliku (slika 1.5).

5. Izračunajte frekvenciju intervala.

5.1. Pokrenite komandu Servis,Analiza podataka, klikom naizmjenično lijevom tipkom miša.

5.2. U dijaloškom okviru Analiza podataka koristite levi taster miša da instalirate: Analysis Tools <Гистограмма>(Sl. 1.6).

5.3. Kliknite lijevo na dugme<ОК>.

5.4. Na kartici trakasti grafikon podesite parametre prema sl. 1.7.

5.5. Kliknite lijevo na dugme<ОК>.

Rezultati rješenja se prikazuju na ekranu u sljedećem obliku (slika 1.8).

6. Popunite tabelu „Serija intervala distribucije“.

6.1. Kopirajte ćelije B74:B80 u ćelije D64:D70.

6.2. Izračunajte zbir frekvencija. Da biste to učinili, odaberite ćelije D64:D70 i kliknite lijevom tipkom miša na dugme na traci sa alatkama<Автосумма > .

6.3. Izračunajte sredinu intervala. Da biste to učinili, unesite formulu u ćeliju E64 =(B64+C64)/2 i kopirajte u ćelije E65:E70.

6.4. Izračunajte akumulirane frekvencije. Da biste to učinili, kopirajte ćeliju D64 u ćeliju F64. U ćeliju F65 unesite formulu =F64+D65 i kopirajte je u ćelije F66:F70.

Rezultati rješenja se prikazuju na ekranu u sljedećem obliku (slika 1.9).

7. Uredite histogram.

7.1. Kliknite desnim tasterom miša na dijagram na nazivu "džep" i na kartici koja se pojavi kliknite na dugme<Очистить>.

7.2. Kliknite desnim tasterom miša na grafikon i na kartici koja se pojavi kliknite<Исходные данные>.

7.3. U dijaloškom okviru Početni podaci promijenite oznake ose X. Da biste to učinili, odaberite ćelije B64:C70 (slika 1.10).

7.5. Pritisnite tipku .

Rezultati se prikazuju na ekranu u sledećem obliku (slika 1.11).

8. Konstruisati poligon za distribuciju proizvodnje jaja.

8.1. Kliknite levim tasterom miša na traku sa alatkama na dugmetu<Мастер диаграмм > .

8.2. U dijaloškom okviru Čarobnjak za grafikone (korak 1 od 4) pomoću lijeve tipke miša postavite: Standardno <График>(Sl. 1.12).

8.3. Kliknite lijevo na dugme<Далее>.

8.4. U dijaloškom okviru Čarobnjak za grafikone (korak 2 od 4) podesite parametre prema sl. 1.13.

8.5. Kliknite lijevo na dugme<Далее>.

8.6. U dijaloškom okviru Čarobnjak za grafikone (korak 3 od 4) unesite nazive dijagrama i Y-ose (slika 1.14).

8.7. Kliknite lijevo na dugme<Далее>.

8.8. U dijaloškom okviru Čarobnjak za grafikone (korak 4 od 4) podesite parametre prema sl. 1.15.

8.9. Kliknite lijevo na dugme<Готово>.

Rezultati se prikazuju na ekranu u sledećem obliku (slika 1.16).

9. Umetnite oznake podataka u grafikon.

9.1. Kliknite desnim tasterom miša na grafikon i na kartici koja se pojavi kliknite<Исходные данные>.

9.2. U dijaloškom okviru Početni podaci promenite oznake ose X. Da biste to uradili, izaberite ćelije E64:E70 (slika 1.17).

9.3. Pritisnite tipku .

Rezultati se prikazuju na ekranu u sledećem obliku (slika 1.18).

Kumulat distribucije je konstruisan slično poligonu distribucije na osnovu akumuliranih frekvencija.

Varijacijska serija predstavlja raspored karakterističnih vrijednosti svake statističke jedinice određenim redoslijedom. U ovom slučaju, pojedinačne vrijednosti karakteristike obično se nazivaju varijantom (opcijom). . Svaki član varijacione serije (varijante) naziva se ordinalna statistika, a broj varijanti se naziva rang (red) statistike.

Najvažnije karakteristike varijacionog niza su njegove ekstremne varijante (X 1 = Xmin; X n = Xmax) i opseg varijacije (Rx = Xn – X 1).

Varijacijski nizovi se široko koriste u primarnoj obradi statističkih informacija dobijenih kao rezultat statističko posmatranje. Oni služe kao osnova za konstruisanje empirijske funkcije distribucije statističkih jedinica unutar statističke populacije. Stoga se varijacioni nizovi nazivaju redovi distribucije.

U statistici razlikuje sljedeće vrste varijacionih serija: rangirane, diskretne, intervalne.

Rangirani (od latinskog rang - rang) red- ovo je niz distribucije jedinica statističke populacije u kojoj su varijante neke karakteristike u rastućem ili opadajućem redoslijedu. Svaka rangirana serija sastoji se od brojeva ranga (1 do n) i odgovarajućih opcija. Broj opcija u rangiranoj seriji formiranoj prema bitnoj karakteristici obično je jednak broju jedinica u statističkoj populaciji.

Da biste formirali rangiranu seriju prema datoj karakteristici (na primjer, po broju stočarskih radnika u 100 poljoprivrednih preduzeća), možete koristiti izgled tabele. 5.1.

Tabela 5.1. Redoslijed formiranja rangiranih serija

Kraj rada -

Ova tema pripada sekciji:

Statistika

I hrana Republike Bjelorusije.. Ministarstvo obrazovanja, nauke i kadrova..

Ako vam je potreban dodatni materijal na ovu temu, ili niste pronašli ono što ste tražili, preporučujemo da koristite pretragu u našoj bazi radova:

Šta ćemo sa primljenim materijalom:

Ako vam je ovaj materijal bio koristan, možete ga spremiti na svoju stranicu na društvenim mrežama:

Sve teme u ovoj sekciji:

Šundalov B.M.
Opća teorija statistike. Tutorial za ekonomske specijalnosti visokih poljoprivrednih obrazovnih ustanova. Vodič za učenje sa

Predmet statistike
Reč "statistika" dolazi od latinskog "status", što znači stanje, stanje stvari. Time je moguće naglasiti teorijsku kognitivnu suštinu

Suština statističkog posmatranja
Bilo koja statistička studija, kao što je gore navedeno (tema 1), uvijek počinje prikupljanjem primarnih (početnih) informacija o svakoj jedinici statističke populacije. Međutim, ne svi

Program statističkog posmatranja
U prvom poglavlju skrenuta je pažnja na činjenicu da svaka statistička jedinica, kao objekat u cjelini, ima mnogo različitih svojstava, kvaliteta, specifične karakteristike koji se obično nazivaju

Lista znakova snimljenih tokom procesa posmatranja obično se naziva programom statističkog posmatranja
Razvoj programa jedno je od najvažnijih teorijskih i praktičnih pitanja u statističkom posmatranju. Faktor kvaliteta programa u velikoj mjeri određuje kvalitet prikupljenog materijala, njegovu pouzdanost i

Oblici statističkog posmatranja
Čitava raznolikost statističkih posmatranja svodi se na dva oblika: statističko izvještavanje i posebno organizovana statistička posmatranja. Statističko izvještavanje

Statistički obrasci
Statistički obrazac je banka koja sadrži pitanja iz programa statističkog posmatranja i mjesto za odgovore na njih. obrazac je nosilac statističkih informacija dobijenih kao rezultat

Vrste statističkog posmatranja
Statistička opažanja su klasifikovana u tipove, koji se mogu razlikovati prema različitim principima. Prema tome, u zavisnosti od stepena pokrivenosti objekta koji se proučava, statistička posmatranja se mogu podeliti

Metode za provođenje statističkih opservacija
Statistička posmatranja se mogu vršiti na različite načine, među kojima se često nalaze: izvještajna, ekspedicijska, samoobračunska, samoregistracijska, upitna, dopisnička.

Mjesto, vrijeme i period statističkih posmatranja
U smislu svakog statističkog posmatranja, lokacija ovog posmatranja mora biti jasno definisana, tj. mjesto gdje se evidentiraju prikupljeni podaci popunjavaju se statistički podaci

Greške u statističkom praćenju i mjere za njihovo suzbijanje
Jedan od najvažnijih zahteva za rezultate statističkog posmatranja je njihova tačnost, koja se shvata kao mera korespondencije statističkih znanja sa

Primarni statistički sažetak
Rezultati statističkog posmatranja sadrže raznovrsne informacije o svakoj jedinici populacije ili objekta i obično su neuređeni. Ovaj početni materijal je neophodan prvi u

Suština i značaj relativnih statističkih indikatora
Relativni indikatori su statističke vrijednosti koje izražavaju mjeru kvantitativnog odnosa između apsolutnih vrijednosti neke karakteristike i odražavaju relativne veličine pojava i procesa. O

Vrste relativnih indikatora. Pokazatelji relativne dinamike
U zavisnosti od zadataka koji se rešavaju korišćenjem relativnih vrednosti, razlikuju se sledeće vrste relativnih indikatora: dinamika, struktura, koordinacija, intenzitet, poređenje, ispunjenost narudžbi,

Indikatori relativne strukture
Jedan od najvažnije karakteristike svih pojava leži u njihovoj složenosti. Čak se i molekul destilovane vode sastoji od atoma vodika i kiseonika. Mnogi fenomeni prirode, društva, čovjeka

Indikatori relativne koordinacije
Indikatori relativne koordinacije su odnos između apsolutnih veličina komponente u nekoj apsolutnoj celini. Za izračunavanje ovih pokazatelja, jedna od komponenti

Pokazatelji relativnog intenziteta
Relativni pokazatelji intenziteta (stepena) predstavljaju omjer apsolutnih veličina dvije kvalitativno različite, ali međusobno povezane karakteristike u statističkoj grupi

Relativni pokazatelji poređenja
Relativni pokazatelji poređenja (komparacije) dobijaju se korelacijom istih apsolutnih pokazatelja vezanih za različite statističke jedinice.

Relativne stope ispunjenja naloga
Relativni pokazatelji učinka naloga (zadatka, plana) predstavljaju odnos apsolutnih, stvarno ostvarenih pokazatelja za određeni period ili na dan

Relativni pokazatelji stepena ekonomskog razvoja
Relativni pokazatelji stepena ekonomskog razvoja su odnos apsolutnih veličina dvije kvalitativno različite (suprotne) ali međusobno povezane karakteristike. S ovim

Suština i značaj grafičke metode
Apsolutni statistički pokazatelji dobijeni kao rezultat statističkih posmatranja i različiti relativni pokazatelji izračunati na osnovu toga mogu biti bolji, dublji, pristupačniji

Osnovni zahtjevi za konstruiranje koordinatnih dijagrama
Najčešći i najpogodniji način grafičkog prikaza indikatora apsolutne i relativne dinamike, pokazatelja poređenja itd. smatra se koordinatni dijagram.

Metode grafičkog prikaza indikatora dinamike i strukture
U mnogim slučajevima postoji potreba da se na istom koordinatnom dijagramu odrazi ne jedna, već nekoliko linija koje karakteriziraju dinamiku različitih apsolutnih ili relativnih pokazatelja ili

Metode za grafički prikaz pokazatelja poređenja
U širem smislu, poređenje indikatora se vrši i u vremenu iu prostoru, tj. Tehnike poređenja mogu obuhvatiti dinamiku, strukturu i teritorijalne objekte. Stoga

Suština i značenje kartograma i kartodijagrama
U mnogim slučajevima postoji potreba da se grafički prikažu najvažnije karakteristike karakteristične za velike teritorijalne objekte. U sistemu agroindustrijskog kompleksa to mogu biti naselja, poljoprivreda

Test pitanja za temu 4
1. Šta je to? grafička metoda i na čemu se zasniva? 2. Za koje se glavne svrhe koristi grafička metoda? 3. Kako su klasifikovani?

Suština varijacije. Vrste varijacionih karakteristika
Varijacija (od latinskog variatio - promjena) je promjena karakteristike (varijante) u statističkoj populaciji, tj. prihvatanje od strane jedinica stanovništva ili njihovih grupa različitog prepoznavanja znanja

Po broju stočarskih radnika
Broj (br.) opcije Opcija koja odgovara rangu (br.) Simbol Broj radnika u stočarstvu

Diskretna serijska distribucija
Diskretni (razdjelni) niz je varijacioni niz u kojem se njegove grupe formiraju prema osobini koja se diskontinuirano mijenja, tj. nakon određenog broja jedan

Stočarski radnici
Broj opcija Opcija (vrijednost znaka), X Znakovi frekvencije Lokalne frekvencije, fl Kumulativne frekvencije, fn

Intervalne distribucijske serije
U mnogim slučajevima statistička populacija uključuje veliki ili čak beskonačniji broj varijanti, što se najčešće događa uz kontinuirane varijacije, praktički je nemoguće i nepraktično

Suština prosjeka
Varijacijski nizovi odražavaju širok spektar pojava i procesa koji čine suštinu naše stvarnosti. Za potpunije, dublje proučavanje pojava i procesa svijeta oko nas

Aritmetička sredina
Ako u formulu 6.2 zamijenite vrijednost K = 1, dobićete srednju aritmetičku vrijednost, tj. .

U rangiranoj seriji distribucije
Rang br. Opcije (karakteristične vrijednosti) Simboli Obrađena površina, ha

Distributivni red
Artikl br. Opcije Lokalne frekvencije Ponderisani prosjek Opcije Simboli žetve

Osnovna svojstva aritmetičke sredine
Aritmetička sredina ima mnoga matematička svojstva koja imaju važan matematički značaj u njenom izračunavanju. Poznavanje ovih svojstava pomaže u kontroli ispravnosti i preciznosti

Prosječna hronološka vrijednost
Jedna od varijanti aritmetičke sredine je hronološka sredina. Prosječna vrijednost izračunata iz ukupnosti vrijednosti karakteristike u različitim trenucima ili za različite periode u

Srednja kvadratna vrijednost
Pod uslovom da je vrijednost K = 2 postavljena u formuli 6.2. dobijamo srednju kvadratnu vrijednost. U rangiranoj seriji, srednja kvadratna vrijednost se izračunava korištenjem neponderisanog (pr

Geometrijska srednja vrijednost
Ako u formulu 6.2 zamijenimo vrijednost K = 0, onda je rezultat prosječna geometrijska vrijednost, koja ima jednostavan (neponderisan) i ponderisan oblik. Geometrijska sredina je jednostavna

Harmonična srednja vrijednost
Zamjenom vrijednosti K = -1 u opću formulu 6.2, možete dobiti harmonijsku prosječnu vrijednost, koja ima jednostavan i ponderisan oblik. Naziv srednje harmonije

Strukturni prosjek. Suština i značenje mode
U nekim slučajevima, da bi se dobila opšta karakteristika statističke populacije za bilo koji kriterijum, potrebno je koristiti tzv. strukturni proseci. To uključuje

Suština i značenje medijane
Medijan – opcije koje se nalaze u sredini serije varijacija. Medijan u rangiranoj seriji nalazi se na sljedeći način. Prvo izračunajte broj medijana opcija:

Koncept najjednostavnijih indikatora varijacije
O suštini varijacije govorilo se u 5. poglavlju udžbenika, gdje je napomenuto da je varijacija fluktuacija, promjena vrijednosti neke karakteristike u statističkoj populaciji, tj. prihvatanje od strane jedinica kolektivno

Standardna devijacija
Standardna devijacija se izračunava na osnovu srednje kvadratne vrijednosti. Pojavljuje se u neponderisanim (jednostavnim) i ponderisanim oblicima. Za rangiranu str

Koeficijent varijacije
Koeficijent varijacije je relativan pokazatelj koji se može izračunati pomoću sljedeće formule:

Test pitanja za temu 6
1. Koja je prosječna vrijednost i šta ona izražava? 2. Šta je definišno svojstvo populacije i zašto se koristi u statistici? 3. Koje su glavne vrste medija

Suština opće populacije i populacije uzorka
U statistici, kontinuirana vrsta posmatranja, kao što je, na primjer, opći popis stanovništva, relativno je rijetka. Ipak, najčešće je potrebno koristiti nepotpuna zapažanja, koja

Koncept stohastičke populacije
U realnim uslovima, slučajevi statističkog rada sa opštom populacijom su relativno retki i stoga nije uvek moguće dobiti osnovne statističke karakteristike

Suština selektivne metope
Statistički rad je u većini slučajeva na neki način povezan sa podacima dobijenim kao rezultat primjene metode uzorkovanja. Mnoge studije bi bile nemoguće da se ne koriste

Prednosti i nedostaci metode uzorkovanja
Metoda uzorkovanja ima brojne prednosti u odnosu na kontinuirano posmatranje. Prvo, selektivno posmatranje može značajno uštedjeti rad, novac i vrijeme za njegovu provedbu. Sova

Metode odabira, njihove prednosti i nedostaci
Odabir statističkih jedinica iz opšte populacije može se vršiti na različite načine i zavisi od mnogih uslova. Metoda uzorkovanja uključuje sljedeće metode za odabir statističkih jedinica: slučaj

Suština grešaka reprezentativnosti i postupak njihovog izračunavanja
Jedno od centralnih pitanja u metodi uzorkovanja je teorijsko izračunavanje glavnih statističkih karakteristika i, prije svega, prosječne vrijednosti atributa u opštoj statističkoj mjeri.

Koncept malog uzorka. Tačkasta procjena osnovnih statističkih karakteristika
Upotreba metode uzorkovanja može se zasnivati ​​na odabiru iz opšte populacije teoretski bilo kojeg broja statističkih jedinica. Matematički je dokazano da uzorkovane populacije mogu biti

Granična greška uzorkovanja. Intervalna evaluacija osnovnih statističkih karakteristika
Marginalna greška uzorkovanja je neslaganje između statističkih karakteristika dobijenih u uzorku i opšte populacije.Kao što je prikazano gore (formula

Tehnike za izračunavanje veličine uzorka za različite metode selekcije
Pripremni radovi Provođenje opservacije uzorka direktno je povezano s određivanjem potrebne veličine uzorka, koja ovisi o metodi odabira i broju jedinica u općem

Koncept sekundarnog (kompleksnog) statističkog sažetka
Rezultati jednostavnog sažetka, čiji je sadržaj razmatran u temi 2, ne mogu uvijek zadovoljiti istraživača, jer oni samo daju opšta ideja o objektu koji se proučava, tj. iz statistike t

Tipološke grupe
Tipološko grupisanje je podjela statističke populacije na suštinski iste kvalitativne tipološke grupe. Tipološko grupisanje

Strukturne grupe
Strukturno grupisanje se sastoji u podjeli homogenog i kvalitativnog skupa statističkih jedinica u grupe koje karakteriziraju sastav složenog objekta. Kroz strukturne

Suština i postupak izvođenja jednostavnog i analitičkog grupiranja
Analitičko grupisanje, u kojem se statistička populacija dijeli na homogene grupe prema jednom faktorskom atributu, naziva se jednostavno.

Analitičko grupisanje
br. Grupe gazdinstava po dozama đubriva, t/ha. Znakovi učestalosti u grupama (broj populacijskih jedinica u grupi)

Pokazatelji učinka u uzgoju krompira
Artikal br. Pokazatelji Grupe gazdinstava prema dozi đubriva, t/ha Ukupno (u prosjeku) 10-20

Suština i značenje statističkih tabela
Rezultati obrade podataka opservacije korištenjem raznih statističkih metoda (sažeti, relativne, prosječne vrijednosti, formacije, varijacione serije, indikatori varijacije, analitičke

Elementarni sastav statističkih tabela
Kompleksna statistička obrada rezultata posmatranja obično uključuje upotrebu brojnih tabela. Stoga je svakoj tablici dodijeljen pojedinačni broj.

Vrste i oblici statističkih tabela
U zavisnosti od strukture predmeta tabele, razlikuju se sledeće vrste statističkih tabela: jednostavne, grupne i kombinovane. Jednostavna statistička tabela - hara

Statističke tabele podrške i performansi
Statističke tabele mogu imati različite funkcionalne uloge. Neki od njih služe, na primjer, za sumiranje rezultata statističkog promatranja i doprinose obavljanju primarne funkcije

Rezultati proizvodnje, 2003
(tabela kombinacija) Art.br. Grupe gazdinstava prema opterećenju poljoprivrednog zemljišta po 1 traktoru, ha Podgrupe farmi po opterećenju

Preduzeća za preradu lana agroindustrijskog kompleksa 2003
(radni list) Jedinica br. Godišnji obim prerade trustova, tona Broj zaposlenih, ljudi Nosivost a

Dizajn statističkih tabela
Ostvarivanje ciljeva tabelarnom metodom moguće je u slučajevima kada su ispunjeni neophodni uslovi za izradu statističkih tabela. Obično bi svi stolovi trebali imati

Koncept metode disperzije
Naziv metode je zbog njene široke upotrebe razne vrste disperzije, čija su suština i načini izračunavanja obrađeni u šestoj temi udžbenika. Preporučljivo je napomenuti da je varijacija u količini

Znak-rezultat
Br. Pojedinačne opcije Linearna odstupanja individualna. opcija od prosječnog kvadrata linearnih devijacija

Seljačke farme
Br. Produktivnost, c/ha Linearna odstupanja individualne produktivnosti od prosječne, c/ha Kvadratna linearna odstupanja prinosa

Kasna plamenjača na prinosu krompira
br. Grupe gazdinstava prema udjelu tretiranih usjeva, % Broj gazdinstava u grupi Prosječan udio tretiranih usjeva,

Znak-rezultat
Grupni broj Intervali po faktorskoj karakteristici Lokalna frekvencija Prosječna varijanta efektivne karakteristike

Vrste disperzija. Pravilo dodavanja varijanse
Načelo izračunavanja disperzije (srednje kvadratne devijacije) je općenito obrađeno u temi 6. U odnosu na metodu disperzije, to znači da svaka vrsta varijacije odgovara određenoj

Prinos krompira (prva grupa)
Artikal br. Produktivnost, c/ha Linearna devijacija od prosječnog grupnog prinosa Kvadratna linearna odstupanja

Koncept R. Fisherovog kriterija
Metoda disperzije sastoji se od procene odnosa korigovane varijanse, koja karakteriše sistematske fluktuacije grupnih prosečnih vrednosti proučavane efektivne karakteristike, prema korigovanoj varijansi

Dvofaktorski disperzioni kompleks
Rešenje ovog kompleksa ima za cilj proučavanje kvalitativnog uticaja dve faktorske karakteristike na uticaj dve faktorske karakteristike na jednu ili više efektivnih karakteristika. Dvofaktorski kompleks

Usjevi žitarica
Br. podgrupe Broj gazdinstava u podgrupi Prosečan prinos c/ha Linearna odstupanja prinosa u podgrupi od proseka

Karakteristike kompleksa multifaktorske disperzije
Proučavanje kvaliteta komunikacije, tj. značaj uticaja nekoliko (tri, četiri ili više) faktorskih karakteristika na pokazatelje učinka, u suštini trajanje kombinovane upotrebe

Prinos zrna
Artikal br. Elementi varijacija Simboli Ukupna varijacija Sistematska varijacija Preostala varijacija

Suština i vrste korelacija
U prethodnom poglavlju pokazano je da se kvalitet (značajnost) veze između faktora i karakteristika performansi u statističkoj populaciji utvrđuje i procjenjuje korištenjem varijanse

Osnovni oblici korelacije između karakteristika
Identifikovanju oblika veze između karakteristika prethodi utvrđivanje uzročne veze između njih. Ovo je najvažniji i presudni momenat za ispravnu upotrebu metode korelacije. By

Indikatori bliskosti korelacija. Korelacioni odnos
Jedno od centralnih pitanja koje se rješava korištenjem korelacijske metode je određivanje i procjena kvantitativne mjere bliskosti odnosa između faktora i karakteristika učinka. At

Koeficijenti korelacije pravolinijskih parova
Ako je odnos između karakteristika proučavanog para karakteristika izražen u obliku bliskom direktnom, onda se stepen bliskosti odnosa između ovih karakteristika može izračunati pomoću koeficijenta pr

Koeficijent korelacije ranga
Osnovne statističke karakteristike u slučajevima kada je opća populacija iz koje je uzet uzorak izvan parametara normalnog ili njemu bliskog zakona distribucije

Višestruki koeficijent korelacije
Prilikom proučavanja bliskosti veze između nekoliko faktora i karakteristika performansi, izračunava se kumulativni koeficijent višestruke korelacije. Dakle, prilikom određivanja ukupnog m

Pokazatelji determinacije
Prilikom proučavanja kvantitativnog uticaja karakteristika – faktora na rezultate, važno je utvrditi koji je deo varijabilnosti rezultujuće karakteristike direktno posledica uticaja varijacije koju proučavamo.

Suština, vrste i značenje regresijskih jednačina
Regresija se shvata kao funkcija dizajnirana da opiše zavisnost promena efektivnih karakteristika pod uticajem fluktuacija karakteristika – faktora. Koncept regresije je uveden u statistiku

Jednačina ravne regresije
Korelacioni odnos u obliku bliskom pravolinijskom može se predstaviti kao jednačina prave linije:

Hiperbolička regresijska jednačina
Ako se oblik veze između faktora-atributa i atributa-rezultata, identificiranog pomoću koordinatnog dijagrama (korelacijskog polja), približi hiperboličnom, tada je potrebno sastaviti i riješiti jednačinu

Regresije
Artikal br. Znak-faktor Znak-rezultat Obrnuta vrijednost faktora predznaka Kvadrat recipročne vrijednosti

Hiperbolička regresija
Artikal br. Prinos graška, c/ha X Troškovi graška, hiljada rubalja/c Y Procijenjene vrijednosti

Parabolična regresijska jednačina
U nekim slučajevima, empirijski podaci iz statističke populacije, vizuelno prikazani pomoću koordinatnog dijagrama, pokazuju da je povećanje faktora praćeno ubrzanim rastom res.

Parabolična regresija
Artikl br. X Y XY X2 X2U X4

Parabolična regresija
Artikl br. Udio usjeva krompira, X Žetva krompira, hiljada c. U Izračun vrijednosti

Jednačina višestruke regresije
Korištenje metode korelacije u proučavanju ovisnosti karakteristike-rezultata o nekoliko faktorskih karakteristika formira se prema shemi sličnoj jednostavnoj (uparenoj) korelaciji. Jedan od

Koeficijenti elastičnosti
Za smislen i pristupačan opis (interpretaciju) rezultata koji odražavaju ovisnost korelacije-regresije između karakteristika kroz različite regresijske jednadžbe, obično koristite

Suština vremenske serije
Svi fenomeni okolnog svijeta prolaze kroz kontinuirane promjene tokom vremena; tokom vremena, tj. njihov volumen, nivo, sastav, struktura itd. mijenjaju se tokom vremena. preporučljivo je napomenuti da prema

Poljoprivredna preduzeća
(na početku godine; hiljada fizičkih jedinica) Indikatori 2000. 2001. 2002. 2003.

Glavni indikatori vremenske serije
Sveobuhvatna analiza vremenskih serija otkrit će i okarakterizirati obrasce koji se manifestiraju različite faze razvoj fenomena, identifikovati trendove i karakteristike razvoja ovih pojava. In pro

Apsolutni nivo se povećava
Jedan od najjednostavnijih pokazatelja razvoja dinamike je apsolutno povećanje nivoa. Apsolutni rast je razlika između dva nivoa vremenske serije

Stopa rasta nivoa
Za karakterizaciju relativne stope promjene, indikator stope rasta. Stopa rasta je odnos jednog nivoa dinamičke serije prema drugom, uzet kao osnova za poređenje. stopa rasta može biti

Stopa rasta nivoa
Ako je apsolutna stopa povećanja nivoa dinamičke serije karakterizirana veličinom apsolutnih povećanja, onda je relativna stopa povećanja nivoa karakterizirana stopom povećanja. Temp at

Apsolutna vrijednost povećanja od jedan posto
Prilikom analize vremenskih serija često se postavlja zadatak: saznati u kojim se apsolutnim vrijednostima izražava povećanje (smanjenje) nivoa od 1%, jer u nizu slučajeva, kada se stopa rasta smanjuje (usporava)

Za 1999-2003
Godine Produktivnost, c/ha Apsolutni porast prinosa, c/ha Stopa rasta, % Stopa rasta, %

Tehnike usklađivanja vremenskih serija
Da bi se identifikovali vremenski obrasci, obično je potreban prilično veliki broj nivoa, vremenske serije. Ako se vremenska serija sastoji od ograničenog broja nivoa, onda je njeno usklađivanje

Metode za analitičko usklađivanje vremenskih serija
Identifikacija opšteg trenda u razvoju nivoa dinamičkog niza može se izvršiti korišćenjem različitih metoda analitičkog usklađivanja, koje se najčešće sprovodi.

Analitičko poravnanje pomoću eksponencijalne krivulje
U nekim slučajevima, na primjer, tokom procesa puštanja u rad i razvoja novih proizvodnih kapaciteta, dinamičku seriju može karakterizirati brzo rastuća promjena nivoa, tj. lančani

Analitičko poravnanje pomoću parabole drugog reda
Ako se dinamički niz koji se proučava karakteriziraju pozitivni apsolutni porasti, uz ubrzanje razvoja nivoa, tada se poravnavanje serije može izvesti pomoću parabole drugog reda.

Analitičko poravnanje pomoću jednadžbe hiperbole
Ako dinamičku seriju karakterizira blijedi apsolutni pad nivoa (na primjer, dinamika intenziteta rada proizvoda, ponuda radne snage u poljoprivredi, itd.), tada nivo

Koncept interpolacije i ekstrapolacije nivoa vremenskih serija
U nekim slučajevima, potrebno je pronaći vrijednosti nedostajućih srednjih nivoa vremenske serije na osnovu njenih poznatih vrijednosti. U takvim slučajevima može se koristiti tehnika interpolacije,

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”