Zašto je potreban interval povjerenja? Interval povjerenja

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Interval povjerenja– granične vrijednosti statističke veličine koja će, sa datom sigurnošću γ, biti u ovom intervalu prilikom uzorkovanja veće količine. Označava se kao P(θ - ε. U praksi, vjerovatnoća pouzdanosti γ se bira između vrijednosti koje su prilično bliske jedinici: γ = 0,9, γ = 0,95, γ = 0,99.

Svrha usluge. Koristeći ovu uslugu, možete odrediti:

  • interval povjerenja za opću srednju vrijednost, interval povjerenja za varijansu;
  • interval povjerenja za standardnu ​​devijaciju, interval povjerenja za generalni udio;
Rezultirajuće rješenje se pohranjuje u Word datoteku (pogledajte primjer). Ispod je video uputstvo kako popuniti početne podatke.

Primjer br. 1. Na kolektivnoj farmi, od ukupnog stada od 1000 ovaca, 100 ovaca je podvrgnuto selektivnoj kontroli. Kao rezultat, utvrđeno je prosječno šišanje vune od 4,2 kg po ovci. Odrediti s vjerovatnoćom od 0,99 srednju kvadratnu grešku uzorka pri određivanju prosječnog striženja vune po ovci i granice unutar kojih se nalazi vrijednost striženja ako je varijansa 2,5. Uzorak se ne ponavlja.
Primjer br. 2. Iz serije uvezenih proizvoda na pošti Moskovske sjeverne carine uzeto je 20 uzoraka proizvoda „A“ slučajnim ponovljenim uzorkovanjem. Kao rezultat ispitivanja, utvrđen je prosječni sadržaj vlage proizvoda „A“ u uzorku, koji se pokazao jednakim 6% sa standardnom devijacijom od 1%.
Odrediti sa vjerovatnoćom 0,683 granice prosječnog sadržaja vlage proizvoda u cijeloj seriji uvezenih proizvoda.
Primjer br. 3. Anketa od 36 studenata pokazala je da je prosječan broj udžbenika koji su pročitali tokom školske godine jednak 6. S obzirom na to da broj udžbenika koji student pročita po semestru ima normalan zakon raspodjele sa prosjekom kvadratna devijacija, jednako 6, naći: A) sa pouzdanošću od 0,99, intervalnu procjenu za matematičko očekivanje ove slučajne varijable; B) s kojom vjerovatnoćom možemo reći da će prosječan broj udžbenika koje student pročita po semestru, izračunat iz ovog uzorka, odstupiti od matematičkog očekivanja u apsolutnoj vrijednosti za najviše 2.

Klasifikacija intervala povjerenja

Po vrsti parametra koji se procjenjuje:

Po vrsti uzorka:

  1. Interval pouzdanosti za beskonačan uzorak;
  2. Interval pouzdanosti za konačni uzorak;
Uzorak se naziva resampling, ako se odabrani objekt vrati u populaciju prije odabira sljedećeg. Uzorak se naziva neponavljanjem, ako se odabrani objekt ne vrati u populaciju. U praksi se obično bavimo uzorcima koji se ne ponavljaju.

Izračunavanje prosječne greške uzorkovanja za slučajno uzorkovanje

Nesklad između vrijednosti indikatora dobijenih iz uzorka i odgovarajućih parametara opće populacije naziva se greška reprezentativnosti.
Oznake glavnih parametara opće populacije i populacije uzorka.
Formule prosječne greške uzorkovanja
ponovna selekcijaponovite odabir
za prosjekza dionicuza prosjekza dionicu
Odnos između granice greške uzorkovanja (Δ) zajamčen s određenom vjerovatnoćom R(t), I prosečna greška uzorak ima oblik: ili Δ = t·μ, gdje je t– koeficijent pouzdanosti, određen u zavisnosti od nivoa verovatnoće P(t) prema tabeli Laplaceove integralne funkcije.

Formule za izračunavanje veličine uzorka koristeći metodu čisto slučajnog uzorkovanja

Interval pouzdanosti za matematička očekivanja - ovo je interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje opće populacije. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Zbog toga ćemo tokom čitave lekcije koristiti pojmove „prosjek“ i „prosječna vrijednost“. U računskim problemima interval povjerenja najčešće vam je potreban odgovor poput „Interval pouzdanosti srednje vrijednosti [vrijednosti u određenom problemu] je od [manje vrijednosti] do [ veća vrijednost]". Koristeći interval povjerenja, možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. Prosječne vrijednosti, disperzija, standardna devijacija i greška, kroz koje ćemo doći do novih definicija i formula, o kojima se govori u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je srednja vrijednost populacije procijenjena brojem (tačkom), onda za procjenu nepoznato prosječne veličine opšte populacije uzima se specifičan prosjek, koji se izračunava na osnovu uzorka opservacija. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga, kada pokazujete srednju vrijednost uzorka, morate istovremeno naznačiti grešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koji je izražen u istim jedinicama kao i prosjek. Stoga se često koristi sljedeća notacija: .

Ako procjenu prosjeka treba povezati sa određenom vjerovatnoćom, onda se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom P nalazi se vrijednost indikatora procijenjenog stanovništva. Interval povjerenja u kojem je vjerovatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije. Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljena je informacija da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval pouzdanosti od 95% za broj zaposlenih u kafiću.

Gdje - kritična vrijednost standardna normalna distribucija za nivo značajnosti α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte 95% interval pouzdanosti za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opservacija, izračunata srednja vrijednost je 15,2, a standardna devijacija je 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu nepromijenjene, a koeficijent pouzdanosti raste, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ponovo zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako se interval pouzdanosti od 99% za srednju vrijednost ovog uzorka kretao od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se početna i završna tačka intervala nalaze dalje od srednje vrijednosti, a samim tim raste i interval povjerenja za matematičko očekivanje. .

Tačkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se tumačiti kao bodovna procjena udjela str iste karakteristike u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandiduju se za gradonačelnika. Anketirano je nasumično 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Ugradimo u MS EXCEL trust interval za procjenu srednje vrijednosti distribucije u slučaju poznata vrijednost varijanse.

Naravno izbor nivo poverenja u potpunosti zavisi od problema koji se rešava. Dakle, stepen povjerenja putnika u pouzdanost aviona nesumnjivo bi trebao biti veći od stepena povjerenja kupca u pouzdanost električne sijalice.

Formulacija problema

Pretpostavimo da od stanovništva oduzeto uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Na osnovu ovoga je neophodno uzorci proceniti nepoznato srednja distribucija(μ, ) i konstruisati odgovarajuće dvostrano interval povjerenja.

Tačka procjena

Kao što je poznato iz statistika(označimo ga X avg) je nepristrasna procjena srednje vrijednosti ovo stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka: Šta učiniti ako trebate graditi interval povjerenja u slučaju distribucije koja nije normalno? U ovom slučaju dolazi u pomoć, što govori da je dovoljno velika veličina uzorci n iz distribucije ne biti normalno, uzorak distribucije statistike X prosće otprilike dopisivati ​​se normalna distribucija sa parametrima N(μ;σ 2 /n).

dakle, tačka procene prosjek vrijednosti distribucije imamo - ovo srednja vrijednost uzorka, tj. X avg. Hajdemo sada interval povjerenja.

Izgradnja intervala povjerenja

Obično, poznavajući distribuciju i njene parametre, možemo izračunati vjerovatnoću da će slučajna varijabla uzeti vrijednost iz intervala koji odredimo. Sada uradimo suprotno: pronađite interval u koji će slučajna varijabla pasti sa datom vjerovatnoćom. Na primjer, iz svojstava normalna distribucija poznato je da je sa vjerovatnoćom od 95% slučajna varijabla raspoređena po normalan zakon, pasti će u raspon od približno +/- 2 od prosječna vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip interval povjerenja.

Sada da vidimo da li znamo distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo navesti oblik distribucije i njene parametre.

Znamo oblik distribucije - to je normalna distribucija(zapamtite da mi pričamo o tome O distribucija uzorkovanja statistika X avg).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval povjerenja), ali imamo procjenu toga X prosječno, izračunato na osnovu uzorci, koji se mogu koristiti.

Drugi parametar - standardna devijacija srednje vrijednosti uzorka smatraćemo to poznatim, jednako je σ/√n.

Jer ne znamo μ, onda ćemo izgraditi interval +/- 2 standardne devijacije ne od prosječna vrijednost, i iz njegove poznate procjene X avg. One. prilikom izračunavanja interval povjerenja to NEĆEMO pretpostaviti X avg spada u raspon +/- 2 standardne devijacije od μ sa vjerovatnoćom od 95%, a pretpostavićemo da je interval +/- 2 standardne devijacije od X avg sa 95% vjerovatnoće će pokriti μ – prosek opšte populacije, iz koje se uzima uzorak. Ove dvije izjave su ekvivalentne, ali nam druga izjava omogućava konstruiranje interval povjerenja.

Uz to, razjasnimo interval: slučajna varijabla raspoređena po normalan zakon, sa vjerovatnoćom od 95% spada u interval +/- 1.960 standardne devijacije, ne +/- 2 standardne devijacije. Ovo se može izračunati pomoću formule =NORM.ST.REV((1+0,95)/2), cm. primjer datoteke Sheet Interval.

Sada možemo formulisati verovatnoćan iskaz koji će nam poslužiti za formiranje interval povjerenja:
„Verovatnoća da srednja populacija nalazi se od prosek uzorka unutar 1.960 " standardne devijacije srednje vrijednosti uzorka", jednako 95%".

Vrijednost vjerovatnoće spomenuta u izjavi ima poseban naziv , koji je povezan sa nivo značajnosti α (alfa) jednostavnim izrazom nivo poverenja =1 . U našem slučaju nivo značajnosti α =1-0,95=0,05 .

Sada, na osnovu ove vjerovatnoće, pišemo izraz za izračunavanje interval povjerenja:

gdje je Z α/2 standard normalna distribucija(ova vrijednost slučajne varijable z, Šta P(z>=Z α/2 )=α/2).

Bilješka: Gornji α/2-kvantil definiše širinu interval povjerenja V standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija uvijek veće od 0, što je vrlo zgodno.

U našem slučaju, sa α=0,05, gornji α/2-kvantil jednako 1.960. Za druge nivoe značajnosti α (10%; 1%) gornji α/2-kvantil Z α/2 može se izračunati pomoću formule =NORM.ST.REV(1-α/2) ili, ako je poznato nivo poverenja, =NORM.ST.OBR((1+nivo povjerenja)/2).

Obično prilikom izgradnje intervali povjerenja za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i nemojte koristiti niži α/2-kvantil. Ovo je moguće jer standard normalna distribucija simetrično oko x ose ( njegova gustina distribucije simetrično oko prosjek, tj. 0). Stoga nema potrebe za kalkulacijom niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo da je, uprkos obliku distribucije vrijednosti x, odgovarajuća slučajna varijabla X avg distribuirano otprilike U redu N(μ;σ 2 /n) (vidi članak o). Stoga, u opšti slučaj, gornji izraz za interval povjerenja je samo aproksimacija. Ako je vrijednost x raspoređena po normalan zakon N(μ;σ 2 /n), zatim izraz za interval povjerenja je tačno.

Izračunavanje intervala pouzdanosti u MS EXCEL-u

Hajde da rešimo problem.
Vrijeme odziva elektronske komponente na ulazni signal je važna karakteristika uređaja. Inženjer želi da konstruiše interval pouzdanosti za prosečno vreme odgovora na nivou pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je za procjenu vremena odziva inženjer izvršio 25 mjerenja, prosječna vrijednost bila je 78 ms.

Rješenje: Inženjer želi znati vrijeme odziva elektronskog uređaja, ali razumije da vrijeme odziva nije fiksno, već slučajna varijabla, koji ima svoju distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uslova problema ne znamo oblik distribucije vremena odziva (ne mora biti normalno). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerovatnoće i konstruirati interval povjerenja.

Međutim, uprkos činjenici da ne znamo distribuciju vrijeme odvojen odgovor, znamo da prema CPT, distribucija uzorkovanja prosječno vrijeme odgovora je približno normalno(pretpostavićemo da su uslovi CPT se sprovode, jer veličina uzorci prilično velika (n=25)) .

Štaviše, prosjek ova distribucija je jednaka prosječna vrijednost distribucija jednog odgovora, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Takođe je poznato da je inženjer primio tačka procene parametar μ jednak 78 ms (X pros.). Dakle, sada možemo izračunati vjerovatnoće, jer znamo oblik distribucije ( normalno) i njegove parametre (X avg i σ/√n).

Inženjer želi da zna očekivanu vrijednostμ distribucije vremena odziva. Kao što je gore navedeno, ovaj μ je jednak matematičko očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X avg; σ/√n), tada će željeni μ biti u opsegu +/-2*σ/√n sa vjerovatnoćom od približno 95%.

Nivo značaja jednako 1-0,95=0,05.

Konačno, pronađimo lijevu i desnu granicu interval povjerenja.
Lijeva granica: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Desna granica: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Lijeva granica: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Desna granica: =NORM.REV(1-0,05/2; 78; 8/KORIJEN(25))

Odgovori: interval povjerenja at 95% nivo pouzdanosti i σ=8msec jednaki 78+/-3,136 ms.

IN primjer datoteke na Sigma listu poznat, kreirao obrazac za obračun i konstrukciju dvostrano interval povjerenja za proizvoljno uzorci sa datim σ i nivo značaja.

CONFIDENCE.NORM() funkcija

Ako vrijednosti uzorci su u dometu B20:B79 , A nivo značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEK(B20:B79)-POVJERENJE.NORMA(0,05;σ; BROJ(B20:B79))
će vratiti lijevu ivicu interval povjerenja.

Ista granica se može izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE.NORM() pojavila se u MS EXCEL-u 2010. U ranijim verzijama MS EXCEL-a, korištena je funkcija TRUST().

Jedna od metoda rješenja statistički problemi je izračun intervala povjerenja. Koristi se kao poželjnija alternativa tačka procene sa malom veličinom uzorka. Treba napomenuti da je sam proces izračunavanja intervala povjerenja prilično složen. Ali Excel alati to donekle olakšavaju. Hajde da saznamo kako se to radi u praksi.

Ova metoda se koristi kada intervalna procjena razne statističke veličine. Glavni zadatak ovog proračuna je da se riješi nesigurnosti procjene bodova.

U Excelu postoje dvije glavne opcije za izvođenje izračuna pomoću ove metode: kada je varijansa poznata i kada je nepoznata. U prvom slučaju, funkcija se koristi za proračune TRUST.NORM, a u drugom - POVJERENIK.STUDENT.

Metoda 1: funkcija NORMA POVJERENJA

Operater TRUST.NORM, koji pripada statističkoj grupi funkcija, prvi put se pojavio u programu Excel 2010. Ranije verzije ovog programa koriste njegov analog TRUST. Svrha ovog operatora je izračunavanje normalno raspoređenog intervala povjerenja za srednju vrijednost populacije.

Njegova sintaksa je sljedeća:

POVJERENJE.NORMA(alfa;standard_isključeno;veličina)

"Alfa"— argument koji ukazuje na nivo značajnosti koji se koristi za izračunavanje nivoa pouzdanosti. Nivo samopouzdanja jednako sljedećem izrazu:

(1-"Alfa")*100

"Standardna devijacija"- Ovo je argument čija je suština jasna iz imena. Ovo je standardna devijacija predloženog uzorka.

"Veličina"— argument koji definira veličinu uzorka.

Svi argumenti za ovaj operator su obavezni.

Funkcija TRUST ima potpuno iste argumente i mogućnosti kao i prethodni. Njegova sintaksa je:

VERUST(alfa, standard_off, veličina)

Kao što vidite, razlike su samo u nazivu operatera. Iz razloga kompatibilnosti, ova funkcija je ostavljena u programu Excel 2010 i novijim verzijama u posebnoj kategoriji "Kompatibilnost". U verzijama programa Excel 2007 i starijim, prisutan je u glavnoj grupi statističkih operatora.

Granica intervala pouzdanosti određuje se pomoću sljedeće formule:

X+(-)NORMA POUZDANJA

Gdje X je prosječna vrijednost uzorka, koja se nalazi u sredini odabranog raspona.

Pogledajmo sada kako izračunati interval pouzdanosti na konkretan primjer. Urađeno je 12 testova koji su rezultirali različitim rezultatima navedenim u tabeli. Ovo je naš totalitet. Standardna devijacija je 8. Potrebno je da izračunamo interval pouzdanosti na nivou pouzdanosti od 97%.

  1. Odaberite ćeliju u kojoj će se prikazati rezultat obrade podataka. Kliknite na dugme "Insert Function".
  2. Pojavljuje se Čarobnjak za funkcije. Idi na kategoriju "Statistički" i označite ime "POVERENJE.NORMA". Nakon toga kliknite na dugme "UREDU".
  3. Otvara se prozor sa argumentima. Njegova polja prirodno odgovaraju imenima argumenata.
    Postavite kursor u prvo polje - "Alfa". Ovdje treba naznačiti nivo značaja. Koliko se sjećamo, naš nivo povjerenja je 97%. Istovremeno smo rekli da se izračunava na ovaj način:

    (1-nivo povjerenja)/100

    Odnosno, zamjenom vrijednosti dobijamo:

    Jednostavnim proračunima saznajemo da je argument "Alfa" jednaki 0,03 . Unesite ovu vrijednost u polje.

    Kao što je poznato, po uslovu je standardna devijacija jednaka 8 . Dakle, na terenu "Standardna devijacija" samo zapišite ovaj broj.

    Na terenu "Veličina" potrebno je da unesete broj izvršenih testnih elemenata. Koliko se sjećamo, njihove 12 . Ali kako bismo automatizirali formulu i ne bismo je uređivali svaki put kada provodimo novi test, postavimo ovu vrijednost ne običnim brojem, već pomoću operatora CHECK. Dakle, postavimo kursor u polje "Veličina", a zatim kliknite na trokut koji se nalazi lijevo od trake formule.

    Pojavljuje se lista nedavno korištenih funkcija. Ako operater CHECK koju ste nedavno koristili, trebao bi biti na ovoj listi. U ovom slučaju, samo trebate kliknuti na njegovo ime. U suprotnom, ako ga ne pronađete, pređite na stvar "Druge funkcije...".

  4. Pojavljuje se već poznati Čarobnjak za funkcije. Vratimo se ponovo na grupu "Statistički". Tu ističemo ime "PROVJERI". Kliknite na dugme "UREDU".
  5. Pojavljuje se prozor za argumente za gornju izjavu. Ova funkcija je dizajnirana da izračuna broj ćelija u određenom rasponu koje sadrže numeričke vrijednosti. Njegova sintaksa je sljedeća:

    COUNT(vrijednost1,vrijednost2,…)

    Grupa argumenata "Vrijednosti" je referenca na raspon u kojem želite izračunati broj ćelija ispunjenih numeričkim podacima. Takvih argumenata može biti do 255 ukupno, ali u našem slučaju nam je potreban samo jedan.

    Postavite kursor u polje "Vrijednost1" i, držeći lijevu tipku miša, odaberite na listu raspon koji sadrži našu kolekciju. Tada će njegova adresa biti prikazana u polju. Kliknite na dugme "UREDU".

  6. Nakon toga, aplikacija će izvršiti proračun i prikazati rezultat u ćeliji u kojoj se nalazi. U našem konkretnom slučaju formula je izgledala ovako:

    NORMA POUZDANJA(0.03,8,BROJ(B2:B13))

    Ukupan rezultat proračuna je bio 5,011609 .

  7. Ali to nije sve. Kao što se sjećamo, granica intervala povjerenja izračunava se dodavanjem i oduzimanjem rezultata izračuna od srednje vrijednosti uzorka TRUST.NORM. Na ovaj način se izračunavaju desna i lijeva granica intervala povjerenja. Sama srednja vrijednost uzorka može se izračunati pomoću operatora PROSJEČNO.

    Ovaj operator je dizajniran za izračunavanje prosjeka aritmetička vrijednost odabrani raspon brojeva. Ima sljedeću prilično jednostavnu sintaksu:

    PROSEK(broj1,broj2,…)

    Argument "Broj" mogu biti odvojene numerička vrijednost, i vezu do ćelija ili čak cijelih raspona koji ih sadrže.

    Dakle, odaberite ćeliju u kojoj će se prikazati izračun prosječne vrijednosti i kliknite na dugme "Insert Function".

  8. Otvara se Čarobnjak za funkcije. Vraćam se na kategoriju "Statistički" i izaberite ime sa liste "PROSJEČNO". Kao i uvijek, kliknite na dugme "UREDU".
  9. Otvara se prozor sa argumentima. Postavite kursor u polje "Broj 1" i držeći lijevu tipku miša, odaberite cijeli raspon vrijednosti. Nakon što se koordinate prikažu u polju, kliknite na dugme "UREDU".
  10. Nakon toga PROSJEČNO prikazuje rezultat proračuna u elementu lista.
  11. Izračunavamo desnu granicu intervala povjerenja. Da biste to učinili, odaberite zasebnu ćeliju i stavite znak «=» i sabirati sadržaj elemenata lista u kojima se nalaze rezultati proračuna funkcije PROSJEČNO I TRUST.NORM. Da izvršite proračun, pritisnite dugme Enter. U našem slučaju dobili smo sljedeću formulu:

    Rezultat izračuna: 6,953276

  12. Na isti način izračunavamo lijevu granicu intervala povjerenja, samo ovaj put iz rezultata proračuna PROSJEČNO oduzmi rezultat izračunavanja operatora TRUST.NORM. Rezultirajuća formula za naš primjer je sljedećeg tipa:

    Rezultat izračuna: -3,06994

  13. Pokušali smo detaljno opisati sve korake za izračunavanje intervala povjerenja, pa smo svaku formulu detaljno opisali. Ali možete kombinirati sve radnje u jednoj formuli. Izračun desne granice intervala povjerenja može se napisati na sljedeći način:

    PROSJEČAN(B2:B13)+POVJERENJE.NORMA(0.03,8,BROJ(B2:B13))

  14. Sličan izračun za lijevu granicu bi izgledao ovako:

    PROSJEČAN(B2:B13)-POVJERENJE.NORMA(0.03,8,BROJ(B2:B13))

Metoda 2: funkcija TRUST.STUDENT

Osim toga, Excel ima još jednu funkciju koja je povezana s izračunavanjem intervala povjerenja - POVJERENIK.STUDENT. Pojavio se samo u Excelu 2010. Ovaj operator izračunava interval pouzdanosti populacije koristeći Studentovu distribuciju. Vrlo je zgodno koristiti kada su varijansa i, shodno tome, standardna devijacija nepoznati. Sintaksa operatora je:

POVJERENJE.STUDENT(alfa,standard_isključeno,veličina)

Kao što vidite, imena operatora su u ovom slučaju ostala nepromijenjena.

Pogledajmo kako izračunati granice intervala povjerenja s nepoznatom standardnom devijacijom na primjeru iste populacije koju smo razmatrali u prethodnoj metodi. Uzmimo nivo povjerenja kao prošli put od 97%.

  1. Odaberite ćeliju u kojoj će se izvršiti proračun. Kliknite na dugme "Insert Function".
  2. Na otvorenom Čarobnjak za funkcije idi u kategoriju "Statistički". Odaberite ime "STUDENT OD POUZDANJA". Kliknite na dugme "UREDU".
  3. Pokreće se prozor argumenata za navedeni operator.

    Na terenu "Alfa", s obzirom da je nivo pouzdanosti 97%, zapisujemo broj 0,03 . Drugi put se nećemo zadržavati na principima izračunavanja ovog parametra.

    Nakon toga, postavite kursor u polje "Standardna devijacija". Ovaj put ovaj indikator nam je nepoznat i treba ga izračunati. Ovo se radi pomoću posebna funkcijaSTDEV.V. Da biste otvorili prozor ovog operatora, kliknite na trokut lijevo od trake formule. Ako ne pronađemo željeno ime na listi koja se otvori, idite na stavku "Druge funkcije...".

  4. Počinje Čarobnjak za funkcije. Prelazak u kategoriju "Statistički" i označite ime u njemu "STDEV.V". Zatim kliknite na dugme "UREDU".
  5. Otvara se prozor sa argumentima. Zadatak operatera STDEV.V je definicija standardna devijacija prilikom uzorkovanja. Njegova sintaksa izgleda ovako:

    STANDARDNO ODSTUPANJE.B(broj1;broj2;…)

    Nije teško pogoditi taj argument "Broj" je adresa elementa za odabir. Ako je selekcija smještena u jedan niz, tada možete koristiti samo jedan argument da biste pružili vezu do ovog raspona.

    Postavite kursor u polje "Broj 1" i, kao i uvijek, držeći lijevu tipku miša, odaberite kolekciju. Nakon što su koordinate u polju, nemojte žuriti da pritisnete dugme "UREDU", jer će rezultat biti netačan. Prvo se moramo vratiti na prozor argumenata operatora POVJERENIK.STUDENT deponovati poslednji argument. Da biste to učinili, kliknite na odgovarajuće ime u traci formule.

  6. Ponovo se otvara prozor argumenta za već poznatu funkciju. Postavite kursor u polje "Veličina". Ponovo kliknite na trougao koji nam je već poznat da biste prešli na izbor operatora. Kao što razumete, treba nam ime "PROVJERI". Pošto smo koristili ovu funkciju kada se računa u prethodnoj metodi, u ovu listu tamo je, pa samo kliknemo na njega. Ako ga ne pronađete, slijedite algoritam opisan u prvoj metodi.
  7. Jednom u prozoru argumenata CHECK, postavite kursor u polje "Broj 1" i sa pritisnutim dugmetom miša izaberite kolekciju. Zatim kliknite na dugme "UREDU".
  8. Nakon toga, program vrši proračun i prikazuje vrijednost intervala povjerenja.
  9. Da bismo odredili granice, opet ćemo morati izračunati srednju vrijednost uzorka. Ali, s obzirom na to da se algoritam izračuna pomoću formule PROSJEČNO isto kao u prethodnoj metodi, pa čak i rezultat se nije promijenio, nećemo se drugi put detaljnije zadržavati na tome.
  10. Zbrajanje rezultata proračuna PROSJEČNO I POVJERENIK.STUDENT, dobijamo pravu granicu intervala pouzdanosti.
  11. Oduzimanje od rezultata izračuna operatora PROSJEČNO rezultat izračuna POVJERENIK.STUDENT, imamo lijevu granicu intervala povjerenja.
  12. Ako je izračun napisan u jednoj formuli, tada će izračunavanje desne granice u našem slučaju izgledati ovako:

    PROSJEČAN(B2:B13)+POVJERENJE.STUDENT(0,03,STDEV.B(B2:B13),BROJ(B2:B13))

  13. U skladu s tim, formula za izračunavanje lijeve granice će izgledati ovako:

    PROSJEČAN(B2:B13)-POVJERENJE.STUDENT(0,03,STDEV.B(B2:B13),BROJ(B2:B13))

Kao što vidite, Excel alati znatno olakšavaju izračunavanje intervala pouzdanosti i njegovih granica. U ove svrhe, odvojeni operatori se koriste za uzorke čija je varijansa poznata i nepoznata.

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nekretnina koja se procjenjuje nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak ne ispada uvijek homogen, ponekad ga je potrebno očistiti od ekstremnih tačaka - previsokih ili preniskih tržišnih ponuda. U tu svrhu se koristi interval povjerenja. Target ovu studiju- izvršiti uporednu analizu dvije metode za izračunavanje intervala povjerenja i odabrati optimalnu opciju proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval pouzdanosti je interval vrijednosti atributa koji se izračunava na osnovu uzorka, koji sa poznatom vjerovatnoćom sadrži procijenjeni parametar opće populacije.

Smisao izračunavanja intervala povjerenja je da se takav interval konstruiše na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može konstatovati da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sadrži nepoznatu vrijednost procijenjene vrijednosti sa određenom vjerovatnoćom. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo pogledati 2 metode:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritičnu vrijednost t-statistike (Studentov koeficijent).

Faze komparativna analiza Različiti putevi CI izračun:

1. formirati uzorak podataka;

2. obrađujemo statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijansu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i rezultirajuće intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom rasporeda „Hruščov“.

Tabela 1. Početni uzorak

Cijena 1 m2, jed

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka pomoću statističkih metoda zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan je broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak sa neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za precizniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljem tekstu - SD) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen rasipanja vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da originalni uzorak nije homogen, pa prijeđimo na izračunavanje intervala povjerenja.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun korištenjem medijane i standardne devijacije.

Interval pouzdanosti je definiran na sljedeći način: minimalna vrijednost- standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 1.



Metoda 2. Konstruiranje intervala povjerenja korištenjem kritične vrijednosti t-statistike (Student koeficijent)

S.V. Gribovski u knjizi “ Matematičke metode Procjena vrijednosti svojstva“ opisuje metodu za izračunavanje intervala povjerenja korištenjem Studentovog koeficijenta. Prilikom izračunavanja pomoću ove metode, procjenitelj mora sam postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se konstruirati interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni se dopisuju verovatnoće poverenja 0,9; 0,95 i 0,99. Ovom metodom se vjeruje prave vrednosti matematičko očekivanje i varijansa su praktično nepoznati (što je gotovo uvijek tačno kada se rješavaju praktični problemi procjene).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje iz posebnih statističkih tabela ili korištenjem MS Excel-a (→"Statistički"→ STUDIST);

∝ - nivo značajnosti, uzmite ∝=0,01.

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala povjerenja

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različita značenja intervalima. Shodno tome, dobili smo dva različita očišćena uzorka.

Tabela 3. Statistika za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna možemo reći da se vrijednosti intervala povjerenja dobivene različitim metodama ukrštaju, tako da možete koristiti bilo koju od metoda proračuna prema nahođenju procjenitelja.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja u zavisnosti od stepena razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu obračuna koristeći medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteno je sljedeće:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Sistemski podaci estimatica.pro

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”