Interval pouzdanosti Statistica. Interval pouzdanosti za matematička očekivanja

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Intervali pouzdanosti.

Kalkulacija interval povjerenja zasniva se na prosječnoj grešci odgovarajućeg parametra. Interval povjerenja pokazuje u kojim granicama sa vjerovatnoćom (1-a) je pravo značenje parametar koji se procjenjuje. Ovdje je a nivo značajnosti, (1-a) se također naziva vjerovatnoća povjerenja.

U prvom poglavlju smo pokazali da, na primjer, za aritmetičku sredinu, prava populacijska sredina u otprilike 95% slučajeva leži unutar 2 standardne greške srednje vrijednosti. Dakle, granice intervala pouzdanosti od 95% za srednju vrijednost će biti dvostruko dalje od srednje vrijednosti uzorka prosečna greška prosjek, tj. množimo prosječnu grešku prosjeka sa određenim koeficijentom u zavisnosti od verovatnoća poverenja. Za prosek i razliku proseka uzima se Student koeficijent (kritična vrednost Studentovog testa), za udeo i razliku udela kritična vrednost z kriterijuma. Umnožak koeficijenta i prosječne greške može se nazvati maksimalnom greškom datog parametra, tj. maksimum koji možemo dobiti kada ga procjenjujemo.

Interval pouzdanosti za aritmetička sredina : .

Evo srednje vrijednosti uzorka;

Srednja greška aritmetičke sredine;

s – standardna devijacija uzorka;

n

f = n-1 (Studentov koeficijent).

Interval pouzdanosti za razlike aritmetičkih sredina :

Evo razlike između srednjih vrijednosti uzorka;

- prosječna greška razlike aritmetičkih sredina;

s 1 , s 2 – uzorak sredstva standardne devijacije;

n1,n2

Kritična vrijednost Studentov t test za dati nivo značajnosti a i broj stepeni slobode f=n 1 +n 2-2 (Studentov koeficijent).

Interval pouzdanosti za dionice :

.

Ovdje je d frakcija uzorka;

– prosječna frakciona greška;

n– veličina uzorka (veličina grupe);

Interval pouzdanosti za razlika u udjelima :

Evo razlike u udjelima uzorka;

– prosječna greška razlike aritmetičkih sredina;

n1,n2– zapremine uzoraka (broj grupa);

Kritična vrijednost z kriterija na datom nivou značajnosti a ( , , ).

Izračunavajući intervale povjerenja za razliku između indikatora, mi, prvo, direktno vidimo moguće vrijednosti efekta, a ne samo njegove tačka procene. Drugo, možemo izvući zaključak o prihvatanju ili odbacivanju nulte hipoteze i, treće, možemo izvući zaključak o snazi ​​testa.

Prilikom testiranja hipoteza korištenjem intervala povjerenja, morate ih se pridržavati sledeće pravilo:

Ako 100(1-a) postotni interval pouzdanosti razlike u srednjim vrijednostima ne sadrži nulu, tada su razlike statistički značajne na nivou značajnosti a; naprotiv, ako ovaj interval sadrži nulu, onda razlike nisu statistički značajne.

Zaista, ako ovaj interval sadrži nulu, to znači da indikator koji se poredi može biti veći ili manji u jednoj od grupa u odnosu na drugu, tj. uočene razlike su rezultat slučajnosti.

Snaga testa može se ocijeniti po lokaciji nule unutar intervala povjerenja. Ako je nula blizu donje ili gornje granice intervala, onda bi možda kod većeg broja upoređenih grupa razlike dostigle statistički značaj. Ako je nula blizu sredine intervala, onda to znači da su i povećanje i smanjenje indikatora u eksperimentalnoj grupi podjednako vjerojatni i, vjerojatno, zaista nema razlika.

primjeri:

Da uporedimo hirurški mortalitet pri upotrebi dve različite vrste anestezije: 61 osoba je operisana sa prvom vrstom anestezije, 8 je umrlo, sa drugom vrstom – 67 osoba, 10 umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika u letalnosti upoređenih metoda biće u rasponu (-0,018 - 0,122; -0,018 + 0,122) ili (-0,14; 0,104) sa verovatnoćom od 100(1-a) = 95%. Interval sadrži nulu, tj. hipoteza o istoj smrtonosnosti kod dvoje različite vrste Anestezija se ne može odbiti.

Dakle, stopa mortaliteta može i hoće da se smanji na 14% i da poraste na 10,4% sa verovatnoćom od 95%, tj. nula je otprilike u sredini intervala, pa se može tvrditi da se ove dvije metode, najvjerovatnije, zaista ne razlikuju po smrtnosti.

U primjeru o kojem smo ranije govorili, uspoređeno je prosječno vrijeme pritiskanja tokom testa tapkanja četiri grupe studenti sa različitim rezultatima ispita. Izračunajmo intervale povjerenja za prosječno vrijeme presinga za studente koji su položili ispit sa ocjenama 2 i 5 i interval povjerenja za razliku između ovih prosjeka.

Studentovi koeficijenti se nalaze pomoću Studentovih tablica raspodjele (vidi prilog): za prvu grupu: = t(0,05;48) = 2,011; za drugu grupu: = t(0,05;61) = 2.000. Dakle, intervali povjerenja za prvu grupu: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugu grupu (156,55- 2,000*1,88 ; 156,08* = 156,08) 160.3). Dakle, za one koji su položili ispit sa 2, prosečno vreme pritiskanja se kreće od 157,8 ms do 166,6 ms sa verovatnoćom od 95%, za one koji su položili ispit sa 5 – od 152,8 ms do 160,3 ms sa verovatnoćom od 95% .

Također možete testirati nultu hipotezu koristeći intervale povjerenja za srednje vrijednosti, a ne samo za razliku u srednjim vrijednostima. Na primjer, kao u našem slučaju, ako se intervali povjerenja za srednje vrijednosti preklapaju, tada se nulta hipoteza ne može odbaciti. Da bi se odbacila hipoteza na odabranom nivou značaja, odgovarajući intervali pouzdanosti ne smiju se preklapati.

Nađimo interval povjerenja za razliku u prosječnom vremenu presinga u grupama koje su položile ispit sa ocjenama 2 i 5. Razlika prosjeka: 162,19 – 156,55 = 5,64. Studentov koeficijent: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupne standardne devijacije će biti jednake: ; . Izračunavamo prosječnu grešku razlike između srednjih vrijednosti: . Interval pouzdanosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Dakle, razlika u prosečnom vremenu pritiskanja u grupama koje su položile ispit sa 2 i 5 biće u rasponu od -0,044 ms do 11,33 ms. Ovaj interval uključuje nulu, tj. Prosječno vrijeme presinga za one koji su dobro položili ispit može se povećati ili smanjiti u odnosu na one koji su ispit položili nezadovoljavajuće, tj. nulta hipoteza se ne može odbaciti. Ali nula je vrlo blizu donje granice, a vrijeme presinga je mnogo vjerojatnije da će se smanjiti za one koji su dobro prošli. Dakle, možemo zaključiti da još uvijek postoje razlike u prosječnom vremenu presovanja između onih koji su prošli 2 i 5, samo ih nismo mogli uočiti s obzirom na promjenu prosječnog vremena, širenja prosječnog vremena i veličine uzorka.



Moć testa je vjerovatnoća odbacivanja netačne nulte hipoteze, tj. pronaći razlike tamo gdje one zaista postoje.

Snaga testa se određuje na osnovu nivoa značajnosti, veličine razlika između grupa, širenja vrednosti u grupama i veličine uzoraka.

Za Studentov t test i analizu varijanse mogu se koristiti dijagrami osjetljivosti.

Moć kriterija se može koristiti kada preliminarno utvrđivanje potreban broj grupa.

Interval pouzdanosti pokazuje unutar kojih granica leži prava vrijednost procijenjenog parametra sa datom vjerovatnoćom.

Koristeći intervale povjerenja, možete testirati statističke hipoteze i izvući zaključke o osjetljivosti kriterija.

LITERATURA.

Glanz S. – Poglavlje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Pitanja za samotestiranje učenika.

1. Koja je snaga kriterija?

2. U kojim slučajevima je potrebno vrednovati snagu kriterijuma?

3. Metode za proračun snage.

6. Kako testirati statističku hipotezu koristeći interval pouzdanosti?

7. Šta se može reći o snazi ​​kriterija pri izračunavanju intervala povjerenja?

Zadaci.

Interval povjerenja(CI; na engleskom, interval pouzdanosti - CI) dobijen u studiji sa uzorkom daje mjeru tačnosti (ili nesigurnosti) rezultata studije kako bi se izveli zaključci o populaciji svih takvih pacijenata (opća populacija). Ispravna definicija CI od 95% može se formulirati na sljedeći način: 95% takvih intervala će sadržavati pravu vrijednost u populaciji. Ovo tumačenje je nešto manje precizno: CI je raspon vrijednosti unutar kojeg možete biti 95% sigurni da sadrži pravu vrijednost. Kada se koristi CI, naglasak je na određivanju kvantitativnog efekta, za razliku od P vrijednosti koja je rezultat testiranja statističke značajnosti. P vrijednost ne procjenjuje nikakvu količinu, već služi kao mjera jačine dokaza protiv nulte hipoteze „bez efekta“. Vrijednost P sama po sebi ne govori nam ništa o veličini razlike, pa čak ni o njenom smjeru. Stoga su nezavisne P vrijednosti apsolutno neinformativne u člancima ili sažetcima. Nasuprot tome, CI ukazuje i na veličinu efekta od neposrednog interesa, kao što je korist od tretmana, i na snagu dokaza. Stoga je DI direktno povezan sa praksom EBM.

Pristup procjeni Statistička analiza, ilustrovan CI, ima za cilj mjerenje količine efekta od interesa (osjetljivost dijagnostičkog testa, stopa predviđenih slučajeva, relativno smanjenje rizika liječenjem, itd.), kao i mjerenje neizvjesnosti u tom efektu. Najčešće, CI je raspon vrijednosti na obje strane procjene u kojem će vjerovatno biti prava vrijednost, a u to možete biti sigurni 95%. Dogovor da se koristi vjerovatnoća od 95% je proizvoljan, kao i vrijednost P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se zasniva na ideji da ista studija sprovedena na različitim uzorcima pacijenata ne bi dala identične rezultate, već da bi njihovi rezultati bili raspoređeni oko prave, ali nepoznate vrednosti. Drugim riječima, CI to opisuje kao "varijabilnost zavisnu od uzorka". CI ne odražava dodatnu nesigurnost zbog drugih razloga; posebno, ne uključuje uticaj selektivnog gubitka na praćenje, lošu usklađenost ili netačno mjerenje ishoda, nedostatak zasljepljivanja itd. Stoga CI uvijek potcjenjuje ukupni iznos neizvjesnosti.

Izračun intervala pouzdanosti

Tabela A1.1. Standardne greške i intervali pouzdanosti za odabrana klinička mjerenja

Tipično, CI se izračunava iz uočene procjene količine, kao što je razlika (d) između dvije proporcije i standardne greške (SE) u procjeni te razlike. Približnih 95% CI dobijenih na ovaj način je d ± 1,96 SE. Formula se mijenja prema prirodi mjere ishoda i opsegu CI. Na primjer, u randomiziranom, placebom kontroliranom ispitivanju acelularne vakcine protiv hripavca, 72 od 1670 (4,3%) novorođenčadi koja su primila vakcinu razvilo je pertusis, a 240 od ​​1665 (14,4%) u kontrolnoj grupi. Procentualna razlika, poznata kao apsolutno smanjenje rizika, iznosi 10,1%. SE ove razlike je 0,99%. Prema tome, CI od 95% iznosi 10,1% + 1,96 x 0,99%, tj. od 8.2 do 12.0.

Uprkos njihovim različitim filozofskim pristupima, CI i testovi statističke značajnosti su usko povezani matematički.

Dakle, vrijednost P je “značajna”, tj. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Nesigurnost (netačnost) procjene, izražena u CI, u velikoj je mjeri povezana s kvadratnim korijenom veličine uzorka. Mali uzorci pružaju manje informacija od velikih, a CI je shodno tome širi u manjem uzorku. Na primjer, članak u kojem se upoređuju performanse tri testa korištena za dijagnosticiranje infekcije Helicobacter pylori izvijestio je o osjetljivosti testa daha na ureu od 95,8% (95% CI 75-100). Dok je brojka od 95,8% impresivna, mali uzorak od 24 odrasla pacijenta sa J. pylori znači da postoji značajna nesigurnost u ovoj procjeni, kao što pokazuje široki CI. Zaista, donja granica od 75% je mnogo niža od procjene od 95,8%. Ako bi se ista osjetljivost uočila na uzorku od 240 ljudi, CI od 95% bio bi 92,5–98,0, što daje veću sigurnost da je test visoko osjetljiv.

U randomiziranim kontroliranim studijama (RCT), neznatni rezultati (tj. oni s P >0,05) su posebno podložni pogrešnoj interpretaciji. CI je ovdje posebno koristan jer pokazuje koliko su rezultati konzistentni s klinički korisnim stvarnim efektom. Na primjer, u RCT-u koji je upoređivao šav debelog crijeva i klamnu anastomozu, infekcija rane se razvila kod 10,9% odnosno 13,5% pacijenata (P = 0,30). CI od 95% za ovu razliku je 2,6% (-2 do +8). Čak iu ovoj studiji od 652 pacijenta ostaje moguće da postoji skromna razlika u učestalosti infekcija koje su rezultat ove dvije procedure. Što je manje istraživanja, veća je nesigurnost. Sung et al. izvršio RCT kako bi uporedio infuziju oktreotida sa akutnom skleroterapijom za akutno krvarenje iz varikoziteta kod 100 pacijenata. U grupi koja je primala oktreotid, stopa kontrole krvarenja bila je 84%; u grupi skleroterapije - 90%, što daje P = 0,56. Imajte na umu da su stope kontinuiranog krvarenja slične onima za infekciju rane u spomenutoj studiji. U ovom slučaju, međutim, CI od 95% za razliku između intervencija je 6% (-7 do +19). Ovaj raspon je prilično širok u odnosu na razliku od 5% koja bi bila od kliničkog interesa. Jasno je da studija ne isključuje značajnu razliku u djelotvornosti. Stoga je zaključak autora „infuzija oktreotida i skleroterapija podjednako učinkoviti u liječenju krvarenja iz proširenih vena“ definitivno nevažeći. U slučajevima poput ovog, gdje, kao ovdje, CI od 95% za apsolutno smanjenje rizika (ARR) uključuje nulu, CI za NNT (broj potreban za liječenje) je prilično teško protumačiti. NPL i njegov CI se dobijaju iz recipročnih vrednosti ACP-a (množenjem sa 100 ako su ove vrednosti date u procentima). Ovdje dobijamo NPL = 100: 6 = 16,6 sa 95% CI od -14,3 do 5,3. Kao što se može vidjeti iz fusnote “d” u tabeli. A1.1, ovaj CI uključuje vrijednosti NPL-a od 5,3 do beskonačnosti i NPL-a od 14,3 do beskonačnosti.

CI se mogu konstruisati za najčešće korištene statističke procjene ili poređenja. Za RCT, uključuje razliku između srednjih proporcija, relativnih rizika, omjera šansi i NLR-a. Slično, CI se mogu dobiti za sve glavne procjene napravljene u studijama tačnosti dijagnostičkih testova – osjetljivost, specifičnost, pozitivna prediktivna vrijednost (sve su jednostavne proporcije) i omjeri vjerovatnoće – procjene dobivene u meta-analizama i usporedbi s kontrolom studije. Program za personalni računar koji pokriva mnoge od ovih upotreba MDI-a dostupan je uz drugo izdanje Statistics with Confidence. Makroi za izračunavanje CI za proporcije dostupni su besplatno za Excel i statističke programe SPSS i Minitab na http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Višestruke procjene učinka liječenja

Iako su CI poželjni za ishode primarne studije, oni nisu neophodni za sve ishode. CI se odnosi na klinički važna poređenja. Na primjer, kada se porede dvije grupe, ispravan CI je onaj koji je konstruiran za razliku između grupa, kao što je prikazano u gornjim primjerima, a ne CI koji se može konstruirati za procjenu u svakoj grupi. Ne samo da nije od pomoći dati odvojene CI za procjene u svakoj grupi, ova prezentacija može biti pogrešna. Slično tome, ispravan pristup kada se poredi efikasnost tretmana u različitim podgrupama je direktno upoređivanje dve (ili više) podgrupa. Netačno je pretpostaviti da je tretman efikasan samo u jednoj podgrupi ako njegov CI isključuje vrijednost koja odgovara bez efekta, a ostale ne. CI su također korisni kada se porede rezultati u više podgrupa. Na sl. A 1.1 pokazuje relativni rizik od eklampsije kod žena sa preeklampsijom u podgrupama žena iz placebo kontrolisanog RCT magnezijum sulfata.

Rice. A1.2. Šuma prikazuje rezultate 11 randomiziranih kliničkih ispitivanja vakcine protiv goveđeg rotavirusa za prevenciju dijareje u usporedbi s placebom. Za procjenu relativnog rizika od dijareje korišten je interval pouzdanosti od 95%. Veličina crnog kvadrata je proporcionalna količini informacija. Pored toga, prikazana je zbirna procjena efikasnosti tretmana i interval pouzdanosti od 95% (označen dijamantom). Meta-analiza je koristila model slučajnih efekata veći od nekih prethodno specificiranih; na primjer, ovo može biti veličina koja se koristi za izračunavanje veličine uzorka. Stroži kriterij zahtijeva da cijeli raspon CI pokaže korist veću od unaprijed određenog minimuma.

Već smo raspravljali o zabludi uzimanja nedostatka statističke značajnosti kao indikacije da su dva tretmana podjednako efikasna. Jednako je važno ne izjednačavati statističku značajnost sa kliničkom važnosti. Klinički značaj se može pretpostaviti kada je rezultat statistički značajan i veličina procjene efikasnosti liječenja

Studije mogu pokazati da li su rezultati statistički značajni i koji su klinički važni, a koji nisu. Na sl. A1.2 prikazuje rezultate četiri testa, za koje je cijeli CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

U statistici postoje dvije vrste procjena: tačka i interval. Tačka procjena je statistika jednog uzorka koja se koristi za procjenu parametra populacije. Na primjer, srednja vrijednost uzorka je tačkasta procjena matematičkog očekivanja populacije i varijanse uzorka S 2- bodovna procjena varijanse populacije σ 2. pokazalo se da je srednja vrijednost uzorka nepristrasna procjena matematičkog očekivanja populacije. Srednja vrijednost uzorka naziva se nepristrasna jer je prosjek svih srednjih vrijednosti uzorka (sa istom veličinom uzorka) n) jednak je matematičkom očekivanju opće populacije.

U cilju varijanse uzorka S 2 postala nepristrasna procjena varijanse stanovništva σ 2, nazivnik varijanse uzorka treba postaviti jednakim n – 1 , ali ne n. Drugim riječima, varijansa populacije je prosjek svih mogućih varijansi uzorka.

Prilikom procjene parametara populacije treba imati na umu da statistike uzorka kao npr , ovise o konkretnim uzorcima. Uzeti ovu činjenicu u obzir, dobiti intervalna procjena matematičko očekivanje opće populacije, analizirati distribuciju srednjih vrijednosti uzorka (za više detalja vidjeti). Konstruisani interval karakteriše određeni nivo pouzdanosti, koji predstavlja verovatnoću da je pravi parametar populacije ispravno procenjen. Slični intervali pouzdanosti mogu se koristiti za procjenu udjela karakteristike R i glavna rasprostranjena masa stanovništva.

Preuzmite bilješku u formatu ili, primjere u formatu

Izrada intervala povjerenja za matematičko očekivanje populacije sa poznatom standardnom devijacijom

Izgradnja intervala povjerenja za udio neke karakteristike u populaciji

Ovaj odjeljak proširuje koncept intervala povjerenja na kategoričke podatke. Ovo nam omogućava da procijenimo udio ove karakteristike u populaciji R koristeći udio uzorka RS= X/n. Kao što je naznačeno, ako količine nR I n(1 – str) prelazi broj 5, binomna raspodjela se može aproksimirati kao normalna. Dakle, procijeniti udio neke karakteristike u populaciji R moguće je konstruisati interval čiji je nivo pouzdanosti jednak (1 – α)h100%.


Gdje strS- proporcija uzorka karakteristike jednaka X/n, tj. broj uspjeha podijeljen s veličinom uzorka, R- udio karakteristike u opštoj populaciji, Z- kritična vrijednost standardizirane normalne distribucije, n- veličina uzorka.

Primjer 3. Pretpostavimo da je uzorak koji se sastoji od 100 faktura popunjenih tokom prošlog mjeseca izvučen iz informacionog sistema. Recimo da je 10 ovih faktura sastavljeno sa greškama. dakle, R= 10/100 = 0,1. Nivo pouzdanosti od 95% odgovara kritičnoj vrijednosti Z = 1,96.

Dakle, vjerovatnoća da između 4,12% i 15,88% računa sadrži greške iznosi 95%.

Za datu veličinu uzorka, interval pouzdanosti koji sadrži udio karakteristike u populaciji izgleda širi nego za kontinuiranu slučajnu varijablu. To je zato što mjerenja kontinuirane slučajne varijable sadrže više informacija nego mjerenja kategoričkih podataka. Drugim riječima, kategorički podaci koji uzimaju samo dvije vrijednosti ne sadrže dovoljno informacija za procjenu parametara njihove distribucije.

INizračunavanje procjena izvađenih iz konačne populacije

Procjena matematičkog očekivanja. Korekcioni faktor za konačnu populaciju ( fpc) je korišten za smanjenje standardne greške za faktor. Prilikom izračunavanja intervala pouzdanosti za procjene parametara populacije, faktor korekcije se primjenjuje u situacijama kada se uzorci uzimaju bez vraćanja. Dakle, interval pouzdanosti za matematičko očekivanje ima nivo pouzdanosti jednak (1 – α)h100%, izračunava se po formuli:

Primjer 4. Da bismo ilustrovali upotrebu korektivnog faktora za konačnu populaciju, vratimo se problemu izračunavanja intervala povjerenja za prosječan iznos računa, o čemu se govorilo u primjeru 3. Pretpostavimo da kompanija izdaje 5.000 faktura mjesečno, i =110,27 dolara, S= 28,95 dolara N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Koristeći formulu (6) dobijamo:

Procjena udjela neke karakteristike. Prilikom odabira bez povrata, interval pouzdanosti za udio atributa koji ima nivo pouzdanosti jednak (1 – α)h100%, izračunava se po formuli:

Intervali povjerenja i etička pitanja

Prilikom uzorkovanja populacije i izvođenja statističkih zaključaka često se javljaju etička pitanja. Glavni je način na koji se intervali povjerenja i procjene tačaka statistike uzorka slažu. Objavljivanje procjena tačaka objavljivanja bez specificiranja povezanih intervala pouzdanosti (obično na nivou pouzdanosti od 95%) i veličine uzorka iz kojeg su izvedene može stvoriti zabunu. Ovo može dati korisniku utisak da je bodovna procjena upravo ono što mu je potrebno da predvidi svojstva cjelokupne populacije. Stoga je neophodno razumjeti da u svakom istraživanju fokus ne treba biti na tačkastim procjenama, već na intervalnim procjenama. Osim toga, posebnu pažnju treba posvetiti pravilnom odabiru veličina uzoraka.

Predmet statističke manipulacije najčešće su rezultati socioloških istraživanja stanovništva o određenim političkim temama. Istovremeno, rezultati istraživanja se objavljuju na naslovnim stranicama novina, a greška uzorkovanja i metodologija statističke analize se objavljuju negdje u sredini. Da bi se dokazala validnost dobijenih tačaka, potrebno je navesti veličinu uzorka na osnovu koje su dobijene, granice intervala poverenja i nivo njegove značajnosti.

Sledeća napomena

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 448–462

Centralna granična teorema navodi da se sa dovoljno velikom veličinom uzorka distribucija uzorka srednjih vrijednosti može aproksimirati normalnom distribucijom. Ovo svojstvo ne zavisi od vrste distribucije stanovništva.

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nekretnina koja se procjenjuje nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak se ne pokaže uvijek homogenim, ponekad ga je potrebno očistiti od ekstremnih tačaka – previsokih ili preniskih tržišnih ponuda. U tu svrhu se koristi interval povjerenja. Svrha ovog istraživanja je da se izvrši komparativna analiza dvije metode za izračunavanje intervala povjerenja i izbor optimalne opcije proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval pouzdanosti je interval vrijednosti atributa koji se izračunava na osnovu uzorka, koji sa poznatom vjerovatnoćom sadrži procijenjeni parametar opće populacije.

Smisao izračunavanja intervala povjerenja je da se takav interval konstruiše na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može konstatovati da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sadrži nepoznatu vrijednost procijenjene vrijednosti sa određenom vjerovatnoćom. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo pogledati 2 metode:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritičnu vrijednost t-statistike (Studentov koeficijent).

Faze uporedne analize različitih metoda za izračunavanje CI:

1. formirati uzorak podataka;

2. obrađujemo statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijansu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i rezultirajuće intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom rasporeda „Hruščov“.

Tabela 1. Početni uzorak

Cijena 1 m2, jed

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka pomoću statističkih metoda zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan je broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak sa neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca – koristi se za precizniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljem tekstu - SD) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen rasipanja vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da originalni uzorak nije homogen, pa prijeđimo na izračunavanje intervala povjerenja.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun korištenjem medijane i standardne devijacije.

Interval pouzdanosti se određuje na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 1.



Metoda 2. Konstruiranje intervala povjerenja korištenjem kritične vrijednosti t-statistike (Student koeficijent)

S.V. Gribovsky u svojoj knjizi “Matematičke metode za procjenu vrijednosti svojstva” opisuje metodu za izračunavanje intervala povjerenja preko Studentovog koeficijenta. Prilikom izračunavanja pomoću ove metode, procjenitelj mora sam postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se konstruirati interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni odgovaraju vjerovatnoći pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom se pretpostavlja da su prave vrijednosti matematičkog očekivanja i varijanse praktički nepoznate (što je gotovo uvijek tačno kada se rješavaju praktični problemi procjene).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje iz posebnih statističkih tabela ili korištenjem MS Excel-a (→"Statistički"→ STUDIST);

∝ - nivo značajnosti, uzmite ∝=0,01.

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala povjerenja

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različitih vrijednosti intervala. Shodno tome, dobili smo dva različita očišćena uzorka.

Tabela 3. Statistika za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna možemo reći da se vrijednosti intervala povjerenja dobivene različitim metodama ukrštaju, tako da možete koristiti bilo koju od metoda proračuna prema nahođenju procjenitelja.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja u zavisnosti od stepena razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu obračuna koristeći medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

Prilikom pripreme članka korišteno je sljedeće:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Sistemski podaci estimatica.pro

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”