Koji je interval pouzdanosti? Intervali pouzdanosti

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

Inteligencija se sastoji ne samo u znanju, već i u sposobnosti da se znanje primeni u praksi. (Aristotel)

Intervali pouzdanosti

generalni pregled

Uzimajući uzorak iz populacije, dobijamo tačka procene parametar koji nas zanima i izračunavamo standardnu ​​grešku kako bismo ukazali na tačnost procjene.

Međutim, u većini slučajeva standardna greška kao takva nije prihvatljiva. Mnogo je korisnije kombinovati ovu mjeru tačnosti sa procjenom intervala za parametar populacije.

Ovo se može uraditi korišćenjem znanja o teorijskoj distribuciji verovatnoće statistike uzorka (parametra) kako bi se izračunao interval poverenja (CI - Interval pouzdanosti, CI - Interval poverenja) za parametar.

Općenito, interval povjerenja proširuje procjene u oba smjera za određeni višekratnik standardne greške (datog parametra); dvije vrijednosti (granice pouzdanosti) koje definiraju interval obično su odvojene zarezom i zatvorene u zagrade.

Interval pouzdanosti za srednju vrijednost

Korištenje normalne distribucije

Srednja vrijednost uzorka je normalno raspoređena ako je veličina uzorka velika, tako da možete primijeniti znanje o normalnoj raspodjeli prilikom razmatranja srednje vrijednosti uzorka.

Konkretno, 95% distribucije srednjih vrijednosti uzorka je unutar 1,96 standardnih devijacija (SD) srednje vrijednosti populacije.

Kada imamo samo jedan uzorak, to nazivamo standardnom greškom srednje vrijednosti (SEM) i izračunavamo interval pouzdanosti od 95% za srednju vrijednost na sljedeći način:

Ako ovaj eksperiment ponovimo nekoliko puta, interval će sadržavati pravu srednju vrijednost populacije 95% vremena.

Obično je to interval povjerenja, kao što je interval vrijednosti unutar kojeg verovatnoća poverenja 95% je prava srednja vrijednost populacije (opća sredina).

Iako nije sasvim rigorozno (srednja populacija je fiksna vrijednost i stoga ne može imati pridruženu vjerovatnoću) tumačiti interval povjerenja na ovaj način, konceptualno je lakše razumjeti.

Upotreba t- distribucija

Možete koristiti normalnu distribuciju ako znate vrijednost varijanse u populaciji. Također, kada je veličina uzorka mala, srednja vrijednost uzorka slijedi normalnu distribuciju ako su osnovni podaci o populaciji normalno raspoređeni.

Ako podaci koji su u osnovi populacije nisu normalno raspoređeni i/ili varijansa populacije je nepoznata, srednja vrijednost uzorka odgovara Studentova t-distribucija.

Izračunavamo interval pouzdanosti od 95% za srednju vrijednost opće populacije na sljedeći način:

Gdje je procentni bod (percentil) t- Studentova t raspodjela sa (n-1) stepena slobode, što daje dvostranu vjerovatnoću od 0,05.

Općenito, pruža širi raspon nego kada se koristi normalna distribucija, jer uzima u obzir dodatnu nesigurnost koja se unosi prilikom procjene standardna devijacija populacije i/ili zbog male veličine uzorka.

Kada je veličina uzorka velika (reda 100 ili više), razlika između dvije distribucije ( t-Student i normalno) je beznačajan. Međutim, oni uvijek koriste t- distribucija prilikom izračunavanja intervala pouzdanosti, čak i ako je veličina uzorka velika.

Obično se prijavljuje 95% CI. Mogu se izračunati i drugi intervali povjerenja, kao što je 99% CI za srednju vrijednost.

Umjesto proizvoda standardna greška i tabelu vrijednost t- distribucije, koja odgovara dvostranoj vjerovatnoći od 0,05, pomnožite je (standardna greška) sa vrijednošću koja odgovara dvostranoj vjerovatnoći od 0,01. Ovo je širi interval povjerenja od intervala povjerenja od 95% jer odražava povećano povjerenje da interval zapravo uključuje srednju vrijednost populacije.

Interval pouzdanosti za proporciju

Distribucija uzorkovanja proporcija ima binomnu distribuciju. Međutim, ako je veličina uzorka n je razumno velika, onda je distribucija uzorkovanja proporcije približno normalna sa srednjom .

Ocjenjujemo selektivnim omjerom p=r/n(Gdje r- broj pojedinaca u uzorku sa onima za koje smo zainteresovani karakteristične karakteristike), a standardna greška se procjenjuje:

Interval pouzdanosti od 95% za proporciju se procjenjuje:

Ako je veličina uzorka mala (obično kada n.p. ili n(1-p) manje 5 ), tada je potrebno koristiti binomnu distribuciju kako bi se izračunali precizni intervali povjerenja.

Imajte na umu da ako str onda izraženo u procentima (1-p) zamijenjen sa (100-p).

Interpretacija intervala pouzdanosti

Kada tumačimo interval pouzdanosti, zanimaju nas sljedeća pitanja:

Koliko je širok interval pouzdanosti?

Širok interval pouzdanosti ukazuje da je procjena neprecizna; usko označava tačnu procjenu.

Širina intervala povjerenja ovisi o veličini standardne greške, koja zauzvrat ovisi o veličini uzorka i, kada se razmatra numerička varijabla, varijabilnost podataka proizvodi šire intervale povjerenja nego studije velikog skupa podataka od nekoliko varijabli .

Da li CI uključuje neke vrijednosti od posebnog interesa?

Možete provjeriti da li vjerojatna vrijednost parametra populacije spada u interval pouzdanosti. Ako je tako, rezultati su u skladu sa ovom vjerovatnom vrijednošću. Ako nije, onda je malo vjerovatno (za interval pouzdanosti od 95% šansa je skoro 5%) da parametar ima tu vrijednost.

INTERVALI POVJERENJE ZA FREKVENCIJE I RAZLOMKE

© 2008

Nacionalni institut za javno zdravlje, Oslo, Norveška

U članku je opisano i razmatrano izračunavanje intervala povjerenja za frekvencije i proporcije pomoću Wald, Wilson, Clopper - Pearson metoda, korištenjem kutne transformacije i Waldove metode sa Agresti - Coull korekcijom. Prikazani materijal daje opće informacije o metodama za izračunavanje intervala pouzdanosti za frekvencije i proporcije i ima za cilj da pobudi interes čitatelja časopisa ne samo za korištenje intervala povjerenja prilikom predstavljanja rezultata vlastitog istraživanja, već i za čitanje stručne literature prije početka rada na budućim publikacijama.

Ključne riječi : interval pouzdanosti, učestalost, proporcija

Prethodna publikacija je ukratko pominjala opis kvalitativnih podataka i izvještavala da je intervalna procjena je poželjniji od tačke jedan da opiše učestalost pojavljivanja karakteristike koja se proučava u populaciji. Zaista, budući da se istraživanje provodi korištenjem podataka uzorka, projekcija rezultata na populaciju mora sadržavati element nepreciznosti uzorkovanja. Interval pouzdanosti je mjera tačnosti parametra koji se procjenjuje. Zanimljivo je da neke knjige o osnovnoj statistici za doktore potpuno zanemaruju temu intervala povjerenja za frekvencije. U ovom članku ćemo pogledati nekoliko načina za izračunavanje intervala povjerenja za frekvencije, podrazumijevajući takve karakteristike uzorka kao što su neponavljanje i reprezentativnost, kao i neovisnost opservacija jedna od druge. U ovom članku učestalost se ne razumije kao apsolutni broj koji pokazuje koliko puta se određena vrijednost pojavljuje u zbiru, već kao relativna vrijednost koja određuje udio učesnika studije kod kojih se proučavana karakteristika javlja.

U biomedicinskim istraživanjima najčešće se koriste 95% intervali pouzdanosti. Ovaj interval pouzdanosti predstavlja područje unutar kojeg pravo značenje dionica u 95% slučajeva. Drugim riječima, možemo sa 95% pouzdanosti reći da će prava vrijednost učestalosti pojavljivanja osobine u populaciji biti unutar intervala pouzdanosti od 95%.

Većina statističkih priručnika za medicinske istraživače navodi da se greška frekvencije izračunava pomoću formule

gdje je p učestalost pojavljivanja karakteristike u uzorku (vrijednost od 0 do 1). Većina domaćih naučnih članaka ukazuje na učestalost pojavljivanja neke osobine u uzorku (p), kao i na njenu grešku (s) u obliku p±s. Međutim, prikladnije je predstaviti interval pouzdanosti od 95% za učestalost pojavljivanja osobine u populaciji, koji će uključivati ​​vrijednosti iz

prije.

Neki priručnici preporučuju da se za male uzorke zamijeni vrijednost 1,96 vrijednošću t za N – 1 stepen slobode, gdje je N broj opažanja u uzorku. Vrijednost t se nalazi iz tabela za t-distribuciju, dostupne u gotovo svim udžbenicima statistike. Upotreba t distribucije za Waldovu metodu ne daje vidljive prednosti u odnosu na druge metode o kojima se govori u nastavku, pa je stoga neki autori ne preporučuju.

Gore predstavljena metoda za izračunavanje intervala povjerenja za frekvencije ili proporcije nazvana je Wald u čast Abrahama Walda (1902–1950), budući da je njegova široka upotreba počela nakon objavljivanja Walda i Wolfowitza 1939. godine. Međutim, samu metodu je predložio Pierre Simon Laplace (1749–1827) još 1812. godine.

Waldova metoda je vrlo popularna, ali njena primjena je povezana sa značajnim problemima. Metoda se ne preporučuje za male veličine uzorka, kao ni u slučajevima kada učestalost pojavljivanja karakteristike teži 0 ili 1 (0% ili 100%) i jednostavno je nemoguća za frekvencije od 0 i 1. Osim toga, aproksimacija normalne distribucije, koja se koristi pri izračunavanju greške, “ne radi” u slučajevima kada je n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Budući da je nova varijabla normalno raspoređena, donja i gornja granica intervala povjerenja od 95% za varijablu φ bit će φ-1,96 i φ+1,96 lijevo">

Umjesto 1,96 za male uzorke, preporučuje se da se vrijednost t zamijeni za N – 1 stepen slobode. Ova metoda ne proizvodi negativne vrijednosti i omogućava preciznije procjene intervala povjerenja za frekvencije od Waldove metode. Osim toga, opisan je u mnogim domaćim referentnim knjigama o medicinska statistika, što, međutim, nije dovelo do njegovog široku upotrebu u medicinskim istraživanjima. Izračunavanje intervala povjerenja korištenjem kutne transformacije se ne preporučuje za frekvencije koje se približavaju 0 ili 1.

Tu se obično završava opis metoda za procjenu intervala povjerenja u većini knjiga o osnovama statistike za medicinske istraživače, a ovaj problem je tipičan ne samo za domaće, već i za strane književnosti. Obje metode su zasnovane na središnjoj graničnoj teoremi, koja podrazumijeva veliki uzorak.

Uzimajući u obzir nedostatke u procjeni intervala povjerenja korištenjem gore navedenih metoda, Clopper i Pearson su 1934. godine predložili metodu za izračunavanje takozvanog egzaktnog intervala povjerenja, s obzirom na binomnu distribuciju osobine koja se proučava. Ova metoda je dostupna u mnogim online kalkulatorima, ali su intervali povjerenja dobiveni na ovaj način u većini slučajeva preširoki. Istovremeno, ova metoda se preporučuje za upotrebu u slučajevima kada je neophodna konzervativna procjena. Stepen konzervativnosti metode raste kako se veličina uzorka smanjuje, posebno kada je N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Prema mnogim statističarima, najoptimalnija procjena intervala povjerenja za frekvencije provodi se Wilsonovom metodom, predloženom još 1927. godine, ali se praktički ne koristi u domaćim biomedicinskim istraživanjima. Ova metoda ne samo da omogućava procjenu intervala povjerenja i za vrlo male i za vrlo velike frekvencije, već je također primjenjiva za mali broj opservacija. IN opšti pogled Interval povjerenja prema Wilsonovoj formuli ima oblik



gdje uzima vrijednost 1,96 pri izračunavanju intervala pouzdanosti od 95%, N je broj opservacija, a p je učestalost pojavljivanja karakteristike u uzorku. Ova metoda je dostupna u online kalkulatorima, tako da njena upotreba nije problematična. i ne preporučujemo korištenje ove metode za n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Uz Wilsonovu metodu, vjeruje se i da Waldova metoda sa Agresti–Coll korekcijom daje optimalnu procjenu intervala povjerenja za frekvencije. Agresti-Coll korekcija je zamjena u Wald formuli učestalosti pojavljivanja karakteristike u uzorku (p) sa p`, kada se izračuna koje 2 se dodaje brojiocu, a 4 dodaje nazivniku, tj. p` = (X + 2) / (N + 4), gdje je X broj učesnika studije koji imaju karakteristiku koja se proučava, a N je veličina uzorka. Ova modifikacija daje rezultate vrlo slične Wilsonovoj formuli, osim kada se frekvencija događaja približi 0% ili 100% i uzorak je mali. Pored gore navedenih metoda za izračunavanje intervala pouzdanosti za frekvencije, predložene su korekcije kontinuiteta za Waldovu i Wilsonovu metodu za male uzorke, ali studije su pokazale da je njihova upotreba neprikladna.

Razmotrimo primjenu gore navedenih metoda za izračunavanje intervala povjerenja na dva primjera. U prvom slučaju, proučavamo veliki uzorak od 1.000 nasumično odabranih učesnika studije, od kojih 450 ima osobinu koja se proučava (ovo može biti faktor rizika, ishod ili bilo koja druga osobina), što predstavlja učestalost od 0,45 ili 45 %. U drugom slučaju, istraživanje se provodi na malom uzorku, recimo, samo 20 osoba, a samo 1 učesnik (5%) ima osobinu koja se proučava. Intervali pouzdanosti pomoću Waldove metode, Waldove metode sa Agresti–Coll korekcijom i Wilsonove metode izračunati su korištenjem online kalkulatora koji je razvio Jeff Sauro (http://www./wald.htm). Wilsonovi intervali pouzdanosti ispravljeni kontinuitetom izračunati su pomoću kalkulatora koji je obezbijedio Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Proračuni korištenjem Angular Fisher Transform su izvedeni “ručno” korištenjem kritična vrijednost t za 19 odnosno 999 stepeni slobode. Rezultati proračuna su prikazani u tabeli za oba primjera.

Intervali pouzdanosti izračunati sa šest Različiti putevi za dva primjera opisana u tekstu

Metoda izračunavanja intervala povjerenja

P=0,0500, ili 5%

95% CI za X=450, N=1000, P=0,4500 ili 45%

–0,0455–0,2541

Wald sa Agresti–Coll korekcijom

<,0001–0,2541

Wilson sa korekcijom kontinuiteta

Clopper-Pearson "precizna metoda"

Kutna transformacija

<0,0001–0,1967

Kao što se može vidjeti iz tabele, za prvi primjer interval pouzdanosti izračunat primjenom „općeprihvaćene“ Waldove metode ulazi u negativnu regiju, što ne može biti slučaj za frekvencije. Nažalost, takvi incidenti nisu neuobičajeni u ruskoj književnosti. Tradicionalni način predstavljanja podataka u smislu učestalosti i njegove greške djelimično maskira ovaj problem. Na primjer, ako je učestalost pojavljivanja neke osobine (u procentima) predstavljena kao 2,1 ± 1,4, onda to nije tako „uvredljivo za oko” kao 2,1% (95% CI: –0,7; 4,9), iako i znači ista stvar. Waldova metoda s Agresti–Coll korekcijom i proračunom korištenjem kutne transformacije daje donju granicu koja teži nuli. Wilsonova metoda korigirana kontinuitetom i "precizna metoda" proizvode šire intervale povjerenja od Wilsonove metode. Za drugi primjer, sve metode daju približno iste intervale povjerenja (razlike se pojavljuju samo u tisućinkama), što nije iznenađujuće, budući da se učestalost pojavljivanja događaja u ovom primjeru ne razlikuje mnogo od 50%, a veličina uzorka je prilično velika.

Za čitaoce koje zanima ovaj problem, možemo preporučiti radove R. G. Newcombea i Browna, Caija i Dasgupte, koji daju prednosti i nedostatke korištenja 7 odnosno 10 različitih metoda za izračunavanje intervala povjerenja. Među domaćim priručnicima preporučujemo knjigu i, koja pored detaljnog opisa teorije predstavlja metode Walda i Wilsona, kao i metodu za izračunavanje intervala pouzdanosti uzimajući u obzir binomnu distribuciju frekvencija. Pored besplatnih online kalkulatora (http://www. /wald. htm i http://faculty. vassar. edu/lowry/prop1.html), intervali povjerenja za frekvencije (i ne samo!) mogu se izračunati korištenjem alata. CIA program (Analiza intervala pouzdanosti), koji se može preuzeti sa http://www. medschool. soton. ac. uk/cia/ .

Sljedeći članak će se baviti univarijantnim načinima poređenja kvalitativnih podataka.

Bibliografija

Banerji A. Medicinska statistika jasnim jezikom: uvodni kurs / A. Banerjee. – M.: Praktična medicina, 2007. – 287 str. Medicinska statistika / . – M.: Medicinska informativna agencija, 2007. – 475 str. Glanz S. Medicinska i biološka statistika / S. Glanz. – M.: Praktika, 1998. Tipovi podataka, testiranje distribucije i deskriptivna statistika // Humana ekologija – 2008. – br. 1. – str. 52–58. Zhizhin K. S.. Medicinska statistika: udžbenik / . – Rostov n/d: Phoenix, 2007. – 160 str. Primijenjena medicinska statistika / , . - St. Petersburg. : Foliot, 2003. – 428 str. Lakin G. F. Biometrija / . – M.: Viša škola, 1990. – 350 str. Medic V. A. Matematička statistika u medicini / , . – M.: Finansije i statistika, 2007. – 798 str. Matematička statistika u kliničkim istraživanjima / , . – M.: GEOTAR-MED, 2001. – 256 str. Junkerov V. I. Medicinska i statistička obrada podataka medicinskih istraživanja / , . - St. Petersburg. : VmedA, 2002. – 266 str. Agresti A. Približno je bolje nego tačno za intervalnu procjenu binomnih proporcija / A. Agresti, B. Coull // Američki statističar. – 1998. – N 52. – Str. 119–126. Altman D. Statistike s povjerenjem // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 str. Brown L.D. Intervalna procjena za binomnu proporciju / L. D. Brown, T. T. Cai, A. Dasgupta // Statistička znanost. – 2001. – N 2. – Str. 101–133. Clopper C.J. Korištenje pouzdanosti ili fiducijalnih granica ilustrirano u slučaju binoma / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M. A. O intervalu povjerenja za binomni parametar / M. A. Garcia-Perez // Kvalitet i kvantitet. – 2005. – N 39. – Str. 467–481. Motulsky H. Intuitivna biostatistika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 str. Newcombe R. G. Dvostrani intervali povjerenja za jednu proporciju: poređenje sedam metoda / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872. Sauro J. Procjena stope završetka iz malih uzoraka korištenjem binomnih intervala povjerenja: usporedbe i preporuke / J. Sauro, J. R. Lewis // Zbornik radova godišnjeg sastanka društva ljudskih faktora i ergonomije. – Orlando, FL, 2005. Wald A. Granice povjerenja za kontinuirane funkcije distribucije // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – Str. 105–118. Wilson E.B. Vjerovatno zaključivanje, zakon sukcesije i statističko zaključivanje / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – Str. 209–212.

INTERVALI POUZDANJA ZA PROPORCIJE

A. M. Grjibovski

Nacionalni institut za javno zdravlje, Oslo, Norveška

U članku je predstavljeno nekoliko metoda za izračunavanje intervala povjerenja za binomne proporcije, a to su Wald, Wilson, arcsin, Agresti-Coull i egzaktne Clopper-Pearsonove metode. Rad daje samo opšti uvod u problem procene intervala poverenja binomske proporcije, a njegov cilj nije samo da stimuliše čitaoce da koriste intervale poverenja prilikom predstavljanja rezultata sopstvenog empirijskog istraživanja, već i da ih ohrabri da konsultuju statističke knjige. prije analize vlastitih podataka i pripreme rukopisa.

Ključne riječi: interval povjerenja, proporcija

Kontakt informacije:

Viši savjetnik, Nacionalni institut za javno zdravlje, Oslo, Norveška

Interval povjerenja dolazi nam iz oblasti statistike. Ovo je određeni raspon koji služi za procjenu nepoznatog parametra sa visokim stepenom pouzdanosti. Najlakši način da to objasnite je primjerom.

Pretpostavimo da trebate proučiti neku slučajnu varijablu, na primjer, brzinu odgovora servera na zahtjev klijenta. Svaki put kada korisnik upiše adresu određene lokacije, server odgovara različitim brzinama. Stoga je vrijeme odgovora koje se proučava je nasumično. Dakle, interval pouzdanosti nam omogućava da odredimo granice ovog parametra, i tada možemo reći da će sa vjerovatnoćom od 95% server biti u rasponu koji smo izračunali.

Ili trebate saznati koliko ljudi zna za zaštitni znak kompanije. Kada se izračuna interval povjerenja, moći će se reći, na primjer, da je sa vjerovatnoćom od 95% udio potrošača koji su svjesni toga u rasponu od 27% do 34%.

Usko povezana s ovim pojmom je vrijednost vjerovatnoće povjerenja. Predstavlja vjerovatnoću da je željeni parametar uključen u interval pouzdanosti. Koliko će veliki biti naš željeni raspon zavisi od ove vrijednosti. Što je veća vrijednost koju uzima, interval pouzdanosti postaje uži, i obrnuto. Obično se postavlja na 90%, 95% ili 99%. Vrijednost 95% je najpopularnija.

Na ovaj indikator utiče i disperzija zapažanja i njegova definicija se zasniva na pretpostavci da se proučavana karakteristika povinuje.Ova izjava je poznata i kao Gaussov zakon. Prema njemu, normalna je raspodjela svih vjerovatnoća neprekidne slučajne varijable koja se može opisati gustinom vjerovatnoće. Ako je pretpostavka normalne distribucije netačna, onda procjena može biti netačna.

Prvo, hajde da shvatimo kako da izračunamo interval poverenja za Ovde postoje dva moguća slučaja. Disperzija (stepen širenja slučajne varijable) može ili ne mora biti poznata. Ako je poznato, tada se naš interval pouzdanosti izračunava pomoću sljedeće formule:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parametar iz Laplaceove distributivne tabele,

σ je kvadratni korijen varijanse.

Ako je varijansa nepoznata, onda se može izračunati ako znamo sve vrijednosti željene karakteristike. Za to se koristi sljedeća formula:

σ2 = h2sr - (hsr)2, gdje je

h2sr - prosječna vrijednost kvadrata proučavane karakteristike,

(hsr)2 je kvadrat ove karakteristike.

Formula po kojoj se izračunava interval pouzdanosti u ovom slučaju se neznatno mijenja:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - prosjek uzorka,

α - znak,

t je parametar koji se nalazi pomoću Studentove tabele distribucije t = t(ɣ;n-1),

sqrt(n) - kvadratni korijen ukupne veličine uzorka,

s je kvadratni korijen varijanse.

Razmotrite ovaj primjer. Pretpostavimo da je na osnovu rezultata 7 mjerenja utvrđeno da je proučavana karakteristika jednaka 30, a varijansa uzorka jednaka 36. Potrebno je pronaći, sa vjerovatnoćom od 99%, interval povjerenja koji sadrži pravu vrijednost vrijednost mjerenog parametra.

Prvo, odredimo čemu je t jednako: t = t (0,99; 7-1) = 3,71. Koristeći gornju formulu, dobijamo:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval pouzdanosti za varijansu izračunava se i u slučaju poznate srednje vrijednosti i kada nema podataka o matematičkom očekivanju, a poznata je samo vrijednost bodovne nepristrasne procjene varijanse. Ovdje nećemo davati formule za izračunavanje, jer su prilično složene i po želji se uvijek mogu pronaći na internetu.

Napomenimo samo da je zgodno odrediti interval pouzdanosti koristeći Excel ili mrežni servis, koji se tako zove.

Iz ovog članka ćete naučiti:

    Šta se desilo interval povjerenja?

    Koja je svrha 3 sigma pravila?

    Kako ovo znanje primijeniti u praksi?

U današnje vrijeme, zbog preobilja informacija vezanih uz veliki asortiman proizvoda, smjernice prodaje, zaposlenike, područja djelatnosti itd., može biti teško istaknuti glavnu stvar, na koju, prije svega, vrijedi obratiti pažnju i uložiti napore da se upravlja. Definicija interval povjerenja i analiza stvarnih vrijednosti koje prelaze njegove granice - tehnika koja pomoći će vam da istaknete situacije, utječu na promjenjive trendove. Moći ćete razviti pozitivne faktore i smanjiti utjecaj negativnih. Ova tehnologija se koristi u mnogim poznatim svjetskim kompanijama.

Postoje tzv. upozorenja", koji informisati menadžere da je sljedeća vrijednost u određenom smjeru otišao dalje interval povjerenja. Šta to znači? Ovo je signal da se dogodio neki neobičan događaj, koji može promijeniti postojeći trend u ovom pravcu. Ovo je signal za to da to shvatim u situaciji i shvatiti šta je na nju uticalo.

Na primjer, razmotrite nekoliko situacija. Izračunali smo prognozu prodaje sa ograničenjima prognoze za 100 artikala proizvoda za 2011. godinu po mjesecima i stvarnom prodajom u martu:

  1. Za “Suncokretovo ulje” su probili gornju granicu prognoze i nisu upali u interval povjerenja.
  2. Za “Suhi kvasac” smo premašili donju granicu prognoze.
  3. “Ovsena kaša” je probila gornju granicu.

Za ostale proizvode stvarna prodaja je bila u okvirima zadanih prognoza. One. njihova prodaja je bila u okviru očekivanja. Dakle, identifikovali smo 3 proizvoda koji su izašli van granica i počeli da otkrivamo šta je uticalo na njih da pređu granice:

  1. Za Suncokretovo ulje ušli smo u novu distributivnu mrežu, što nam je dalo dodatni obim prodaje, što je dovelo do toga da smo prešli gornju granicu. Za ovaj proizvod vrijedi preračunati prognozu do kraja godine, uzimajući u obzir prognozu prodaje za ovu mrežu.
  2. Za „Suhi kvasac” automobil je zaglavio na carini, a došlo je do nestašice u roku od 5 dana, što je uticalo na pad prodaje i prekoračilo donju granicu. Možda bi bilo vrijedno otkriti što je uzrokovalo i pokušati ne ponoviti ovu situaciju.
  3. Pokrenut je događaj promocije prodaje za Oatmeal Porridge, koji je dao značajan porast prodaje i doveo do toga da kompanija ide dalje od predviđanja.

Identifikovali smo 3 faktora koji su uticali na prevazilaženje granica prognoze. U životu ih može biti mnogo više.Da bi se povećala tačnost predviđanja i planiranja, faktora koji dovode do toga da stvarna prodaja može prevazići prognozu, vrijedi izdvojiti i posebno graditi prognoze i planove za njih. Zatim razmotrite njihov utjecaj na glavnu prognozu prodaje. Takođe možete redovno procenjivati ​​uticaj ovih faktora i menjati situaciju na bolje. smanjenjem uticaja negativnih i povećanjem uticaja pozitivnih faktora.

Sa intervalom povjerenja možemo:

  1. Odaberite smjernice, na koje vrijedi obratiti pažnju, jer desili su se događaji u ovim pravcima koji mogu uticati promjena trenda.
  2. Identifikujte faktore, koji zaista utiču na promjenu situacije.
  3. Prihvati informisanu odluku(na primjer, o kupovini, planiranju, itd.).

Pogledajmo sada što je interval pouzdanosti i kako ga izračunati u Excelu koristeći primjer.

Šta je interval pouzdanosti?

Interval povjerenja su granice prognoze (gornje i donje), unutar kojih sa datom vjerovatnoćom (sigma)će se pojaviti stvarne vrijednosti.

One. Izračunavamo prognozu - ovo je naša glavna smjernica, ali razumijemo da stvarne vrijednosti vjerojatno neće biti 100% jednake našoj prognozi. I postavlja se pitanje, u kojim granicama stvarne vrijednosti mogu pasti, ako se nastavi trenutni trend? I ovo pitanje će nam pomoći da odgovorimo izračunavanje intervala povjerenja, tj. - gornje i donje granice prognoze.

Šta je data sigma vjerovatnoće?

Prilikom izračunavanja interval povjerenja možemo postavljena verovatnoća hits stvarne vrijednosti u zadatim granicama prognoze. Kako uraditi? Da bismo to učinili, postavljamo vrijednost sigme i, ako je sigma jednaka:

    3 sigma- tada će vjerovatnoća da sljedeća stvarna vrijednost padne u interval povjerenja biti 99,7%, ili 300 prema 1, ili postoji vjerovatnoća od 0,3% da se pređe granice.

    2 sigma- tada je vjerovatnoća da sljedeća vrijednost padne unutar granica ≈ 95,5%, tj. šanse su oko 20 prema 1, ili postoji 4,5% šanse da se pretjera.

    1 sigma- tada je vjerovatnoća ≈ 68,3%, tj. šanse su otprilike 2 prema 1, ili postoji 31,7% šanse da će sljedeća vrijednost pasti izvan intervala povjerenja.

Mi smo formulisali 3 sigma pravilo,koji to kaze verovatnoća pogodaka druga nasumična vrijednost u interval poverenja sa zadatom vrednošću tri sigma je 99,7%.

Veliki ruski matematičar Čebišev dokazao je teoremu da postoji 10% vjerovatnoće da se pređe granice prognoze sa datom vrijednošću od tri sigma. One. vjerovatnoća pada unutar 3-sigma intervala povjerenja bit će najmanje 90%, dok je pokušaj izračunavanja prognoze i njenih granica "na oko" prepun mnogo značajnijih grešaka.

Kako sami izračunati interval povjerenja u Excelu?

Pogledajmo izračun intervala povjerenja u Excelu (tj. gornje i donje granice prognoze) koristeći primjer. Imamo vremensku seriju - prodaja po mjesecima za 5 godina. Pogledajte priloženi fajl.

Da bismo izračunali granice prognoze, izračunavamo:

  1. Prognoza prodaje().
  2. Sigma - standardna devijacija prognostički modeli iz stvarnih vrijednosti.
  3. Tri sigme.
  4. Interval povjerenja.

1. Prognoza prodaje.

=(RC[-14] (podaci vremenske serije)- RC[-1] (vrijednost modela))^2 (kvadrat)


3. Za svaki mjesec, zbrojimo vrijednosti odstupanja od faze 8 Sum((Xi-Ximod)^2), tj. Da sumiramo januar, februar... za svaku godinu.

Da biste to učinili, koristite formulu =SUMIF()

SUMIF(niz sa brojevima perioda unutar ciklusa (za mjesece od 1 do 12); veza sa brojem perioda u ciklusu; veza sa nizom s kvadratima razlike između izvornih podataka i vrijednosti perioda)


4. Izračunajte standardnu ​​devijaciju za svaki period u ciklusu od 1 do 12 (faza 10 u priloženom fajlu).

Da bismo to učinili, izdvajamo korijen iz vrijednosti izračunate u fazi 9 i dijelimo sa brojem perioda u ovom ciklusu minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Koristimo formule u Excelu =ROOT(R8 (link na (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link do niza sa brojevima ciklusa); O8 (veza na određeni broj ciklusa koji brojimo u nizu))-1))

Koristeći Excel formulu = COUNTIF brojimo broj n


Nakon što smo izračunali standardnu ​​devijaciju stvarnih podataka iz modela prognoze, dobili smo sigma vrijednost za svaki mjesec - faza 10 u priloženom fajlu.

3. Izračunajmo 3 sigma.

U fazi 11 postavljamo broj sigmi - u našem primjeru "3" (faza 11 u priloženom fajlu):

Također pogodno za vježbanje sigma vrijednosti:

1,64 sigma - 10% šanse za prekoračenje granice (1 šansa u 10);

1,96 sigma - 5% šanse za prevazilaženje granica (1 šansa u 20);

2,6 sigma - 1% šanse za prekoračenje ograničenja (1 šansa u 100).

5) Izračunavanje tri sigme, za to množimo "sigma" vrijednosti za svaki mjesec sa "3".

3. Odredite interval pouzdanosti.

  1. Gornja granica prognoze- prognoza prodaje uzimajući u obzir rast i sezonalnost + (plus) 3 sigma;
  2. Donja granica prognoze- prognoza prodaje uzimajući u obzir rast i sezonalnost – (minus) 3 sigma;

Za praktičnost izračunavanja intervala pouzdanosti za duži period (pogledajte priloženu datoteku), koristićemo Excel formulu =Y8+VLOOKUP(W8,$U$8:$V$19,2,0), Gdje

Y8- prognoza prodaje;

W8- broj mjeseca za koji ćemo uzeti 3-sigma vrijednost;

One. Gornja granica prognoze= “prognoza prodaje” + “3 sigma” (u primjeru, VLOOKUP(broj mjeseca; tabela sa 3 sigma vrijednosti; kolona iz koje izdvajamo sigma vrijednost jednaku broju mjeseca u odgovarajućem redu; 0)).

Donja granica prognoze= “prognoza prodaje” minus “3 sigma”.

Dakle, izračunali smo interval pouzdanosti u Excelu.

Sada imamo prognozu i raspon s granicama unutar kojih će stvarne vrijednosti pasti sa datom sigma vjerovatnoćom.

U ovom članku smo pogledali šta su sigma i pravilo tri sigma, kako odrediti interval pouzdanosti i zašto ovu tehniku ​​možete koristiti u praksi.

Želimo vam tačne prognoze i uspjeh!

Kako Forecast4AC PRO vam može pomoćiprilikom izračunavanja intervala pouzdanosti?:

    Forecast4AC PRO će automatski izračunati gornje ili donje granice prognoze za više od 1000 vremenskih serija istovremeno;

    Mogućnost analize granica prognoze u poređenju sa prognozom, trendom i stvarnom prodajom na grafikonu jednim pritiskom na taster;

U programu Forcast4AC PRO moguće je podesiti sigma vrijednost od 1 do 3.

Pridruži nam se!

Preuzmite besplatne aplikacije za predviđanje i poslovnu analizu:


  • Novo Prognoza Lite- automatski kalkulacija prognoze V Excel.
  • 4analytics - ABC-XYZ analiza i analiza emisija Excel.
  • Qlik Sense Desktop i QlikViewPersonal Edition - BI sistemi za analizu i vizualizaciju podataka.

Testirajte mogućnosti plaćenih rješenja:

  • Novo Prognoza PRO- predviđanje u Excelu za velike skupove podataka.

"Katren-Style" nastavlja izdavanje serije Konstantina Kravčika o medicinskoj statistici. U dva prethodna članka autor se bavio objašnjenjem pojmova kao što su i.

Konstantin Kravchik

Matematičar-analitičar. Specijalista za statistička istraživanja u medicini i humanističkim naukama

Moskva grad

Vrlo često u člancima o kliničkim studijama možete pronaći misterioznu frazu: “interval pouzdanosti” (95 % CI ili 95 % CI - interval pouzdanosti). Na primjer, članak bi mogao napisati: „Da bi se procijenila značajnost razlika, korišćen je Studentov t-test za izračunavanje intervala pouzdanosti od 95 %.“

Koja je vrijednost “95 % intervala pouzdanosti” i zašto je izračunati?

Šta je interval pouzdanosti? - Ovo je raspon unutar kojeg prava populacija znači laž. Postoje li “neistiniti” prosjeci? U određenom smislu, da, imaju. Objasnili smo da je nemoguće izmjeriti parametar od interesa u cijeloj populaciji, pa se istraživači zadovoljavaju ograničenim uzorkom. U ovom uzorku (na primjer, na osnovu tjelesne težine) postoji jedna prosječna vrijednost (određena težina), po kojoj prosuđujemo prosječnu vrijednost u cijeloj populaciji. Međutim, malo je vjerovatno da će se prosječna težina u uzorku (posebno malom) poklopiti s prosječnom težinom u općoj populaciji. Stoga je ispravnije izračunati i koristiti raspon prosječnih vrijednosti populacije.

Na primjer, zamislite da je interval pouzdanosti od 95% (95% CI) za hemoglobin 110 do 122 g/L. To znači da postoji 95% šanse da će prava srednja vrijednost hemoglobina u populaciji biti između 110 i 122 g/L. Drugim riječima, ne znamo prosječnu vrijednost hemoglobina u populaciji, ali možemo sa vjerovatnoćom od 95 % naznačiti raspon vrijednosti za ovu osobinu.

Intervali pouzdanosti su posebno relevantni za razlike u srednjim vrijednostima između grupa, ili veličinama efekta kako se oni nazivaju.

Recimo da smo uporedili efikasnost dva preparata gvožđa: jednog koji je već duže vreme na tržištu i jednog koji je tek registrovan. Nakon završene terapije vršili smo procenu koncentracije hemoglobina u ispitivanim grupama pacijenata, a statističkim programom je izračunato da je razlika između prosečnih vrednosti dve grupe sa verovatnoćom od 95 % u rasponu od 1,72 do 14,36 g/l (Tabela 1).

Table 1. Test za nezavisne uzorke
(grupe se porede po nivou hemoglobina)

Ovo treba tumačiti na sljedeći način: kod nekih pacijenata u općoj populaciji koji uzimaju novi lijek, hemoglobin će u prosjeku biti viši za 1,72–14,36 g/l nego kod onih koji su uzimali već poznati lijek.

Drugim riječima, u općoj populaciji razlika u prosječnim vrijednostima hemoglobina između grupa je u ovim granicama sa vjerovatnoćom od 95%. Na istraživaču će biti da proceni da li je to mnogo ili malo. Poenta svega je da ne radimo sa jednom prosječnom vrijednošću, već s rasponom vrijednosti, pa stoga pouzdanije procjenjujemo razliku u parametru između grupa.

U statističkim paketima, prema diskreciji istraživača, možete samostalno suziti ili proširiti granice intervala povjerenja. Smanjenjem vjerovatnoće intervala povjerenja, sužavamo raspon srednjih vrijednosti. Na primjer, pri 90 % CI raspon srednjih vrijednosti (ili razlika u srednjim vrijednostima) će biti uži nego kod 95 %.

Suprotno tome, povećanje vjerovatnoće na 99 % proširuje raspon vrijednosti. Prilikom upoređivanja grupa, donja granica CI može preći nultu oznaku. Na primjer, ako smo proširili granice intervala povjerenja na 99 %, onda su granice intervala bile u rasponu od –1 do 16 g/l. To znači da u opštoj populaciji postoje grupe čija je razlika u srednjim vrednostima za karakteristiku koja se proučava jednaka 0 (M = 0).

Koristeći interval pouzdanosti, možete testirati statističke hipoteze. Ako interval pouzdanosti prelazi nultu vrijednost, tada je tačna nulta hipoteza, koja pretpostavlja da se grupe ne razlikuju po parametru koji se proučava. Gore je opisan primjer gdje smo proširili granice na 99 %. Negdje u opštoj populaciji našli smo grupe koje se ni po čemu nisu razlikovale.

95% interval pouzdanosti razlike u hemoglobinu, (g/l)


Na slici je prikazan interval pouzdanosti od 95% za razliku srednjih vrijednosti hemoglobina između dvije grupe. Prava prolazi kroz nultu oznaku, stoga postoji razlika između srednjih vrijednosti nule, što potvrđuje nultu hipotezu da se grupe ne razlikuju. Raspon razlika između grupa je od –2 do 5 g/L. To znači da se hemoglobin može ili smanjiti za 2 g/L ili povećati za 5 g/L.

Interval pouzdanosti je veoma važan indikator. Zahvaljujući njemu možete vidjeti da li su razlike u grupama zaista nastale zbog razlike u srednjim vrijednostima ili zbog velikog uzorka, jer su kod velikog uzorka šanse za pronalaženje razlika veće nego kod malog.

U praksi bi to moglo izgledati ovako. Uzeli smo uzorak od 1000 ljudi, izmjerili nivoe hemoglobina i ustanovili da se interval pouzdanosti za razliku u srednjim vrijednostima kretao od 1,2 do 1,5 g/l. Nivo statističke značajnosti u ovom slučaju str

Vidimo da je koncentracija hemoglobina porasla, ali gotovo neprimjetno, pa se statistička značajnost pojavila upravo zbog veličine uzorka.

Intervali povjerenja mogu se izračunati ne samo za sredstva, već i za proporcije (i omjere rizika). Na primjer, zanima nas interval povjerenja proporcija pacijenata koji su postigli remisiju uzimajući razvijeni lijek. Pretpostavimo da se CI od 95 % za proporcije, odnosno za udio takvih pacijenata, nalazi u rasponu od 0,60–0,80. Dakle, možemo reći da naš lijek ima terapeutski učinak u 60 do 80 % slučajeva.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”