Korelaciona i regresiona analiza: primjer, zadaci, primjena. Metoda korelacione i regresione analize

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:

KORELACIONA ANALIZA- skup metoda za procjenu odnosa između slučajnih pojava i događaja, zasnovanih na matematičkoj teoriji korelacije. U ovom slučaju koriste se najjednostavnije karakteristike koje zahtijevaju minimum proračuna. Termin "korelacija" se obično poistovjećuje s konceptima "povezanosti" i "međuzavisnosti". Međutim, one nisu adekvatne. Korelacija je samo jedna vrsta veze između karakteristika, javlja se u prosjeku i linearne je prirode. Ako postoji nedvosmislen odnos između dvije veličine, onda se takav odnos naziva funkcionalnim i iz jedne od veličina (uzroka) moguće je nedvosmisleno odrediti vrijednost druge veličine (posledice). Funkcionalna ovisnost je poseban izraz slučajne (vjerovatne, stohastičke) ovisnosti, kada se odnos ne pojavljuje za svaku vrijednost dvije veličine, već samo u prosjeku.

K. a. se koristi kada se proučavaju dvije ili više slučajnih varijabli kako bi se identificirale dvije najvažnije kvantitativne karakteristike: matematička jednačina za odnos između ovih veličina i procjena bliskosti veze između njih. Početni podaci za određivanje ovih karakteristika su sinhroni rezultati posmatranja (merenja, eksperimenta), odnosno, istovremeno dobijeni iz iskustvenih statističkih podataka o karakteristikama, među kojima se proučava odnos. Početni podaci se mogu specificirati u obliku tabela sa zapisima rezultata posmatranja ili njihovim ekvivalentnim prikazima na magnetnoj traci, bušenoj traci ili bušenim karticama.

K. a. pronašao je široku primjenu u medicini i biologiji za određivanje bliskosti i jednadžbi odnosa između različitih znakova, na primjer, rezultata klinastih analiza, znakova ili posebnih pregleda provedenih na zdravim ili bolesnim ljudima (vidi Korelacija tjelesnih funkcija). Rezultati K. a. koriste se za izradu objektivnih prognoza bolesti, procjenu stanja pacijenta i toka bolesti (vidi Prognoza). A priori, samo na osnovu rezultata teoretskog biola i meda. istraživanja, teško je ili čak nemoguće predvidjeti kako su karakteristike koje se proučavaju povezane jedna s drugom. Da bi se odgovorilo na ovo pitanje, provodi se promatranje ili poseban eksperiment.

2D korelacione analize koristi se prilikom obrade eksperimentalnih podataka o ispoljavanju bilo koja dva znaka.

KORELACIJSKA TABLICA. Bilješka. U tabeli su prikazani intervali znakova X i Y, kao i učestalosti njihovog pojavljivanja (u sredini tabele), izračunate iz rezultata morfometrijske analize mikrovaskulature bulbokonjunktivalne regije, gdje je Y prečnik venula, a X je prečnik arteriole (u mmk).

Svaki rezultat eksperimenta predstavlja slučajna varijabla, a objektivni obrasci se pojavljuju samo u cijelom skupu rezultata mjerenja. Stoga se zaključci donose na osnovu rezultata obrade cjelokupnog skupa eksperimentalnih podataka, a ne na temelju pojedinačnih vrijednosti koje su nasumične. Da bi se smanjio uticaj slučajnog događaja, početni podaci se kombinuju u grupe, što se postiže sastavljanjem korelacione tabele (vidi tabelu). Takva tabela sadrži intervale (ili njihove sredine) vrijednosti dvije karakteristike - Y i X, kao i učestalost pojavljivanja vrijednosti X i Y u odgovarajućem intervalu ovih vrijednosti. Ove frekvencije, izračunate iz rezultata eksperimenta, predstavljaju praktičnu procjenu vjerovatnoće istovremene pojave X i Y vrijednosti određenog intervala. Izgradnja korelacijske tablice je prva faza obrade početnih informacija. Izrada korelacionih tabela i njihova dalja kompletna obrada se brzo izvode na univerzalnim ili specijalizovanim računarima (vidi Elektronički računar). Koristeći grupisane podatke korelacione tabele, izračunavaju se empirijske karakteristike jednačine i jačina veze. Da bi se odredila jednačina odnosa između Y i X, izračunavaju se prosječne vrijednosti karakteristike Y u svakom intervalu karakteristike X. Dakle. dobiti za svaki i-ti interval vrijednost Yxi, čija veza za sve i-intervale daje empirijsku liniju regresije koja karakterizira oblik veze između atributa Y i atributa X u prosjeku - graf funkcije Yx= f(x) . Da postoji nedvosmislena veza između karakteristika Y i X, jednačina veze bi bila dovoljna za rješavanje praktičnih i teoretskih problema, jer je uz nju uvijek moguće odrediti vrijednost karakteristike Y ako je data vrijednost X. U praksi, odnos između Y i X nije jednoznačan, ovaj odnos je slučajan i jedna vrijednost X odgovara većem broju vrijednosti Y. Stoga je potrebna još jedna karakteristika koja mjeri snagu i bliskost veze između Y. i X. Takve karakteristike su disperzioni (korelacioni) odnos ηuh i koeficijent korelacije ryx. Prva od ovih veličina karakteriše bliskost veze između Y i X u proizvoljnoj funkciji f, a ryx se koristi samo u slučaju kada je f linearna funkcija.

Vrijednosti ηyx i ryx se također jednostavno određuju iz korelacijske tablice. Obračun se obično vrši u sledeća narudžba: odrediti prosječne vrijednosti obje karakteristike X i Y, njihove prosjeke standardne devijacijeσx i σy, a zatim ηxy prema formuli:

i ryx prema formuli:

gdje je n - ukupan broj eksperimenti, Xcpi - prosječna vrijednost X i-tog intervala, Ycpj - prosječna vrijednost Y j-tog intervala, k, l - broj intervala karakteristika X i Y, respektivno, mi(x) - učestalost (broj) Xcpi vrijednosti. Kvantitativne karakteristike tačnosti određivanja ηyx i ryx su njihove standardne devijacije, koje su jednake

Vrijednosti koeficijenta η leže između nule i jedan (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

Vrijednost koeficijenta r ​​je između -1 i +1 (-1=

Multivarijantna korelaciona analiza - utvrđivanje jednačine i bliskosti veze u slučajevima kada je broj karakteristika koje se proučavaju veći od dva. Dakle, ako je Y kompleksna osobina i njen ishod ovisi o izgledu skupa osobina X1, X2, ..., Xn, tada se prema eksperimentalnim podacima mora odrediti sljedeće: a) jednačina za vezu osobine Y sa skupom osobina X1, X2,.. ., Xn, tj. Yx1x2...xn = F(x1, x2...,xn) ; b) bliskost veze između Y i skupa X1, X2,..., Xn.

Preliminarna obrada posmatranja rezultira multidimenzionalnim CA. je da se za svaki par karakteristika određuju vrijednosti disperzijskih odnosa ηyxi (i = 1,2,..., n) i ηxixj (i!=j) koeficijenata korelacije ryxi i rxixj, kao i uparene regresije Yxi = fi(xi). Iz ovih podataka se zatim određuju jednačine višestruke regresije Yx1x2...xn = F (x1,x2,...,xn), relacija višestruke disperzije ηyx1x2...xn i koeficijent višestruke korelacije Ryx1x2...xn. Jednadžba višestruke regresije omogućava određivanje vrijednosti karakteristike Y na osnovu skupa vrijednosti X1, X2, ..., Xn, odnosno pomoću ove jednačine moguće je predvidjeti vrijednosti Y na osnovu rezultata specifičnih vrijednosti rezultirajućeg skupa (na primjer, rezultata analize karakteristika X1, X2...Xn). Vrijednost ηyx1x2...xn se koristi kao karakteristika bliskosti veze između Y i skupa karakteristika X1, X2, ...Xn za proizvoljnu funkciju F, a Ryx1x2...xn - za slučaj kada funkcija F je linearna. Koeficijenti ηyx1x2....xn i Ryx1x2...xn imaju vrijednosti između nule i jedan. Uključivanje u razmatranje za multidimenzionalni CA. dodatne karakteristike omogućavaju dobijanje vrednosti ηyx1x2...xn, Ryx1x2...xn bliže jedinici i na taj način povećavaju tačnost predviđanja karakteristike Y korišćenjem višestruke regresijske jednačine.

Kao primjer, razmotrite rezultate uparenog CA, kao i jednadžbu višestruke regresije i višestruki koeficijent korelacije između znakova: Y - stabilna pseudopareza, X1 - lateralizacija motoričkog defekta u udovima desno, X2 - isto u udovi na lijevoj strani, X3 - autonomne krize. Vrijednosti disperzijskih odnosa i koeficijenata parne korelacije za njih će biti ηyx1 = 0,429, ηyx2 = 0,616, ηyx3 = -0,334 i ryx1 = 0,320, ryx2 = 0,586, -0. Prema jednačini višestruke linearne regresije, Yx1x2x3 = 0,638 x1 + 0,839 x2 - 0,195 x3. Koeficijent višestruke korelacije će biti izražen kao Ryx1x2x3 =0,721. Primer pokazuje da se prema podacima X1, X2 i X3 stabilna pseudopareza može predvideti sa dovoljnom tačnošću za praksu.

Metode K. a. Oni takođe pružaju mogućnost dobijanja dinamičkih karakteristika i. U ovom slučaju, proučavane karakteristike (npr. EKG, EEG, itd.) se smatraju slučajnim funkcijama Y(t) i X(t). Na osnovu rezultata posmatranja ovih funkcija određuju se i dvije najvažnije karakteristike: a) procjena telekom operatera (matematička jednačina) između Y (t) i X (t); b) procjena bliskosti veze između njih. Funkcije disperzije i korelacije slučajnih funkcija Y (t) i X(t) uzimaju se kao karakteristike nepropusnosti veze. Ove funkcije su generalizacija odnosa varijanse i koeficijenata korelacije. Dakle, normalizirana funkcija međusobne disperzije ηyx(t) svake fiksne vrijednosti t je disperzioni odnos između vrijednosti karakteristika Y (t) i X(t). Slično, normalizirana unakrsna korelacija Ryx(t) predstavlja, za svaku fiksnu vrijednost t, koeficijent korelacije između karakteristika Y(t) i X(t). Karakteristika linearne veze (ovisnosti) za istu vrijednost koja se proučava u različitim vremenskim trenucima naziva se autokorelacija.

K. a. je jedna od metoda za rješavanje problema identifikacije, koja je našla široku primjenu u dobivanju matematičkih modela i automatizaciji medicinsko-biol, istraživanja i liječenja.

Bibliografija: Računarski sistemi i automatska dijagnostika srčanih oboljenja, ur. C. Caceres i L. Dreyfus, trans. sa engleskog, M., 1974; Gutman S.R. O dva modela elektroencefalograma koji konvergiraju normalnom slučajnom procesu, u knjizi: Upravljanje i informacije. procesi u živoj prirodi, ur. V. V. Larina, str. 205, M., 1971; Zaslavskaya R. M., Perepel-kin E. G. i Akhmetov K. Zh. Korelacijske veze između pokazatelja hemokoagulacije i metabolizma lipida u bolesnika s anginom pektorisom, Kardiologija, v. 6, str. 111, 1977; Kramer G. Matematičke metode statistike, trans. sa engleskog, M., 1975; Pasternak E. B. i sar. Proučavanje električne aktivnosti atrija u toku atrijalne fibrilacije pomoću instrumentalne korelacione analize, Kardiologija, vol. 7, str. 50, 1977; Sinitsyn B.S. Automatski korelatori i njihova primena, Novosibirsk, 1964, bibliogr.; U r b a x V. Yu Statistička analiza u biološkim i medicinskim istraživanjima, M., 1975, bibliogr.

V. N. Raibman, N. S. Raibman.

1) korelacione analize kao sredstva za dobijanje informacija;

2) karakteristike postupaka za određivanje koeficijenata linearne i rang korelacije.

Korelaciona analiza(od latinskog "korelacija", "veza") koristi se za testiranje hipoteze o statističkoj zavisnosti vrijednosti dvije ili više varijabli u slučaju da ih istraživač može zabilježiti (izmjeriti), ali ne i kontrolisati (promijeniti). ).

Kada je povećanje nivoa jedne varijable praćeno povećanjem nivoa druge, onda govorimo o pozitivno korelacije. Ako dođe do povećanja jedne varijable dok se nivo druge smanjuje, onda govorimo o tome negativan korelacije. U nedostatku veze između varijabli, imamo posla null korelacija.

U ovom slučaju varijable mogu biti podaci iz testova, opservacija, eksperimenata, socio-demografskih karakteristika, fizioloških parametara, karakteristika ponašanja itd. Na primjer, korištenje metode nam omogućava da damo kvantitativnu procjenu odnosa između takvih karakteristika. kao: uspeh u studiranju i stepen stručne spreme po završetku, stepen aspiracija i stresa, broj dece u porodici i kvalitet njihove inteligencije, osobine ličnosti i profesionalne orijentacije, trajanje usamljenosti i dinamika samopoštovanja, anksioznost i unutargrupni status, socijalna adaptacija i agresivnost u sukobu...

Kao pomoćni alati, korelacioni postupci su neophodni u konstrukciji testova (da bi se utvrdila validnost i pouzdanost merenja), kao i pilot akcije za testiranje podobnosti eksperimentalnih hipoteza (činjenica odsustva korelacije omogućava nam da odbacimo pretpostavka uzročno-posledične veze između varijabli).

Rastuće interesovanje psihološke nauke za potencijal korelacione analize posledica je više razloga. Prvo, postaje moguće proučavati širok spektar varijabli, čija je eksperimentalna verifikacija teška ili nemoguća. Zaista, iz etičkih razloga, na primjer, nemoguće je provesti eksperimentalna istraživanja samoubistva, ovisnosti o drogama, destruktivnih utjecaja roditelja i utjecaja autoritarnih sekti. Drugo, moguće je dobiti vrijedne generalizacije podataka o velikom broju proučavanih osoba u kratkom vremenu. Treće, poznato je da mnogi fenomeni mijenjaju svoju specifičnost tokom rigoroznih laboratorijskih eksperimenata. A analiza korelacije pruža istraživaču mogućnost da operiše informacijama dobijenim u uslovima što je moguće bližim stvarnim. Četvrto, sprovođenje statističkog proučavanja dinamike određene zavisnosti često stvara preduslove za pouzdano predviđanje psiholoških procesa i pojava.

Međutim, treba imati na umu da je upotreba metode korelacije povezana i sa vrlo značajnim fundamentalnim ograničenjima.

Dakle, poznato je da varijable mogu dobro korelirati čak i u odsustvu uzročno-posljedične veze jedna s drugom.

To je ponekad moguće zbog slučajnih razloga, heterogenosti uzorka, ili zbog neadekvatnosti istraživačkih alata za postavljene zadatke. Takva lažna korelacija može postati, recimo, „dokaz“ da su žene disciplinovanije od muškaraca, tinejdžeri iz jednoroditeljskih porodica skloniji delinkvenciji, ekstroverti agresivniji od introverta, itd. Zaista, vrijedi odabrati muškarce koji rade u visoko obrazovanje u jednu grupu i žene, pretpostavimo, iz uslužnog sektora, pa čak i testirati obe na poznavanje naučne metodologije, onda ćemo dobiti izraz uočljive zavisnosti kvaliteta informacija od pola. Može li se vjerovati takvoj korelaciji?

Još češće se, možda, u istraživačkoj praksi javljaju slučajevi kada se obje varijable mijenjaju pod utjecajem neke treće ili čak nekoliko skrivenih determinanti.

Ako varijable označimo brojevima, a smjerove od uzroka do posljedica strelicama, vidjet ćemo niz mogućih opcija:

1 2 3 4

1 2 3 4

1 2 3 4

1 2 3 4 itd.

Nepažnja na uticaj stvarnih faktora, ali ih istraživači ne uzimaju u obzir, omogućila je da se iznesu opravdanja da je inteligencija čisto nasledna formacija (psihogenetski pristup) ili, naprotiv, da je posledica samo uticaja društvenih komponenti. razvoja (sociogenetski pristup). U psihologiji treba napomenuti da fenomeni koji imaju nedvosmislen uzrok nisu uobičajeni.

Osim toga, činjenica da su varijable međusobno povezane ne omogućava identifikaciju uzroka i posljedice na osnovu rezultata korelacijske studije, čak ni u slučajevima kada ne postoje međuvarijable.

Na primjer, prilikom proučavanja agresivnosti djece, ustanovljeno je da djeca sklona okrutnosti češće od svojih vršnjaka gledaju filmove sa scenama nasilja. Znači li to da takve scene izazivaju agresivne reakcije ili, naprotiv, takvi filmovi privlače najagresivniju djecu? Nemoguće je dati legitiman odgovor na ovo pitanje u okviru korelacione studije.

Neophodno je zapamtiti: prisutnost korelacija nije pokazatelj ozbiljnosti i smjera uzročno-posljedičnih veza.

Drugim riječima, nakon uspostavljanja korelacije varijabli, možemo suditi ne o determinantama i derivatima, već samo o tome koliko su usko povezane promjene varijabli i kako jedna od njih reagira na dinamiku druge.

Prilikom korištenja ove metode koristi se jedan ili drugi tip koeficijenta korelacije. Njegova numerička vrijednost obično varira od -1 (inverzna ovisnost varijabli) do +1 (direktna ovisnost). U ovom slučaju, nulta vrijednost koeficijenta odgovara potpunom odsustvu međusobne veze između dinamike varijabli.

Na primjer, koeficijent korelacije od +0,80 odražava prisustvo izraženijeg odnosa između varijabli od koeficijenta od +0,25. Isto tako, odnos između varijabli koje karakterizira koeficijent od -0,95 je mnogo bliži od onog gdje koeficijenti imaju vrijednosti od +0,80 ili +0,25 („minus“ nam samo govori da je povećanje jedne varijable praćeno smanjenjem drugo).

U praksi psiholoških istraživanja koeficijenti korelacije obično ne dostižu +1 ili -1. Možemo govoriti samo o jednom ili drugom stepenu aproksimacije datoj vrijednosti. Često se korelacija smatra jakom ako je njen koeficijent veći od 0,60. U ovom slučaju, nedovoljnom korelacijom, po pravilu, smatraju se indikatori koji se nalaze u rasponu od -0,30 do +0,30.

Međutim, odmah treba navesti da tumačenje prisustva korelacije uvijek uključuje utvrđivanje kritične vrijednosti odgovarajući koeficijent. Razmotrimo ovu tačku detaljnije.

Može se ispostaviti da se koeficijent korelacije od +0,50 u nekim slučajevima neće smatrati pouzdanim, a koeficijent od +0,30 će, pod određenim uslovima, biti karakteristika nesumnjive korelacije. Mnogo toga zavisi od dužine niza varijabli (tj. od broja upoređenih indikatora), kao i od date vrednosti nivoa značajnosti (ili od prihvaćene verovatnoće greške u proračunima).

Uostalom, s jedne strane, što je veći uzorak, to će se kvantitativno manji koeficijent smatrati pouzdanim dokazom korelacijskih odnosa. S druge strane, ako smo voljni prihvatiti značajnu vjerovatnoću greške, možemo uzeti u obzir dovoljno malu vrijednost za koeficijent korelacije.

Postoje standardne tabele sa kritičnim vrednostima koeficijenata korelacije. Ako je koeficijent koji dobijemo manji od onog prikazanog u tabeli za dati uzorak na utvrđenom nivou značajnosti, onda se smatra statistički nepouzdanim.

Kada radite sa takvom tabelom, treba da znate da se granična vrednost za nivo značaja u psihološkim istraživanjima obično smatra 0,05 (ili pet procenata). Naravno, rizik od greške će biti još manji ako je ova vjerovatnoća 1 prema 100 ili, još bolje, 1 prema 1000.

Dakle, nije sama vrijednost izračunatog koeficijenta korelacije ta koja služi kao osnova za ocjenu kvaliteta veze između varijabli, već statistička odluka o tome da li se indikator izračunatog koeficijenta može smatrati pouzdanim.

Znajući to, okrenimo se proučavanju specifičnih metoda za određivanje koeficijenata korelacije.

Značajan doprinos razvoju statističkog aparata korelacionih studija dao je engleski matematičar i biolog Karl Pirson (1857-1936), koji se svojevremeno bavio testiranjem evolucione teorije Čarlsa Darvina.

Oznaka Pearsonov koeficijent korelacije(r) dolazi od koncepta regresije - operacije za smanjenje skupa parcijalnih zavisnosti između pojedinačnih vrednosti varijabli na njihovu kontinuiranu (linearnu) prosečnu zavisnost.

Formula za izračunavanje Pearsonovog koeficijenta je sljedeća:

Gdje x, y- privatne vrijednosti varijabli, -(sigma) je oznaka iznosa, i
- prosječne vrijednosti istih varijabli. Razmotrimo kako koristiti tablicu kritičnih vrijednosti Pearsonovih koeficijenata. Kao što vidimo, broj stepeni slobode je naznačen u njegovoj lijevoj koloni. Prilikom određivanja linije koja nam je potrebna, polazimo od činjenice da je traženi stepen slobode jednak n-2, gde n- količina podataka u svakoj od koreliranih serija. U stupcima koji se nalaze na desnoj strani, naznačene su određene vrijednosti modula koeficijenata.

Broj stepeni slobode

Nivoi značaja

Štaviše, što je kolona brojeva dalje desno, to je veća pouzdanost korelacije, to je pouzdanija statistička odluka o njenoj značajnosti.

Ako, na primjer, imamo dva reda brojeva u korelaciji sa po 10 jedinica u svakom od njih i koeficijent jednak +0,65 dobijemo pomoću Pearsonove formule, tada će se smatrati značajnim na nivou od 0,05 (pošto je veći od kritična vrijednost od 0,632 za vjerovatnoću 0,05 i manja od kritične vrijednosti od 0,715 za vjerovatnoću od 0,02). Ovaj nivo značajnosti ukazuje na značajnu vjerovatnoću ponavljanja ove korelacije u sličnim studijama.

Sada dajmo primjer izračunavanja Pearsonovog koeficijenta korelacije. Pretpostavimo da je u našem slučaju potrebno utvrditi prirodu veze između izvođenja dva testa od strane istih osoba. Podaci za prvi od njih su označeni kao x, a prema drugom - kako y.

Da bi se pojednostavili proračuni, uvedeni su neki identiteti. naime:

U ovom slučaju imamo sljedeće rezultate ispitanika (u rezultatima testova):

Subjekti

Četvrto

Jedanaesti

Dvanaesti


;

;

Imajte na umu da je broj stupnjeva slobode u našem slučaju 10. Pozivajući se na tabelu kritičnih vrijednosti Pearsonovih koeficijenata, saznajemo da sa datim stepenom slobode na nivou značajnosti od 0,999, svaki korelacijski indikator varijabli veći od 0,823 će se smatrati pouzdanim. To nam daje za pravo da dobijeni koeficijent smatramo dokazom nesumnjive korelacije serije x I y.

Upotreba koeficijenta linearne korelacije postaje nezakonita u slučajevima kada se proračuni vrše u granicama ordinalne mjerne skale, a ne intervalne. Zatim se koriste koeficijenti rang korelacije. Naravno, rezultati su manje tačni, jer nisu same kvantitativne karakteristike predmet poređenja, već samo redosled njihove sukcesije.

Među koeficijentima korelacije ranga u praksi psiholoških istraživanja često se koristi onaj koji je predložio engleski naučnik Charles Spearman (1863-1945), poznati razvijač dvofaktorske teorije inteligencije.

Koristeći odgovarajući primjer, pogledajmo korake potrebne za određivanje Spearmanov koeficijent korelacije ranga.

Formula za njegovo izračunavanje je sljedeća:

;

Gdje d-razlike između rangova svake varijable iz serije x I y,

n- broj upoređenih parova.

Neka x I y- pokazatelji uspješnosti ispitanika u obavljanju određenih vrsta aktivnosti (procjena individualnih postignuća). Istovremeno, imamo sljedeće podatke:

Subjekti

Četvrto

Imajte na umu da se u početku indikatori rangiraju zasebno u nizu x I y. Ako se naiđe na nekoliko jednakih varijabli, onda im se dodjeljuje isti prosječni rang.

Zatim se vrši poparno određivanje razlike u rangovima. Znak razlike nije značajan, jer se prema formuli kvadrira.

U našem primjeru, zbir razlika u rangu na kvadrat
je jednako 178. Zamijenite rezultirajući broj u formulu:

Kao što vidimo, koeficijent korelacije u ovom slučaju je zanemarljivo mali. Međutim, uporedimo to s kritičnim vrijednostima Spearmanovog koeficijenta iz standardne tablice.

Zaključak: između navedenih serija varijabli x I y nema korelacije.

Treba napomenuti da upotreba postupaka korelacije ranga pruža istraživaču mogućnost da utvrdi odnose ne samo kvantitativnih, već i kvalitativnih karakteristika, u slučaju da se potonje, naravno, mogu naručiti po rastućoj težini (rangirani) .

Ispitali smo najčešće, možda i praktične metode za određivanje koeficijenata korelacije. Druge, složenije ili manje uobičajene verzije ove metode, ako je potrebno, mogu se naći u priručnicima posvećenim mjerenjima u naučnim istraživanjima.

OSNOVNI KONCEPTI: korelacija; analiza korelacije; Pearsonov koeficijent linearne korelacije; Spearmanov koeficijent korelacije ranga; kritične vrijednosti koeficijenata korelacije.

Pitanja za diskusiju:

1. Koje su mogućnosti korelacione analize u psihološkim istraživanjima? Šta se može, a šta ne može otkriti ovom metodom?

2. Kakav je redoslijed radnji prilikom određivanja koeficijenata korelacije Pirsonove linearne korelacije i koeficijenata korelacije Spearmanovog ranga?

Vježba 1:

Utvrdite da li su sljedeći pokazatelji korelacije između varijabli statistički značajni:

a) Pirsonov koeficijent +0,445 za podatke iz dva testa u grupi od 20 ispitanika;

b) Pirsonov koeficijent -0,810 sa brojem stepeni slobode 4;

c) Spearmanov koeficijent +0,415 za grupu od 26 osoba;

d) Spearmanov koeficijent +0,318 sa brojem stupnjeva slobode jednakim 38.

Vježba 2:

Odrediti koeficijent linearne korelacije između dvije serije indikatora.

Red 1: 2, 4, 5, 5, 3, 6, 6, 7, 8, 9

2. red: 2, 3, 3, 4, 5, 6, 3, 6, 7, 7

Vježba 3:

Izvući zaključke o statističkoj pouzdanosti i stepenu izraženosti korelacionih odnosa sa brojem stepeni slobode jednakim 25, ako je poznato da je
je: a) 1200; b) 1555; c) 2300

Vježba 4:

Izvršite cijeli niz radnji potrebnih za određivanje koeficijenta rang korelacije između izuzetno općih pokazatelja uspješnosti učenika („odličan učenik“, „dobar učenik“ itd.) i karakteristika njihovog učinka na testu mentalnog razvoja (MDT). Napravite interpretaciju dobijenih indikatora.

Vježbajte5:

Koristeći koeficijent linearne korelacije, izračunajte test-retest pouzdanost testa inteligencije koji vam je na raspolaganju. Izvedite studiju u studentskoj grupi sa vremenskim intervalom između testova od 7-10 dana. Formulirajte svoje zaključke.

Osnivačima teorije korelacije smatraju se engleski biometrijaši F. Galton (1822-1911) i K. Pearson (1857-1936). Izraz "korelacija" znači korelaciju, korespondenciju. Ideja korelacije kao međuzavisnosti slučajnih varijabli leži u osnovi statističke teorije korelacije - proučavanja zavisnosti varijacije osobine od uslova okoline. Neki znakovi djeluju kao utjecajni (faktorski), dok drugi djeluju kao utjecajni i djelotvorni. Zavisnosti između karakteristika mogu biti funkcionalne i korelacione. Funkcionalne veze karakterizira potpuna korespondencija između promjene faktorske karakteristike i promjene rezultirajuće vrijednosti. Svaka vrijednost faktorske karakteristike odgovara određenoj vrijednosti rezultirajuće karakteristike. Ne postoji potpuna korelacija između promjena faktora i rezultantnih karakteristika. Sam efektni znak je u složenoj interakciji. Stoga su rezultati korelacione analize važni u ovom pogledu, a tumačenje ovih rezultata u opštem obliku zahteva izgradnju sistema korelacija. Karakteriziraju ih različiti uzroci i posljedice, a uz njihovu pomoć i tendencija promjene efektivne karakteristike kada se ustanovi vrijednost faktorske karakteristike. Na primjer, na produktivnost rada utiču faktori stepena poboljšanja opreme i tehnologije, stepena mehanizacije i automatizacije rada, specijalizacije proizvodnje, fluktuacije osoblja itd.

U prirodi i društvu, pojave i događaji se javljaju prema prirodi korelacionog odnosa, kada se pri promeni vrednosti jedne karakteristike javlja tendencija promene druge karakteristike. Korelacioni odnos je poseban slučaj statističke veze. Korelaciona analiza se koristi za utvrđivanje bliskosti odnosa između pojava, procesa i objekata.

Svrha studije je često uspostavljanje odnosa (korelacije) između karakteristika. Poznavanje ovisnosti omogućava rješavanje kardinalnog problema svakog istraživanja - sposobnost predviđanja i predviđanja razvoja situacije kada se faktor koji utiče. Koristeći korelaciju, možete dati samo formalnu procjenu odnosa. Stoga, prije nego što se pristupi proračunu koeficijenata korelacije između bilo koje karakteristike, potrebno je teorijski utvrditi postoji li veza između ovih karakteristika. Uostalom, formalno statistika može dokazati nepostojeću povezanost, na primjer, između visine zgrade u gradu i prinosa pšenice na farmama.

Veza između pojava (korelacija) utvrđuje se izvođenjem eksperimenata i statističkom analizom. Korelaciju ne treba poistovjećivati ​​sa uzročno-posljedičnim. Međutim, mora se imati na umu da se dokaz matematičke veze mora zasnivati ​​na stvarnom odnosu između pojava. Na primjer, mineralizacija vode opada od sjevera prema jugu Bjelorusije, a sadržaj hranjivih tvari u tlu opada u istom smjeru. Može se dobiti pozitivan pouzdan odnos između indikatora koji se razmatraju. Međutim, stepen mineralizacije vode ne određuje optimalan sadržaj nutrijenata u tlu. Inače bi u pustinjskim krajolicima plodnost bila maksimalna, jer ovdje postoji maksimalna mineralizacija vode (tlo i podzemne vode su bočate), a to je u suprotnosti sa istinom. Stoga je stvaranje takve veze u pustinjskim pejzažima besmisleno. Najbolji dnevni najam stanova različitih nivoa udobnosti od vlasnika bez provizije možete pronaći na web stranici piter.stay24.ru. Praktično pretraživanje omogućit će vam da lako brzo pronađete odgovarajući stan koji odgovara vašim zahtjevima, uz minimalno vrijeme.

Bilo koji indikator veze služi kao približna procjena ovisnosti koja se razmatra i ne jamči postojanje stroge (funkcionalne) podređenosti. Odsustvo stroge zavisnosti u prirodi i društvu pospešuje samoregulaciju procesa, pojava, sistema

U pravcu, veza može biti direktna ili obrnuto; po prirodi - funkcionalni ili statistički (korelacija); po veličini - slaba, srednja ili jaka; po obliku - linearni i nelinearni; po broju koreliranih karakteristika - uparnih i višestrukih.

Funkcionalna zavisnost je karakteristična za geometrijske forme i tehničke sisteme, kada svaka vrednost jedne karakteristike odgovara tačnoj vrednosti druge. Ovo je primjer odnosa između površine pravokutnika i dužine jedne od njegovih stranica. Takva zavisnost je potpuna ili iscrpna.

Postoji nekoliko tipova parnih korelacija:

·paralelno-korelativno, odnosno asocijativno, kada se obje karakteristike mijenjaju konjugirano, dijelom pod utjecajem zajedničkih uzroka i posljedica (ograničenost vegetacije i tla na određene oblike reljefa; industrijski razvoj i rast stanovništva na sirovine);

· subkauzalni, kada jedan faktor djeluje kao poseban uzrok konjugirane promjene neke karakteristike (odnos biomase sa padavinama; rast stanovništva i nataliteta);

· uzajamno proaktivni, kada uzrok i posledica, u stabilnoj međusobnoj vezi, dosledno utiču jedni na druge (vlažnost vazduha i padavine).

Ako je na osobinu pod utjecajem više faktora, tada se mora procijeniti višestruka korelacija. Višestruka korelacija služi kao osnova za identifikaciju odnosa između karakteristika, ali zahtijeva strogu normalnost i ravnomjernost distribucije, tako da njena upotreba može biti teška. Kako se broj varijabli povećava, volumen računskog rada raste proporcionalno kvadratu broja varijabli. U ovom slučaju je teže procijeniti značajnost rezultata, jer se povećavaju greške u koeficijentima korelacije. U praksi se u takvim slučajevima ograničava na proučavanje samo glavnih faktora. Međutim, priroda utjecaja glavnih faktora na osobinu detaljnije i preciznije se proučava faktorskom analizom.

U praktičnom radu na uspostavljanju korelacije između znakova i pojava potrebno je pridržavati se sljedećeg niza:

· na osnovu sprovedenog istraživanja, preliminarno se utvrđuje da li postoji veza između karakteristika koje se razmatraju;

· ako postoji veza između njih, utvrdite njen oblik, smjer i čvrstoću pomoću grafikona.

Prvo se kompajliraju konjugirani varijacioni nizovi u kojima treba odrediti argument x i funkciju y:

Za konjugirane opcije se konstruiše graf, koji pomaže da se uspostavi tip odnosa između argumenta i funkcije. Dalja obrada eksperimentalnih ili statističkih podataka zavisi od oblika korelacionog odnosa. Linearna zavisnost uključuje izračunavanje koeficijenta korelacije r, a nelinearna uključuje izračunavanje korelacionog odnosa η (slika 5.1). Stepen frekventne disperzije ili varijacije u odnosu na liniju regresije na grafu otprilike ukazuje na bliskost veze: što je manja disperzija, to je veza jača (slika 5.2).

Korelaciona analiza rešava sledeće probleme:

·uspostavljanje pravca i oblika komunikacije,

· procjena bliskosti komunikacije,

·procjena reprezentativnosti statističkih procjena odnosa,

· određivanje veličine determinacije (udjela međusobnog utjecaja) koreliranih faktora.

Rice. 5.1. Oblik korelacije:

a - pravolinijski; b - inverzno linearno; c - parabalični; g - hiperbolično

Za procjenu povezanosti koriste se sljedeći numerički kriteriji (koeficijenti) korelacijske veze:

koeficijent korelacije (r) za linearnu zavisnost,

· korelacijski odnos (η) za nelinearnu zavisnost,

višestruki koeficijenti regresije,

·Pearson ili Kendal rangiraju koeficijente linearne korelacije.

Proučavanje stvarnosti pokazuje da je gotovo svaki društveni fenomen u bliskoj vezi i interakciji s drugim fenomenima, ma koliko na prvi pogled izgledali slučajni. Na primjer, nivo poljoprivredne produktivnosti zavisi od mnogih prirodnih i ekonomskih faktora koji su usko povezani jedni s drugima.

Istraživanje i mjerenje odnosa i međuzavisnosti društveno-ekonomskih pojava jedan je od najvažnijih zadataka statistike.

Za proučavanje odnosa između pojava, statistika koristi brojne metode i tehnike: statističko grupisanje (jednostavno i kombinatorno). indeksne, korelacione i disperzione analize, bilansne, tabelarne, grafičke itd. O sadržaju, specifičnostima i mogućnostima upotrebe nekih od navedenih metoda već je bilo reči u prethodnim poglavljima udžbenika. Indeksne i grafičke metode razmatrane su u poglavljima 11, odnosno 12.

Uz već razmatrane metode proučavanja odnosa, posebno mjesto zauzima metoda korelacije, koja je logičan nastavak metoda kao što su analitičko grupisanje, analiza varijanse i poređenje paralelnih nizova. Kada se kombinuje sa ovim metodama, daje statističku analizu potpunog, kompletnog karaktera.

Osnivači teorije korelacije su engleski statističari F. Galton (1822-1911) i K. Pearson (1857-1936).

Termin korelacija potiče od engleske reči correlation - odnos, korespondencija (odnos, međuzavisnost) između karakteristika, koja se manifestuje tokom masovnog posmatranja promena prosečne vrednosti jedne karakteristike u zavisnosti od vrednosti druge. Osobine koje su međusobno povezane korelacijom nazivaju se korelacije.

Korelaciona analiza omogućava da se izmeri stepen uticaja faktorskih karakteristika na efektivne, da se utvrdi jedinstvena mera bliskosti veze i uloge proučavanog faktora (faktora) u ukupnoj promeni efektivne karakteristike. Metoda korelacije vam omogućava da dobijete kvantitativne karakteristike stupnja povezanosti između dvije ili više karakteristika, te stoga, za razliku od gore navedenih metoda, daje širu ideju o povezanosti između njih.

Veze između faktora su prilično različite. U ovom slučaju, neki znakovi djeluju kao faktori koji djeluju na druge, uzrokujući njihovu promjenu, dok drugi djeluju kao djelovanje ovih faktora. Prvi od njih se zovu faktorijel znakovi, drugo -efikasna.

Kada se ispituju veze između karakteristika, potrebno je razlikovati, prije svega, dvije vrste veza: 1) funkcionalnu (potpunu) i 2) korelacijsko (statističku) povezanost.

Funkcionalni oni nazivaju takvu vezu između karakteristika u kojoj svaka vrijednost jedne varijable (argumenta) odgovara striktno definiranoj vrijednosti druge varijable (funkcije). Takve veze se uočavaju u matematici, fizici, hemiji, astronomiji i drugim naukama.

Na primjer, površina kruga (8 = rP2) i dužina kruga (C = 27GÍ̈R) u potpunosti su određene veličinom polumjera, površinom trokuta i pravokutnika - dužinom njihove strane itd. Dakle, s povećanjem polumjera kruga za 1 cm, njegova dužina se povećava za 6,28 cm, za 2 cm - za 12,56 cm, itd.

U poljoprivrednoj proizvodnji primjer funkcionalne povezanosti može biti veza između prihoda od prodaje proizvoda, prodajne cijene od 1 kvintala i količine prodanih proizvoda; bruto žetva, prinos i veličina zasijane površine; kapitalna produktivnost, trošak bruto proizvodnje i osnovnih sredstava; plate i količinu odrađenog vremena za plaćanje po određenom vremenu, itd.

Funkcionalna veza se manifestuje kako u agregatu u cjelini tako iu svakoj od njegovih jedinica apsolutno precizno i ​​izražava se analitičkim formulama.

U socio-ekonomskim pojavama, funkcionalne veze između karakteristika su rijetke. Ovdje se najčešće odvijaju sljedeći odnosi između varijabilnih veličina, u kojima numerička vrijednost jedne od njih odgovara nekoliko vrijednosti druge. Ova veza između karakteristika naziva se korelacionom (statističkom) vezom. Na primjer, poznato je da se povećanjem doze mineralnih đubriva i poboljšanjem njihove strukture (odnosa) u pravilu povećava prinos poljoprivrednih kultura, ali je poznato da će povećanje prinosa u svakom pojedinačnom slučaju biti različito sa iste količine unošenja đubriva. Osim toga, iste količine đubriva, čak i pod vrlo ujednačenim uslovima, često imaju različite efekte na prinose. Pored samih đubriva, na količinu formiranja prinosa utiču i drugi faktori, prvenstveno kao što su kvalitet zemljišta, padavine, rokovi i načini setve i žetve itd. Poznati obrazac između prinosa i gnojiva pojavit će se uz dovoljno veliki broj zapažanja i kada se uporedi dovoljno veliki broj prosječnih vrijednosti rezultantnih i faktorskih karakteristika.

Primjer korelacije u poljoprivrednoj proizvodnji može biti veza između produktivnosti životinja i nivoa ishrane, kvaliteta hrane, rase stoke; između radnog iskustva i produktivnosti radnika itd.

Korelacija je nepotpuna, manifestuje se velikim brojem zapažanja, kada se uporede prosečne vrednosti rezultanta i faktorskih karakteristika. U tom smislu, identifikacija korelacionih zavisnosti povezana je sa dejstvom zakona velikih brojeva: samo uz dovoljno veliki broj posmatranja pojedinačne karakteristike i sekundarni faktori će se izgladiti i zavisnost između efektivnih i faktorskih karakteristika, ako je dogodi, biće sasvim jasno.

Korelacionom analizom rešavaju se sledeći glavni zadaci:

a) određivanje prosječne promjene rezultirajuće karakteristike pod uticajem jednog ili više faktora (u apsolutnom ili relativnom smislu);

b) karakterizacija stepena zavisnosti rezultujuće karakteristike od jednog od faktora sa fiksnom vrednošću ostalih faktora uključenih u korelacioni model;

c) utvrđivanje bliskosti veze između efektivnih i faktorskih karakteristika (kako sa svim faktorima tako i sa svakim faktorom posebno, isključujući uticaj drugih);

d) određivanje i dekompozicija ukupnog obima varijacije rezultirajuće karakteristike na odgovarajuće dijelove i utvrđivanje uloge svakog pojedinačnog faktora u ovoj varijaciji;

e) statistička procjena indikatora korelacije uzorka. Korelacioni odnos je izražen odgovarajućim matematičkim jednačinama. U smislu smjera, odnos između osnovnih karakteristika može biti direktan i obrnut. Uz direktnu vezu, obje karakteristike se mijenjaju u istom smjeru, odnosno sa povećanjem faktorske karakteristike raste efektivna i obrnuto (npr. odnos između kvaliteta tla i produktivnosti, nivoa ishrane i produktivnosti životinja , radno iskustvo i produktivnost rada). Uz povratnu informaciju, obje karakteristike se mijenjaju u različitim smjerovima (na primjer, odnos između produktivnosti i troškova proizvodnje, produktivnosti rada i troškova proizvoda).

Po obliku ili analitičkom izrazu, veze se razlikuju između pravolinijskih (ili jednostavno linearnih) i nelinearnih (ili krivolinijskih). Ako se odnos između karakteristika izražava jednadžbom prave linije, onda se naziva linearnim odnosom; ako je izražena jednadžbom bilo koje krive (parabola, hiperbola, eksponencijalna, stepen, itd.), onda se takav odnos naziva nelinearnim ili krivolinijskim.

c U zavisnosti od broja karakteristika koje se proučavaju, razlikuju se parne (jednostavne) i višestruke korelacije. U parnoj korelaciji proučava se odnos između dvije karakteristike (rezultativne i faktorske) u višestrukoj korelaciji, proučava se odnos između tri ili više karakteristika (rezultativnih i dva ili više faktora).

Metodom korelacione analize rešavaju se dva glavna problema: 1) određivanje oblika i parametara komunikacijske jednačine; 2) merenje nepropusnosti spoja.

Prvi problem se rješava pronalaženjem jednačine sprege i određivanjem njenih parametara. Drugi je izračunavanjem različitih pokazatelja bliskosti veze (koeficijent korelacije, korelacioni odnos, indeks korelacije, itd.).

Šematski, korelaciona analiza se može podijeliti u pet faza:

1) iskaz problema, utvrđivanje postojanja veze između karakteristika koje se proučavaju;

2) izbor najznačajnijih faktora za analizu;

3) utvrđivanje prirode veze, njenog pravca i oblika, izbor matematičke jednačine za izražavanje postojećih veza;

4) proračun numeričkih karakteristika korelacione veze (određivanje parametara jednačine i pokazatelja bliskosti veze);

5) statistička procjena indikatora komunikacije uzorka.

Naučno opravdana primena metode korelacije zahteva, pre svega, duboko razumevanje suštine međuodnosa društveno-ekonomskih pojava. Sama metoda ne utvrđuje postojanje i uzroke veza između fenomena koji se proučavaju, njegova svrha je da ih kvantitativno izmjeri. U prvoj fazi korelacione analize vrši se opšte upoznavanje sa predmetom i fenomenima koji se proučavaju, razjašnjavaju se svrha i ciljevi istraživanja i utvrđuje teorijska mogućnost uzročno-posledične veze između karakteristika.

Ustanovljavanje kauzalnih zavisnosti u fenomenu koji se proučava prethodi stvarnoj korelacionoj analizi. Stoga primjeni korelacijskih metoda mora prethoditi duboka teorijska analiza koja karakterizira glavni proces koji se odvija u fenomenu koji se proučava, utvrđuje značajne veze između njegovih pojedinačnih strana i prirodu njihove interakcije.

Preliminarna analiza podataka stvara osnovu za formulisanje specifičnog problema proučavanja veza, odabira najvažnijih faktora, uspostavljanja mogućeg oblika odnosa između karakteristika i na taj način dovodi do matematičke formalizacije – izbora matematičke jednačine koja najpotpunije realizuje postojeće veze.

Jedno od najvažnijih pitanja korelacione analize je izbor efektivnih i faktorskih (faktorskih) karakteristika. Faktorske i rezultantne karakteristike odabrane za korelacione analize moraju biti značajne, prve moraju direktno uticati na ostale. Izbor faktora za uključivanje u korelacioni model treba da se zasniva prvenstveno na teorijskim osnovama i praktičnom iskustvu analize društveno-ekonomskog fenomena koji se proučava. Veliku pomoć u rješavanju ovog problema mogu pružiti takve statističke tehnike i metode kao što su poređenje paralelnih serija, izrada tabela distribucije stanovništva prema dvije karakteristike (korelacijske tablice, konstrukcija statističkih grupacija i po efektivnoj karakteristici uz analizu faktora u međusobnoj vezi sa njim, a prema faktorskoj karakteristici (ili kombinaciji faktorskih karakteristika) sa analizom njihovog uticaja na rezultujuću karakteristiku.

Odabir faktora za modele uparene korelacije nije komplikovan: između mnogih faktora koji utiču na efektivnu karakteristiku, bira se jedan od najvažnijih faktora, koji uglavnom određuje varijaciju efektivne karakteristike ili faktora čiji je značaj uticaja na efektivnu karakteristiku. karakteristika treba da bude proučena ili verifikovana. Odabir faktora za višestruke korelacijske modele ima niz karakteristika i ograničenja. O njima će se raspravljati prilikom predstavljanja pitanja višestruke korelacije.

Jedan od glavnih problema u konstruisanju korelacionog modela je određivanje oblika veze i, na osnovu toga, uspostavljanje tipa analitičke funkcije koja odražava mehanizam veze između rezultantne karakteristike i faktora(a). Pod oblikom korelacije podrazumijeva se tip analitičke jednačine koja izražava odnos između karakteristika koje se proučavaju.

Izbor jedne ili druge jednadžbe za proučavanje odnosa između karakteristika je najteži i najodgovorniji zadatak, o kojem ovise rezultati korelacione analize. Sva daljnja tekuća plaćanja mogu biti snižena ako je oblik komunikacije pogrešno odabran. Važnost ove faze leži u činjenici da pravilno uspostavljen oblik komunikacije omogućava odabir i izgradnju najadekvatnijeg modela i na osnovu njegovog rješenja dobijete statistički pouzdane i pouzdane karakteristike.

Uspostavljanje oblika povezanosti karakteristika u većini slučajeva opravdano je teorijom ili praktičnim iskustvom prethodnih studija. Ako je oblik veze nepoznat, onda se pomoću korelacije parova može uspostaviti matematička jednačina sastavljanjem korelacijskih tablica, konstruiranjem statističkih grupa, pregledom različitih funkcija na računalu i odabirom jednadžbe koja daje najmanji zbir kvadrata odstupanja stvarnih podataka od usklađene (teorijske) vrijednosti, itd.

c Ovisno o izvornim podacima, teorijska linija regresije može biti različite vrste krivulja ili prava linija. Dakle, ako promjenu efektivne karakteristike pod utjecajem faktora karakteriziraju stalni priraštaji, onda to ukazuje na linearnu prirodu odnosa, ali ako promjene efektivne karakteristike pod utjecajem faktora karakteriziraju konstantni koeficijenti rasta , onda postoji razlog da se pretpostavi krivolinijski odnos.

Posebno mjesto u opravdavanju oblika komunikacije pri izvođenju korelacione analize imaju grafovi konstruisani u sistemu pravougaonih koordinata na osnovu empirijskih podataka. Grafički prikaz stvarnih podataka pruža vizuelni prikaz prisustva i oblika odnosa između karakteristika koje se proučavaju.

Prema pravilima matematike, prilikom konstruiranja grafa, vrijednosti faktorske karakteristike se iscrtavaju na osi apscise, a vrijednosti rezultirajuće karakteristike na osi ordinata. Iscrtavanjem tačaka na sjecištu odgovarajućih vrijednosti dvije karakteristike dobijamo dijagram raspršenja, koji se naziva korelacijsko polje. Na osnovu prirode postavljanja tačaka na korelacionom polju izvode se zaključci o pravcu i obliku veze. Dovoljno je pogledati grafikon da bi se došlo do zaključka o prisutnosti i obliku odnosa između karakteristika. Ako su tačke koncentrisane oko imaginarne ose pravca slijeva, odozdo, desno, gore, onda je veza direktna, ako je suprotno slijeva, gore, desno, dolje - veza je inverzno. Ako su tačke raštrkane po cijelom polju, to ukazuje da veza između karakteristika nema ili je vrlo slaba. Priroda postavljanja tačaka na korelacionom polju takođe ukazuje na prisustvo pravolinijskog ili krivolinijskog odnosa između karakteristika koje se proučavaju.

Koristeći graf, odabire se odgovarajuća matematička jednačina za kvantifikaciju odnosa između rezultantnih i faktorskih karakteristika. Jednačina koja odražava odnos između karakteristika se zove regresijska jednačina ili korelacione jednačine. Ako jednačina regresije povezuje samo dvije karakteristike, onda se zove uparena regresijska jednadžba. Ako jednačina veze odražava ovisnost rezultirajuće karakteristike od dvije ili više faktorskih karakteristika, naziva se jednadžba višestruke regresije. Zovu se krive konstruirane na osnovu jednadžbi regresije regresijske krive ili regresijske linije.

Postoje empirijske i teorijske linije regresije. Ako povežete tačke na korelacionom polju sa pravim segmentima, dobićete izlomljenu liniju sa određenom tendencijom, koja se naziva empirijska regresijska linija. V Teorijska regresijska linija je linija oko koje su koncentrisane tačke korelacionog polja i koja označava glavni pravac, glavnu tendenciju veze. Teorijska regresijska linija treba da odražava promjenu prosječnih vrijednosti efektivne karakteristike kako se mijenjaju vrijednosti faktorske karakteristike, pod uslovom da se svi drugi uzroci, slučajni u odnosu na faktor, potpuno ponište. Shodno tome, ova linija mora biti povučena tako da zbir odstupanja tačaka korelacionog polja od odgovarajućih tačaka teorijske linije bude jednak nuli, a zbir kvadrata odstupanja minimalan. Pretraživanje, konstrukcija, analiza i praktična primjena teorijske regresijske linije naziva se regresiona analiza.

Koristeći empirijsku regresiju, nije uvijek moguće utvrditi oblik veze i dobiti jednačine regresije. U takvim slučajevima se konstruiraju i rješavaju različite jednadžbe regresije. Zatim se procjenjuje njihova adekvatnost i odabire jednačina koja daje najbolju aproksimaciju (aproksimaciju) stvarnih podataka teorijskim podacima i dovoljnu statističku valjanost i pouzdanost.

Ako se pristupi striktno, regresijsko-korelacionoj analizi treba podeliti regresiju i korelaciju. Regresionom analizom rješava se pitanje konstruiranja, rješavanja i vrednovanja regresionih jednačina, au korelacionoj analizi ovih pitanja dodaje se još jedan niz pitanja vezanih za utvrđivanje bliskosti veze između rezultantnih i faktorskih (faktorskih) karakteristika. U sljedećoj prezentaciji, regresijsko-korelaciona analiza se razmatra kao cjelina i jednostavno se naziva korelacijskom analizom.

Da bi rezultati korelacione analize našli praktičnu primenu i dali naučno utemeljene rezultate, moraju biti ispunjeni određeni zahtevi u pogledu predmeta proučavanja i kvaliteta početnih statističkih informacija. Glavni od ovih zahtjeva su sljedeći:

Kvalitativna homogenost populacije koja se proučava, što implicira bliskost formiranja efektivnih i faktorskih karakteristika. Potreba da se ispuni ovaj uslov proizilazi iz sadržaja parametara jednačine sprege. Iz matematičke statistike je poznato da su parametri prosječne vrijednosti. U kvalitativno homogenoj populaciji one će biti tipične karakteristike, u kvalitativno heterogenoj će biti iskrivljene, što narušava prirodu veze. Kvantitativna homogenost populacije sastoji se u odsustvu jedinica posmatranja čije se numeričke karakteristike značajno razlikuju od većine podataka. Takve jedinice posmatranja treba isključiti iz populacije i proučavati ih odvojeno;

Prilično veliki broj zapažanja, jer se veze između karakteristika otkrivaju samo kao rezultat djelovanja zakona velikih brojeva. Broj jedinica posmatranja treba da bude 6 - 8 puta veći od broja faktora uključenih u model;

Slučajnost i nezavisnost pojedinačnih jedinica populacije jedne od drugih. To znači da vrijednosti karakteristika u nekim jedinicama populacije ne bi trebale ovisiti o vrijednostima drugih jedinica ove populacije;

Stabilnost i nezavisnost delovanja pojedinih faktora;

Konstantnost disperzije rezultantne karakteristike kada se faktorske karakteristike promene; - normalna distribucija karakteristika.

Ako postoje dvije serije vrijednosti koje podliježu rangiranju, racionalno je izračunati korelaciju Spearmanovog ranga.

Takve serije se mogu predstaviti:

  • par karakteristika utvrđenih u istoj grupi objekata koji se proučavaju;
  • par pojedinačnih podređenih karakteristika, utvrđenih u 2 proučavana objekta prema istom skupu karakteristika;
  • par grupnih podređenih karakteristika;
  • individualna i grupna podređenost karakteristika.

Metoda uključuje rangiranje indikatora posebno za svaku od karakteristika.

Najmanja vrijednost ima najmanji rang.

Ova metoda se odnosi na neparametarsku statističku metodu dizajniranu da utvrdi postojanje veze između fenomena koji se proučavaju:

  • utvrđivanje stvarnog stepena paralelizma između dvije serije kvantitativnih podataka;
  • procjena bliskosti identificirane veze, izražena kvantitativno.

Korelaciona analiza

Statistička metoda dizajnirana da identifikuje postojanje veze između 2 ili više slučajnih vrijednosti (varijabli), kao i njenu snagu, naziva se korelaciona analiza.

Ime je dobio po correlatio (lat.) - omjer.

Kada ga koristite, mogući su sljedeći scenariji:

  • prisustvo korelacije (pozitivne ili negativne);
  • nema korelacije (nula).

Ako se uspostavi odnos između varijabli, govorimo o njihovoj korelaciji. Drugim riječima, možemo reći da kada se vrijednost X promijeni, nužno će se uočiti proporcionalna promjena vrijednosti Y.

Kao alati se koriste različite komunikacijske mjere (koeficijenti).

Na njihov izbor utiču:

  • metoda za mjerenje slučajnih brojeva;
  • priroda veze između slučajnih brojeva.

Postojanje korelacijske veze može se prikazati grafički (grafici) i korištenjem koeficijenta (numerički prikaz).

Korelacioni odnos karakterišu sledeće karakteristike:

  • jačina veze (sa koeficijentom korelacije od ±0,7 do ±1 – jaka; od ±0,3 do ±0,699 – prosječna; od 0 do ±0,299 – slaba);
  • smjer komunikacije (direktan ili obrnut).

Ciljevi korelacione analize

Korelaciona analiza ne dozvoljava nam da uspostavimo uzročno-posledične veze između proučavanih varijabli.

Izvodi se u svrhu:

  • uspostavljanje odnosa između varijabli;
  • dobijanje određenih informacija o varijabli na osnovu druge varijable;
  • utvrđivanje bliskosti (povezanosti) ove zavisnosti;
  • određivanje pravca uspostavljene veze.

Metode analize korelacije


Ova analiza se može izvesti pomoću:

  • metoda kvadrata ili Pearson;
  • metod ranga ili Spearman.

Pirsonova metoda je primjenjiva na proračune koji zahtijevaju precizno određivanje sile koja postoji između varijabli. Karakteristike koje se proučavaju uz njegovu pomoć trebaju biti izražene samo kvantitativno.

Za primjenu Spearmanove metode ili korelacije ranga ne postoje strogi zahtjevi za izražavanje karakteristika – ono može biti i kvantitativno i atributivno. Zahvaljujući ovoj metodi, ne dobijaju se informacije o tačnom određivanju snage veze, već su približne prirode.

Promjenjivi redovi mogu sadržavati otvorene varijante. Na primjer, kada je radno iskustvo izraženo u vrijednostima kao što su do 1 godine, više od 5 godina itd.

Koeficijent korelacije

Statistička veličina koja karakteriše prirodu promjena u dvije varijable naziva se koeficijent korelacije ili koeficijent korelacije para. U kvantitativnom smislu, kreće se od -1 do +1.

Najčešći izgledi su:

  • Pearson– primjenjivo za varijable koje pripadaju intervalnoj skali;
  • Spearman– za varijable ordinalne skale.

Ograničenja upotrebe koeficijenta korelacije

Dobijanje nepouzdanih podataka prilikom izračunavanja koeficijenta korelacije moguće je u slučajevima kada:

  • postoji dovoljan broj dostupnih varijabilnih vrijednosti (25-100 parova zapažanja);
  • između varijabli koje se proučavaju, na primjer, uspostavlja se kvadratni odnos, a ne linearni;
  • u svakom slučaju podaci sadrže više od jednog zapažanja;
  • prisutnost anomalnih vrijednosti (izuzetnih vrijednosti) varijabli;
  • podaci koji se proučavaju sastoje se od jasno prepoznatljivih podgrupa zapažanja;
  • prisustvo korelacije ne dozvoljava nam da ustanovimo koja se od varijabli može smatrati uzrokom, a koja posljedicom.

Provjera značajnosti korelacije

Za procjenu statističkih veličina koristi se koncept njihovog značaja ili pouzdanosti, koji karakteriše vjerovatnoću slučajnog pojavljivanja neke veličine ili njenih ekstremnih vrijednosti.

Najčešći metod za određivanje značajnosti korelacije je Studentov t test.

Njegova vrijednost se upoređuje sa vrijednošću u tabeli, broj stupnjeva slobode se uzima kao 2. Kada je izračunata vrijednost kriterija veća od vrijednosti u tabeli, to ukazuje na značajnost koeficijenta korelacije.

Prilikom izvođenja ekonomskih proračuna dovoljnim se smatra nivo pouzdanosti od 0,05 (95%) ili 0,01 (99%).

Spearman činovi

Spearmanov koeficijent korelacije ranga omogućava vam da statistički utvrdite postojanje veze između fenomena. Njegovo izračunavanje uključuje uspostavljanje serijskog broja – ranga – za svaki atribut. Rang može biti rastući ili silazni.

Broj karakteristika koje podliježu rangiranju može biti bilo koji. Ovo je prilično radno intenzivan proces koji ograničava njihov broj. Poteškoće počinju kada dostignete 20 znakova.

Da biste izračunali Spearmanov koeficijent, koristite formulu:

pri čemu:

n – prikazuje broj rangiranih karakteristika;

d nije ništa drugo do razlika između rangova dvije varijable;

i ∑(d2) je zbir kvadratnih razlika rangova.

Primena korelacione analize u psihologiji

Statistička podrška psihološkim istraživanjima omogućava da ona budu objektivnija i visoko reprezentativna. Statistička obrada podataka dobijenih tokom psiholoških eksperimenata pomaže da se izvuku maksimalno korisne informacije.

Najrasprostranjenija metoda za obradu njihovih rezultata je korelaciona analiza.

Prikladno je provesti analizu korelacije rezultata dobijenih tokom istraživanja:

  • anksioznost (prema testovima R. Temml, M. Dorca, V. Amen);
  • porodični odnosi (upitnik „Analiza porodičnih odnosa” (AFV) E.G. Eidemiller, V.V. Yustitskis);
  • nivo internosti-eksternalnosti (upitnik E.F. Bazhin, E.A. Golynkina i A.M. Etkind);
  • stepen emocionalnog sagorevanja među nastavnicima (upitnik V.V. Boyko);
  • veze između elemenata verbalne inteligencije učenika tokom multidisciplinarnog treninga (metodologija K.M. Gurevicha i dr.);
  • veze između nivoa empatije (metoda V.V. Boyka) i bračnog zadovoljstva (upitnik V.V. Stolina, T.L. Romanove, G.P. Butenko);
  • veze između sociometrijskog statusa adolescenata (Jacob L. Moreno test) i karakteristika stila porodičnog vaspitanja (upitnik E.G. Eidemiller, V.V. Yustitskis);
  • strukture životnih ciljeva adolescenata odgajanih u dvoroditeljskim i jednoroditeljskim porodicama (upitnik Edward L. Deci, Richard M. Ryan Ryan).

Kratke upute za provođenje korelacijske analize korištenjem Spearmanovog kriterija

Provedena je korelaciona analiza Spearmanovom metodom prema sljedećem algoritmu:

  • uparene uporedive karakteristike su raspoređene u 2 reda, od kojih je jedan označen sa X, a drugi sa Y;
  • vrijednosti serije X su raspoređene u rastućem ili opadajućem redoslijedu;
  • redoslijed rasporeda vrijednosti serije Y određen je njihovom korespondencijom s vrijednostima serije X;
  • za svaku vrijednost u seriji X odredite rang - dodijelite serijski broj od minimalne vrijednosti do maksimuma;
  • za svaku od vrijednosti u nizu Y odredite i rang (od minimuma do maksimuma);
  • izračunajte razliku (D) između rangova X i Y, koristeći formulu D=X-Y;
  • rezultirajuće vrijednosti razlike su na kvadrat;
  • izvršiti zbrajanje kvadrata razlike u rangu;
  • izvršite proračune koristeći formulu:

Primjer Spearmanove korelacije

Potrebno je utvrditi postojanje korelacije između radnog iskustva i stope ozljeda ako su dostupni sljedeći podaci:

Najprikladnija metoda analize je metoda rangiranja, jer jedna od karakteristika je predstavljena u obliku otvorenih opcija: radno iskustvo do 1 godine i radno iskustvo od 7 ili više godina.

Rješavanje problema počinje rangiranjem podataka koje se sastavlja u radnu tabelu i može se obaviti ručno, jer njihov obim nije veliki:

Radno iskustvo Broj povreda Serijski brojevi (činovi) Razlika u rangu Razlika rangova na kvadrat
d(x-y)
do 1 godine 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 ili više 6 5 1 +4 16
Σ d2 = 38,5

Pojava frakcijskih rangova u koloni je posljedica činjenice da ako se pojave varijante jednake veličine, pronalazi se aritmetička sredina ranga. U ovom primjeru, indikator povrede 12 se pojavljuje dva puta i dodjeljuje mu se rang 2 i 3, pronađite aritmetičku sredinu ovih rangova (2+3)/2= 2,5 i stavite ovu vrijednost u radni list za 2 indikatora.
Zamjenom dobijenih vrijednosti u radnu formulu i jednostavnim proračunima dobijamo Spearmanov koeficijent jednak -0,92

Negativna vrijednost koeficijenta ukazuje na postojanje inverzne veze između karakteristika i omogućava nam da tvrdimo da je kratko radno iskustvo praćeno velikim brojem ozljeda. Štaviše, snaga veze između ovih pokazatelja je prilično velika.
Sljedeća faza proračuna je određivanje pouzdanosti dobijenog koeficijenta:
izračunavaju se njegova greška i Studentov test

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”