Pearsonov koeficient korelacije: Razlika med redakcijama

Izbrisana vsebina Dodana vsebina
Haklc (pogovor | prispevki)
dodan naslov razdelka
m/dp/slog
Vrstica 1:
[[slika:Correlation coefficient.png|thumb|right|400px|Zgledi [[graf raztrosa|raztresenih grafikonov]] z različnimi vrednostmi Pearsonovega koeficienta korelacije (''ρ'')]]
'''Pearsonov koeficient korelacije''' ('''r<sub>xy</sub>''') je [[matematika|matematična]] in [[statistika|statistična]] številska mera, ki predstavlja velikost linearne povezanosti spremenljivk X in Y, merjenih na istem predmetu preučevanja. Koeficient je definiran kot vsota vseh produktov [[standardni odklon|standardnih odklonov]] obeh vrednosti v razmerju s [[prostostna stopnja (statistika)|prostostnimi stopnjami]] oziroma kot razmerje med [[kovarianca|kovarianco]] in produktom obeh standardnih odklonov:
[[slika:Correlation examples2.svg|thumb|right|400px|Več naborov točk (''x'',&nbsp;''y'') s Pearsonovim koeficientom korelacije ''x'' in ''y'' za vsak nabor. Korelacija odseva moč in smer linearne povezave (zgornja vrstica), ne vpliva pa na naklon te povezave (sredina), kot tudi ne na mnogo apektov nelinearnih povezav (spodaj). Grafikon v sredini ima naklon 0, Pearsonov koeficient korelacije pa je nedefiniran, ker je varianca <math> Y \!\, </math> enaka 0.]]
'''Pearsonov koeficient korelacije''' ('''''r<sub>xy</sub>''''', '''''ρ<sub>xy</sub>''''') je [[matematika|matematična]] in [[statistika|statistična]] številska mera, ki predstavlja velikost linearne povezanosti spremenljivk <math> X \!\, </math> in <math> Y \!\, </math>, merjenih na istem predmetu preučevanja. Koeficient je definiran kot vsota vseh produktov [[standardni odklon|standardnih odklonov]] obeh vrednosti v razmerju s [[prostostna stopnja (statistika)|prostostnimi stopnjami]], oziroma kot razmerje med [[kovarianca|kovarianco]] in produktom obeh standardnih odklonov:
 
: <math> r_{xy} = \frac {\sum z_xz_{x} z_yz_{y}}{N - 1} \!\, , </math>
: <small>kjer je ''z<sub>x</sub>'' z-vrednost spremenljivke X; ''z<sub>y</sub>'' z-vrednost spremenljivke Y; ''N'' pa število vseh statističnih enot.</small>
 
kjer je:
ali
* <math> z_{x} \!\, </math> – z-vrednost spremenljivke <math> X \!\, </math>
* <math> z_{y} \!\, </math> – z-vrednost spremenljivke <math> Y \!\, </math>Y
* <math> N \!\, </math> – število vseh statističnih enot.
 
ali:
: <math>r_{xy} = \frac {C_{xy}}{\sigma_x \sigma_y}</math>
: <small>kjer je ''C<sub>xy</sub>'' kovarianca; ''σ<sub>x</sub>'' standardni odklon spremenljivke X; ''σ<sub>y</sub>'' pa standardni odklon spremenljivke Y.</small>
 
: <math> r_{xy} = \frac {C_{xy}}{\sigma_x \sigma_y} \!\, , </math>
Dobljeni rezultat je eden izmed kvadratnih korenov (bodisi pozitiven bodisi negativen) [[koeficient determinacije|koeficienta determinacije]] ''r<sub>xy</sub><sup>2</sup>'', ki je razmerje med pojasnjeno [[varianca|varianco]] in skupno varianco:
 
kjer je:
: <math>r_{xy}^2 = {\sum (Y' - \overline Y)^2 \over \sum (Y - \overline Y)^2}</math>
* <math> C_{xy} \!\, </math> – kovarianca,
: <small>kjer je ''Y'' dejanska vrednost dane spremenljivke Y; ''Y''' pa predvidena vrednost iste spremenljivke Y ob znani korelaciji med X in Y ter vrednosti X.</small>
* <math> \sigma_{x} \!\, </math> – standardni odklon spremenljivke <math> X \!\, </math>,
* <math> \sigma_{y} \!\, </math> – standardni odklon spremenljivke <math> Y \!\, </math>.
 
Dobljeni rezultat je eden izmed kvadratnih korenov (bodisi pozitiven bodisi negativen) [[koeficient determinacije|koeficienta determinacije]] ''r<submath> r_{xy</sub><sup>}^{2} \!\, </supmath>'', ki je razmerje med pojasnjeno [[varianca|varianco]] in skupno varianco:
 
: <math> r_{xy}^{2} = \frac{\sum (Y' - \overline Y)^{2 \over }}{\sum (Y - \overline Y)^{2}} \!\, , </math>
 
kjer je:
* <math> Y \!\, </math> – dejanska vrednost dane spremenljivke <math> Y \!\, </math>
:* <smallmath>kjer je ''Y'' dejanska\!\, vrednost</math> dane spremenljivke Y; ''Y''' pa predvidena vrednost iste spremenljivke <math> Y \!\, </math> ob znani korelaciji med <math> X \!\, </math> in <math> Y \!\, </math> ter vrednosti <math> X. \!\, </smallmath>.
 
Pogoj za računanje tega koeficienta je linearna odvisnost obeh vpletenih spremenljivk. Za določanje povezanosti spremenljivk, ki niso povezane linearno, se uporablja [[Spearmanov koeficient korelacije]].
Vrstica 20 ⟶ 33:
Vrednost Pearsonovega koeficienta korelacije se lahko nahaja med vrednostima -1 in 1. Tako vrednost -1 predstavlja popolno negativno povezanost spremenljivk, pri čemer je na grafu odvisnosti videti le ravno črto, ki z naraščajočo neodvisno spremenljivko potuje navzdol; obratno vrednost 1 pomeni popolno pozitivno povezanost in navzgor usmerjeno črto na grafu. V praktičnem preizkušanju odvisnosti in uporabni statistiki je skoraj nemogoče izračunati popolno (funkcijsko) odvisnost -1 ali 1, saj na posamezno odvisno spremenljivko vpliva praviloma več dejavnikov, med njimi tudi slučajni vplivi. Pearsonov koeficient 0 označuje ničelni vpliv ene spremenljivke na drugo.
 
Izračunano povezanost se lahko opišemoopiše tudi tako <ref name="benstat">Pearsonov koeficient korelacije, http://www.benstat.si/blog/pearsonov-koeficient-korelacije </ref>:
 
* 0,00 - ni povezanosti
* 0,01-0,19 - neznatna povezanost
* 0,20-0,39 - nizka/šibka povezanost
* 0,40-0,69 - srednja/zmerna povezanost
* 0,70-0,89 - visoka/močna povezanost
* 0,90-0,99 - zelo visoka/zelo močna povezanost
* 1,00 - popolna (funkcijska) povezanost
 
Enačbo, ki najbolje opisuje linearno odvisnost obeh spremenljivk, je moč izračunati z [[linearna regresija|linearno regresijo]]. Ta enačba je ob visokih vrednostih Pearsonovega koeficienta (bližina -1 oziroma +1) najbolj natančnatočna.
 
Pearsonov koeficient korelacije je imenovan po britanskem statistiku [[Karl Pearson|Karlu Pearsonu]], navzlic temu pa ga je prvi uporabljal [[Angleži|Anglež]] [[Francis Galton]].
 
== Sklici ==
 
{{sklici|1}}
 
{{normativna kontrola}}
 
[[Kategorija:Parametrična statistika]]
[[Kategorija:Karl Pearson]]
{{normativna kontrola}}