Korelačná analýza

Korelačná analýza sa zameriava sa na identifikáciu súvislostí/korelácií/vzťahov medzi dvomi alebo viacerými premennými. Zisťuje, či zmeny  v jednej premennej sú sprevádzané zmenami v druhej premennej.

Napr. môžeme zisťovať, či existuje vzťah medzi odmeňovaním zamestnancov a ich výkonom (tzn. zmena v odmeňovaní sa prejaví v zmene pracovného výkonu); medzi úrovňou IQ a vedomosťami z matematiky; medzi spokojnosťou v práci a syndrómom vyhorenia; medzi osobnostnou charakteristikou svedomitosťou a akademickým úspechom; medzi počtom hodín učenia sa na skúšku a výslednou známkou a pod.

Korelačná analýza slúži na identifikáciu existencie vzťahu medzi premennými, pričom o sile tohto vzťahu nás informuje korelačný koeficient (r). Tento koeficient sa môže pohybovať v rozpätí medzi -1 až 1, interpretácia je nasledovná:

    • výsledok blízky „1“ znamená silný pozitívny vzťah (napr. čím vyšší plat, tým drahšie auto),
    • výsledok blízky „– 1“ znamená silný negatívny vzťah (napr. čím vyšší plat, tým menej voľného času),
    • výsledok blízky „0“ znamená neexistenciu vzťahu (napr. výška platu a výška človeka).

Korelačný koeficient sa podľa Cohena interpretuje nasledovne:

r < 0,1 triviálna korelácia,
r = 0,1 – 0,3 slabá korelácia,
r = 0,3 – 0,5 stredne silná korelácia,
r > 0,5 silná korelácia.

Prvotnú analýzu dát zachytáva bodový graf (Scatter Plot), z ktorého môžeme usúdiť, či pri skúmaní premenných ide o lineárny vzťah (vtedy je korelačná analýza adekvátna), alebo o nelineárny vzťah, kedy korelačná analýza nie je vhodná – viď graf, na ktorom je zobrazený lineárny vzťah – čím dlhšia prax, tým vyšší príjem.

Pri korelačných analýzach zisťujeme koeficient korelácie (r), ako i hodnotu signifikancie (p).

Vzťah zistený korelačným koeficientom môže odzrkadľovať istú existujúcu závislosť, avšak môže byť aj náhodný (t. j. korelačný koeficient neodzrkadľuje skutočný vzťah, ale premenné stoja v súbore vo vzťahu len náhodou). Ak by sme sa pozerali len na hodnotu „r“, je možné, že by sme označili náhodný vzťah za existujúci. Preto je potrebné najskôr si všímať hodnotu signifikancie (p), ktorá označuje veľkosť tejto chyby a potom veľkosť korelačného koeficientu (r).

Tradične je hodnota signifikancie ustanovená na hladine 0,05, tzn., že možnosť chyby je 5 %. Hodnoty rovné, alebo menšie ako 0,05 umožňujú považovať vzťah za existujúci (resp. systematický, nenáhodný) (Gröpel, 2008).

Pri výbere relevantného štatistického testu pri koreláciách sa prvotne orientujeme v závislosti od typu premennej, pričom platí, že rozhodujúca je tá premenná, ktorá je v hierarchii merania na nižšom stupni (ak napr. meriame vzťah medzi ordinálnou a kardinálnou premennou, vyberieme korelačný koeficient pre ordinálne premenné):