Štatistické hypotézy a hladina významnosti

Štatistická hypotéza musí byť formulovaná takým spôsobom, aby ju bolo možné na základe empirických dát podporiť, alebo zamietnuť. Formulujeme ju zmysluplnou, oznamovacou vetou v prítomnom čase.

Formulácia štatistických hypotéz:
1. Formulácia nulovej hypotézy H0 – hypotéza o rovnosti, resp. o chýbaní rozdielov (napr. deti z úplných rodín a deti z neúplných rodín sa nelíšia v miere sebaúcty).
2. Formulácia alternatívnej hypotézy HA – je opakom nulovej hypotézy a predpokladá rozdiely v istom parametri, resp. rozdiel medzi skupinami (napr. deti z úplných rodín a deti z neúplných rodín sa líšia v miere sebaúcty).
Alternatívna hypotéza môže byť:
Jednostranná: deti z úplných rodín majú vyššiu mieru sebaúcty v porovnaní s deťmi z neúplných rodín,
Dvojstranná: deti z úplných rodín a deti z neúplných rodín sa líšia v miere sebaúcty.

Hypotéza by mala byť podporená teóriou, resp. výsledkami predchádzajúcich výskumných štúdií.

3. Stanovenie hladiny významnosti

  • hladina významnosti je pravdepodobnosť chyby I. stupňa (α), ktorú urobíme, ak zamietneme nulovú hypotézu v prípade, že skutočne platí. Teda dospejeme k záveru, že medzi premennými nie je vzťah, pričom medzi nimi vzťah je.
  • hladina významnosti sa tradične stanovuje na 5 % (p = 0,05). Výsledok/zistenie je vtedy signifikantné, ak je p hodnota menšia než 5 % (p < 0,05). Písmeno „p“ znamená pravdepodobnosť (prakticky každý štatistický test, ktorý sa používa, vygeneruje „p“), ktoré môže nadobúdať rozličnú hodnotu:
    • p < 0,05 (tj. α = 5 %), signifikantné
    • p < 0,01 (tj. α = 1 %), signifikantné
    • p < 0,001 (tj. α = 0,1 %), signifikantné
    • p > 0,05 – nesignifikantné

4. Použitie štatistického testu a výpočet p-hodnoty
Správny štatistický test zvolíme na základe posúdenia viacerých kritérií – podľa toho, o akú premennú sa jedná, podľa toho, či chceme niečo porovnávať (komparovať), alebo hľadať vzťahy (korelacia) a pri kardinálnych (spojitých) premenných musíme brať do úvahy podmienky pre parametrický test.

Príklad:
H0 (nulová hypotéza): Úmrtnosť mužov a žien vzhľadom na vek je rovnaká.
HA (alternatívna hypotéza): Úmrtnosť mužov a žien vzhľadom na vek nie je rovnaká.
Z výberových súborov sme zistili, že:
Priemerný vek úmrtia muža je 68 rokov.
Priemerný vek úmrtia ženy je 75 rokov.
Použijeme príslušný štatistický test s výsledkom p = 0,031.
Ktorú hypotézu zavrhneme, resp. pre ktorú hypotézu sa rozhodneme?

5. Riešenie

  • ak je p < 0,05, zistené rozdiely s vysokou pravdepodobnosťou nevznikli na základe náhody, príp. chybou výberu (prijímame alternatívnu hypotézu o existencii rozdielov),
  • ak je p > 0,05, zistené rozdiely mohli vzniknúť na základe náhody, príp. chybou výberu (prijímame nulovú hypotézu o neexistencii rozdielov).

Riešenie vyššie uvedeného príkladu: keďže p < 0,05 (0,031) zavrhujeme nulovú hypotézu a prijímame alternatívnu hypotézu o rozdieloch. Teda medzi vekom úmrtnosti mužov a žien je signifikantný rozdiel.

Postup výberu štatistického testu nájdeme v časti „Parametrické vs. neparametrické testy“.

Ritomský (2015) upozorňuje, že štatistická signifikancia je „len“ o tom, s akým rizikom (pravdepodobnosťou) zamietame nulovú hypotézu v situácii, keď je pravdivá. Výskumníka, pochopiteľne – v prípade, že prijal alternatívnu hypotézu, ktorá hovorí o existencii populačného rozdielu, zaujíma aj závažnosť tohto rozdielu. O nej štatistická signifikancia nevypovedá.

O veľkosti populačnej diferencie poskytuje dôležitú informáciu intervalový odhad, i rozdiely v priemeroch, štandardnej odchýlke i priemerných poradiach v porovnávaných skupinách.

Okrem toho významnou pomôckou je ukazovateľ vecnej signifikancie („effect size„, Cohen´s d – viac Rabušic, Soukup, Mareš (2019), s. 226-228). 

Pri formulácii štatistických hypotéz je dôležité dodržiavať:

  • hypotéza musí mať v sebe zahrnutý potenciálny rozdiel alebo vzťah medzi dvoma premennými.
  • musí byť jednoznačná, tzn., že na hypotézu musí byť jednoznačná odpoveď (nemôžeme povedať, že hypotéza sa „čiastočne“ ne/potvrdila).

Príklad nesprávne formulovanej hypotézy: Predpokladáme rozdiel v názoroch mužov a žien na interrupciu a eutanáziu. Hypotéza je nesprávne formulovaná preto, lebo neposkytuje jednoznačnú odpoveď v prípade, ak sa muži a ženy budú odlišovať v názoroch na eutanáziu, ale budú sa zhodovať v názoroch na interrupciu. V prípade, ak by sme chceli štatisticky overovať vyššie uvedené, správne by bolo formulovať dve hypotézy:

  • Predpokladáme rozdiel v názoroch mužov a žien na interrupciu.
  • Predpokladáme rozdiel v názoroch mužov a žien na eutanáziu.

* K vyššie uvedenej problematike je vhodné naštudovať si ešte tému o chybe prvého a druhého druhu – odporúčame monografiu Rabušic, Soukup, Mareš (2019), s. 245, príp. monografiu Walker (2013).