Induktívna štatistika

Induktívna (zovšeobecňujúca) štatistika je tvorená súborom metód, ktoré umožňujú výsledky z výberových súborov (získaných náhodným výberom) zovšeobecňovať na základný súbor (populáciu). K primárnym oblastiam induktívnej štatistiky patrí teória odhadu a teória testovania hypotéz, ktoré vychádzajú z teórie pravdepodobnosti.

Štatistické odhady – aritmetický priemer, rozptyl, proporcie výskytu údajov výberového súboru sú štatistické ukazovatele, ktoré vyjadrujú vlastnosti výberového súboru. Výskumníkov predovšetkým zaujímajú znaky základného súboru (populácie), napr. populačný priemer, populačný rozptyl atď. Populačné charakteristiky sa nazývajú i parametre. Na základe údajov získaných náhodným výberom robíme odhady parametrov základného súboru (Ritomský, 2015). Cennou informáciou je zistenie populačného priemeru a intervalu spoľahlivosti.

Štatistické hypotézy možno verifikovať na základe komparácie súborov podľa jednotlivých typov premenných (nominálne, ordinálne, kardinálne) alebo na základe hľadania vzťahov (korelácií) medzi premennými.

Induktívna štatistika obsahuje rozhodnutie o zamietnutí, resp. o nezamietnutí štatistickej hypotézy. Jej úlohou je, ako uvádza Rimarčík (2013), na základe informácií z náhodných vzoriek robiť závery o celých základných súboroch, z ktorých vzorky pochádzajú. K tomuto sa využívajú testy štatistických hypotéz a intervalové odhady.

Štatistické testy (testy štatistickej signifikancie) sú postupy, ktoré umožňujú zistiť pravdepodobnosť, či výsledky nájdené vo výberovom súbore boli spôsobené výberovou chybou, alebo či sú odrazom skutočných javov, ktoré existujú v populácii, z ktorej bol tento výberový súbor získaný (Rabušic, Soukup, Mareš, 2019).

Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané náhodným výberom a nie sú považované za pravdepodobnostné výbery (napr. kvótne výbery) nie je korektné ani správne – takto vypočítaná p-hodnota je ničnehovodiace číslo. Zovšeobecňovanie záverov z nenáhodných výberov je nemožné (Rimarčík, 2015). Adekvátny výber výskumnej vzorky je z tohto dôvodu podmienkou.

Je dôležité podotknúť, že i v prípade, keď pracujeme s reprezentatívnym výskumným súborom, musíme výsledky signifikancie interpretovať obozretne. Najmä vo veľkých výskumných súboroch (okolo 1000 respondentov) vychádzajú i pomerne malé rozdiely v priemeroch štatisticky významné. Vždy je potrebné akýkoľvek výsledok zvážiť z hľadiska:

  • posúdenia rozdielu/vzťahu výskumníkom, odborné posúdenie toho, nakoľko sú zistené rozdiely/vzťahy významné z vedeckého i praktického hľadiska,
  • porovnanie výsledkov s výsledkami iných štúdií, čo nám pomôže posúdiť, či je nami zistený výsledok významný (nielen štatisticky),
  • posúdenia rozdielu/vzťahu z hľadiska vecnej významnosti (Cohen´s d)
  • posúdenia rozdielu/vzťahu z hľadiska Bayesovskej štatistiky*.

* Problematike vecnej významnosti a Bayesovskej štatistiky sa nebudeme podrobnejšie venovať, uvedená problematika presahuje zameranie tejto e-učebnice. Pre záujemcov odkazujeme na Rabušic, Soukup, Mareš (2019), s. 226-228, Rajčáni, Martončík, Kačmár, (2021).