Popisná (deskriptívna) štatistika

Príklad v programe STATISTICA Príklad v programe UNISTAT

Skutočný priemer a interval spoľahlivosti (konfidenčný interval). Pravdepodobne najčastejšie používaným údajom v popisnej štatistike je priemer. Priemer je informatívny údaj o "centrálnej tendencii" skúmanej premennej, ak však je uvádzaný aj s údajom o jeho intervale spoľahlivosti. Z priemeru získaného z nameranej vzorky vyvodzujeme informáciu o centrálnej tendencii celej populácie. Interval spoľahlivosti pre priemer nám dá informáciu, v akom rozsahu hodnôt by sa mohol nachádzať skutočný priemer celej populácie (pri danej miere určitosti). Ak napr. je priemer vzorky 23, a na hladine významnosti p=0,05 je interval spoľahlivosti 18 až 27, tak o priemere celej populácie vieme povedať, že s 95% pravdepodobnosťou padne do intervalu (18,27). Ak hladinu významnosti zmenšujeme, interval spoľahlivosti sa rozširuje z dôvodu vyššej istoty odhadu. Napríklad, ak predpoveď počasia je veľmi neurčitá, je veľká pravdepodobnosť, že vyjde. Šírka intervalu spoľahlivosti je závislá aj na počte respondentov vo vzorke. Čím viac sa počet blíži ku skutočnému počtu v celej populácii, tým spoľahlivejší je zistený priemer vzorky. Tiež závisí od odchýliek hodnôt od priemeru. Čím sú odchýlky väčšie, tým menej je priemer validný. Výpočet intervalu spoľahlivosti je založený na predpoklade, že premenná má v celej populácii normálne rozloženie. Odhad nie je správny, ak tento predpoklad nie je splnený, jedine ak by šlo o veľkú vzorku, povedzme n=100 a viac.

Tvar rozdelenia, normalita. Dôležitým aspektom popisu premennej je tvar rozdelenia. Z neho vieme určiť početnosť hodnôt z rôznych rozsahov premennej. Tiež nás zaujíma, ako dobre môže byť naše rozdelenie aproximované normálnym rozdelením. Popisná štatistika nám k tomu dáva nástroje. Napríklad šikmosť (skewness), ak je rôzna od 0, jedná sa o rozdelenie asymetrické. Normálne rozdelenie je symetrické. Alebo špicatosť (kurtosis), ak je rôzna od 0, máme do činenia s rozdelením viac či menej špicatým ako je normálne.

Precíznejšiu informáciu poskytne test normality, ktorým získame pravdepodobnosť, že výber pochádza z populácie s normálnym rozdelením (testy normality Kolmogorov-Smirnov alebo Shapiro-Wilkoxnov W test). Ale žiaden z týchto testov nemôže nahradiť vizuálny náhľad, ktorý poskytuje histogram (graf, ukazujúci frekvenčnú distribúciu premennej, t.j. informáciu o tom, aký počet respondentov padne do ktorého intervalu možných hodnôt).

Histogramom je preložená normálna krivka, čo nám umožňuje odhadovať normalitu. Tiež je dobrým ukazovateľom homogenity výberu. Ak sa na histograme objavia napr. dva vrcholy (peak), vzorka je nehomogénna a jej respondenti pochádzajú z dvoch populácií. Vtedy je treba hľadať príčinu a tiež spôsob, ako rozdeliť vzorku na dva podvýbery.

Preložené z:
StatSoft, Inc. (1999). Electronic Statistics Textbook. Tulsa, OK: StatSoft. WEB: http://www.statsoft.com/textbook/stathome.html

Každá premenná vstupujúca do analýzy by mala spĺňať základné kritériá:...

Príklad v programe STATISTICA Príklad v programe UNISTAT