Popisná štatistika - príklad v programe STATISTICA
Popisná štatistika - teória |
STATISTICA - modul Basic statistics
and tables.
Daný je dátový súbor deti.sta, 11 stĺpcov (variables) X 695 riadkov (cases), v ktorom sú údaje o novorodencoch. Hmotnosť-HM, dĺžka-DL, obvod hlavy-HLAVA, pôvod rodičky-R (nerómky/rómky),..
Cieľom popisnej štatistiky je zistiť parametre polohy, variability a relatívnu frekvenčnú distribúciu sledovaných premenných, overenie predpokladu normality. Vyberieme Analysis/Frequency tables a vyplníme dialógové okno:
Vyberáme:
Variables: premenné vstupujúce do analýzy
Categorisation method for tables
and graphs: V tejto sekcii sa vyberá spôsob rozdelenia hodnôt premennej do intervalov.
Tu sú možnosti:
All distinct values - početnosť výskytu každej hodnoty premennej sa vyhodnocuje
osobitne
No. of exact intervals - rozsah
hodnôt je rozdelený do určeného počtu intervalov
"Neat" intervals - dôjde k zaokrúhleniu hraníc intervalov, čo vedie
nie vždy k ich zadanému počtu
Step size - určí sa šírka intervalov
a počiatok prvého intervalu
Integer categories - započítavajú sa iba celočíselné hodnoty premennej
Specific grouping codes - ako predchádzajúci prípad, s možnosťou vybrať podmnožinu
možných hodnôt
User defined categories - každý interval hodnôt sa dá zadefinovať osobitne.
Ak nie je zaškrtnuté Casevise deletion of MD, tak ak v niektorej z premenných
vybratých do analýzy chýba v k-tom riadku meranie (missing value), ignoruje
sa k-te meranie aj u ostatných premenných.
V sekcii Display options sa zadá, čo ešte okrem intervalových početností má
byť vo frekvenčnej tabuľke vyčíslené.
Výsledok, po zvolení tlačítka Frequency tables, resp. tlačítka OK pre jednu z vybraných premenných vyzerá takto:
Po zvolení tlačítka Histograms je výsledok:
Ďalšie možnosti grafickej prezentácie skúmaných premenných sú tu.
Po zvolení tlačítka Descriptive
statistics vo vstupnom dialógovom okne získame:
aritmetický priemer hodnôt premenných, smerodajnú odchýlku, čo je druhá odmocnina
priemerného štvorca vzdialeností hodnôt od priemeru, minimálnu a maximálnu hodnotu
a počet hodnôt. Výpočet závisí od spôsobu zadania intervalov v sekcii Cathegorisation
method. Ďalšie číselné charakteristiky sa dajú získať použitím analýzy Analysis/Descriptive
statistics.
Pokiaľ je potrebné overiť normalitu vybraných premenných, v sekcii Test for normality je treba vybrať, najlepšie všetky tri ponúkané testy, a takto vyzerá výsledok.
Vo výsledku je hodnota testovacej štatistiky a pravdepodobnosť chyby, ktorá vznikne zamietnutím platnej nulovej hypotézy o zhode rozdelenia s normálnym rozdelením. Pokiaľ aspoň jeden z vybraných testov normality dá hodnotu p<0,05 , tak odchýlka od normality sa považuje za významnú. Červená farba tiež vyznačuje významnosť.
Pokiaľ je potrebné urobiť výber z nameraných hodnôt premenných podľa určitých kritérií, tak tieto navolíme zatlačením Select cases. Tu napr. bude zvolená podmienka v náväznosti na premennú TYZDEN pre týždeň pôrodu.
Popisná štatistika - teória |