Popisná štatistika - príklad v programe STATISTICA

Popisná štatistika - teória  

STATISTICA - modul Basic statistics and tables.

Daný je dátový súbor deti.sta, 11 stĺpcov (variables) X 695 riadkov (cases), v ktorom sú údaje o novorodencoch. Hmotnosť-HM, dĺžka-DL, obvod hlavy-HLAVA, pôvod rodičky-R (nerómky/rómky),..

Cieľom popisnej štatistiky je zistiť parametre polohy, variability a relatívnu frekvenčnú distribúciu sledovaných premenných, overenie predpokladu normality. Vyberieme Analysis/Frequency tables a vyplníme dialógové okno:

Vyberáme:
Variables: premenné vstupujúce do analýzy

Categorisation method for tables and graphs: V tejto sekcii sa vyberá spôsob rozdelenia hodnôt premennej do intervalov. Tu sú možnosti:
All distinct values - početnosť výskytu každej hodnoty premennej sa vyhodnocuje osobitne

No. of exact intervals - rozsah hodnôt je rozdelený do určeného počtu intervalov
"Neat" intervals - dôjde k zaokrúhleniu hraníc intervalov, čo vedie nie vždy k ich zadanému počtu

Step size - určí sa šírka intervalov a počiatok prvého intervalu
Integer categories - započítavajú sa iba celočíselné hodnoty premennej
Specific grouping codes - ako predchádzajúci prípad, s možnosťou vybrať podmnožinu možných hodnôt
User defined categories - každý interval hodnôt sa dá zadefinovať osobitne.
Ak nie je zaškrtnuté Casevise deletion of MD, tak ak v niektorej z premenných vybratých do analýzy chýba v k-tom riadku meranie (missing value), ignoruje sa k-te meranie aj u ostatných premenných.
V sekcii Display options sa zadá, čo ešte okrem intervalových početností má byť vo frekvenčnej tabuľke vyčíslené.

Výsledok, po zvolení tlačítka Frequency tables, resp. tlačítka OK pre jednu z vybraných premenných vyzerá takto:

Po zvolení tlačítka Histograms je výsledok:

Ďalšie možnosti grafickej prezentácie skúmaných premenných sú tu.

Po zvolení tlačítka Descriptive statistics vo vstupnom dialógovom okne získame:
aritmetický priemer hodnôt premenných, smerodajnú odchýlku, čo je druhá odmocnina priemerného štvorca vzdialeností hodnôt od priemeru, minimálnu a maximálnu hodnotu a počet hodnôt. Výpočet závisí od spôsobu zadania intervalov v sekcii Cathegorisation method. Ďalšie číselné charakteristiky sa dajú získať použitím analýzy Analysis/Descriptive statistics.

Pokiaľ je potrebné overiť normalitu vybraných premenných, v sekcii Test for normality je treba vybrať, najlepšie všetky tri ponúkané testy, a takto vyzerá výsledok.

Vo výsledku je hodnota testovacej štatistiky a pravdepodobnosť chyby, ktorá vznikne zamietnutím platnej nulovej hypotézy o zhode rozdelenia s normálnym rozdelením. Pokiaľ aspoň jeden z vybraných testov normality dá hodnotu p<0,05 , tak odchýlka od normality sa považuje za významnú. Červená farba tiež vyznačuje významnosť.

Pokiaľ je potrebné urobiť výber z nameraných hodnôt premenných podľa určitých kritérií, tak tieto navolíme zatlačením Select cases. Tu napr. bude zvolená podmienka v náväznosti na premennú TYZDEN pre týždeň pôrodu.

 

Popisná štatistika - teória