Pri odovzdávaní na kontrolu: V každom príklade je nevyhnutné napísať záver - či testovanú hypotézu zamietame alebo nezamietame a prečo. Nestačí použítý kód, resp. výstup z neho. Treba sa (aspoň pokúsiť - v prípade potreby sa to opraví) interpretovať, čo získaný výstup hovorí.
Uvažujme hádzanie kockou
z
videa zo slajdov. Testujte zhodu s rovnomerným rozdelením pomocou
funkcie chisq.test
. Dokumentáciu k funkcii v R môžeme
získať pomocou otáznika s názvom funkcie v konzole:
?chisq.test
Samozrejme, aj na internete sa dajú informácie k funkciám. V prípade použitia umelej inteligencie si treba odpoveď overiť (videli sme v priebehu semestra vo videu, že nie všetky odpovede sú správne).
Výstup na kontrolu (časť data
sa môže líšiť v závislosti
od použitého označenia):
##
## Chi-squared test for given probabilities
##
## data: as.table(x)
## X-squared = 3.582, df = 5, p-value = 0.611
Štatistiku porovnajte s ručne vypočíanou hodnotou na poslednom cvičení
Chí kvadrát testom dobrej zhody testuje dáta z Weldonových pokusov z videa zo slajdov.
Pri simuláciách nasledovného príkladu vznikla hypotéza o rovnomernom rozdelení na intervale \((-1,1)\).
Náhodné premenné \(X\), \(Y\) sú nezávislé a každá z nich má exponenciálne rozdelenie s tou istou strednou hodnotou. Zvoľte si niekoľko (2-3) hodnôt pre túto spoločnú strednú hodnotu náhodných premenných. Zistite (t. j. vyslovte na základe simulácií hypotézu), aké rozdelenie má náhodná premenná \(\frac{X-Y}{X+Y}\).
Testujte túto hypotézu pomocou Kolmogorovovho-Smirnovovho testu.
Testovanie normálneho rozdelenia pre zadané dáta (ak nie sú presne
dané parametre) robíme pomocou
Lillieforsovho
testu. Funkcia lillie.test
je v balíku `nortest. Ak
treba, najskôr ho nainštalujte, potom balík načítajte.
install.packages("nortest") # instalacia
library(nortest) # nacitanie
Otestujte normalitu dát vo vektoroch y1, y2, y3, y4
z
poslednej hodiny.
Podobne ako v nainštalujte knižnicu ipsRdbs
, z ktorej
budeme používať dáta na testovanie. Zistite, čo vyjadrujú nasledovné
dáta (pomocou otáznika, rovnako ako v prípade zisťovania použitia
funkcie)
library(ipsRdbs)
data(bodyfat) # nacitame data na analyzovanie
str(bodyfat) # struktura objektu
## 'data.frame': 102 obs. of 2 variables:
## $ Skinfold: num 44.5 41.8 33.7 50.9 40.5 51.2 54.4 52.3 57 65.3 ...
## $ Bodyfat : num 8.47 7.68 6.16 8.56 6.86 ...
head(bodyfat) # zaciatok dat
## Skinfold Bodyfat
## 1 44.5 8.47
## 2 41.8 7.68
## 3 33.7 6.16
## 4 50.9 8.56
## 5 40.5 6.86
## 6 51.2 9.40
class(bodyfat) # trieda
## [1] "data.frame"
Ide o data frame, k jednotlivým stĺpcom sa dostaneme pomocou
bodyfat$Skinfold
a bodyfat$Bodyfat
. Zobrazte
histogram a otestujte normálne rozdelenie týchto dát a následne ich
logaritmov.
Na kontrolu výstup pre prvý stĺpec dát:
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: bodyfat$Skinfold
## D = 0.12774, p-value = 0.000309
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: log(bodyfat$Skinfold)
## D = 0.067625, p-value = 0.3007
Zistite, čo obsahujú dáta ffood
z toho istého balíka a
akú interpretáciu má testovanie zhody pravdepdobobnostného rozdelenia
dát v jednotlivých stĺpcoch. Spravte vhodný test, ktorým túto hypotézu
otestujete.
data(ffood)
ffood
## AM PM
## 1 38 45
## 2 100 62
## 3 64 52
## 4 43 72
## 5 63 81
## 6 59 88
## 7 107 64
## 8 52 75
## 9 86 59
## 10 77 70
Naprogramujte jedno kolo nasledovnej hry (to znamená, že ignorujeme inštrukciu “he is also the starter of the new game” – vždy sa odohrá len jedna hra). Spravte simulácie hry a zaznamenávajte, ktorý hráč vyhral (prvý, druhý alebo tretí). Testujte hypotézu, že pravdepodobnosti víťazstva všetkých troch hráčov sú rovnaké.
Text je z článku Wai-Sum Chan: Mang Kung Dice Game.
Vyberte si niektorý príklad a zadajte ho umelej inteligencii s otázkou, aký test máte na testovanie použiť a ako to spraviť v R-ku. Priložte screenshot alebo skopírovanú otázku a odpoveď (a prípadný ďalší rozhovor s doplňujúcimi otázkami) a váš komentár. Štatistických testov je veľa, často je viac možností, ktoré použiť. Môžu však mať napríklad rôzne predpoklady. Ak ide o neznámy test, treba sa s ním oboznámiť, nielen použiť navrhnutý kód. Spíšte svoje skúsenosti.