Testovanie zhody pravdepodobnostných rozdekení

Pri odovzdávaní na kontrolu: V každom príklade je nevyhnutné napísať záver - či testovanú hypotézu zamietame alebo nezamietame a prečo. Nestačí použítý kód, resp. výstup z neho. Treba sa (aspoň pokúsiť - v prípade potreby sa to opraví) interpretovať, čo získaný výstup hovorí.

Uvažujme hádzanie kockou z videa zo slajdov. Testujte zhodu s rovnomerným rozdelením pomocou funkcie chisq.test. Dokumentáciu k funkcii v R môžeme získať pomocou otáznika s názvom funkcie v konzole:
```
?chisq.test
```
Samozrejme, aj na internete sa dajú informácie k funkciám. V prípade použitia umelej inteligencie si treba odpoveď overiť (videli sme v priebehu semestra vo videu, že nie všetky odpovede sú správne).

Výstup na kontrolu (časť data sa môže líšiť v závislosti od použitého označenia):
```
## 
##  Chi-squared test for given probabilities
## 
## data:  as.table(x)
## X-squared = 3.582, df = 5, p-value = 0.611
```
Štatistiku porovnajte s ručne vypočíanou hodnotou na poslednom cvičení
Chí kvadrát testom dobrej zhody testuje dáta z Weldonových pokusov z videa zo slajdov.
- Aké sú očakávané pravdepodobnosti jednotlivých hodnôt, ak platí hypotéza o pravidelnej kocke?
- Použitie testu predpokladá (kvôli opodstatnenosti použitia aproximácie rozdelenia štatitiky pomocou chí kvadrát rozdelenia), že očakávané početnosti sú pre každú možnosť aspoň 5. Vytvorte poslednú skupinu z tabuľke tak, že zlúčite niekoľko posledných, aby ste dosiahli splnenie tejto podmienky (napr. “aspoň 11 úspechov”, “aspoň 10 úspechov” - vyberte možnosť, ktorá ponechá čo najviac riadkov v tabuľke).
- Testuje hypoézu o pravidelnej kocke pomocou chí kvadrát testu dobrej zhody. Vypočítajte štatistiku priamo pomocou vzorca z hodiny, aj pomocou funkcie zabudovanej v R-ku.
Pri simuláciách nasledovného príkladu vznikla hypotéza o rovnomernom rozdelení na intervale $(-1,1)$.

Náhodné premenné $X$, $Y$ sú nezávislé a každá z nich má exponenciálne rozdelenie s tou istou strednou hodnotou. Zvoľte si niekoľko (2-3) hodnôt pre túto spoločnú strednú hodnotu náhodných premenných. Zistite (t. j. vyslovte na základe simulácií hypotézu), aké rozdelenie má náhodná premenná $\frac{X-Y}{X+Y}$.

Testujte túto hypotézu pomocou Kolmogorovovho-Smirnovovho testu.
Testovanie normálneho rozdelenia pre zadané dáta (ak nie sú presne dané parametre) robíme pomocou Lillieforsovho testu . Funkcia lillie.test je v balíku `nortest. Ak treba, najskôr ho nainštalujte, potom balík načítajte.
```
install.packages("nortest") # instalacia
library(nortest) # nacitanie
```
Otestujte normalitu dát vo vektoroch y1, y2, y3, y4 z poslednej hodiny.

Podobne ako v nainštalujte knižnicu ipsRdbs, z ktorej budeme používať dáta na testovanie. Zistite, čo vyjadrujú nasledovné dáta (pomocou otáznika, rovnako ako v prípade zisťovania použitia funkcie)

library(ipsRdbs)

data(bodyfat)  # nacitame data na analyzovanie
str(bodyfat)   # struktura objektu

## 'data.frame':    102 obs. of  2 variables:
##  $ Skinfold: num  44.5 41.8 33.7 50.9 40.5 51.2 54.4 52.3 57 65.3 ...
##  $ Bodyfat : num  8.47 7.68 6.16 8.56 6.86 ...

head(bodyfat)  # zaciatok dat

##   Skinfold Bodyfat
## 1     44.5    8.47
## 2     41.8    7.68
## 3     33.7    6.16
## 4     50.9    8.56
## 5     40.5    6.86
## 6     51.2    9.40

class(bodyfat) # trieda

## [1] "data.frame"

Ide o data frame, k jednotlivým stĺpcom sa dostaneme pomocou bodyfat$Skinfold a bodyfat$Bodyfat. Zobrazte histogram a otestujte normálne rozdelenie týchto dát a následne ich logaritmov.

Na kontrolu výstup pre prvý stĺpec dát:

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  bodyfat$Skinfold
## D = 0.12774, p-value = 0.000309

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  log(bodyfat$Skinfold)
## D = 0.067625, p-value = 0.3007

Zistite, čo obsahujú dáta ffood z toho istého balíka a akú interpretáciu má testovanie zhody pravdepdobobnostného rozdelenia dát v jednotlivých stĺpcoch. Spravte vhodný test, ktorým túto hypotézu otestujete.
```
data(ffood)
ffood
```
```
##     AM PM
## 1   38 45
## 2  100 62
## 3   64 52
## 4   43 72
## 5   63 81
## 6   59 88
## 7  107 64
## 8   52 75
## 9   86 59
## 10  77 70
```
Naprogramujte jedno kolo nasledovnej hry (to znamená, že ignorujeme inštrukciu “he is also the starter of the new game” – vždy sa odohrá len jedna hra). Spravte simulácie hry a zaznamenávajte, ktorý hráč vyhral (prvý, druhý alebo tretí). Testujte hypotézu, že pravdepodobnosti víťazstva všetkých troch hráčov sú rovnaké.

Text je z článku Wai-Sum Chan: Mang Kung Dice Game.
Vyberte si niektorý príklad a zadajte ho umelej inteligencii s otázkou, aký test máte na testovanie použiť a ako to spraviť v R-ku. Priložte screenshot alebo skopírovanú otázku a odpoveď (a prípadný ďalší rozhovor s doplňujúcimi otázkami) a váš komentár. Štatistických testov je veľa, často je viac možností, ktoré použiť. Môžu však mať napríklad rôzne predpoklady. Ak ide o neznámy test, treba sa s ním oboznámiť, nielen použiť navrhnutý kód. Spíšte svoje skúsenosti.