Pri odovzdávaní na kontrolu: V každom príklade je nevyhnutné napísať záver - či testovanú hypotézu zamietame alebo nezamietame a prečo. Nestačí použítý kód, resp. výstup z neho. Treba sa (aspoň pokúsiť - v prípade potreby sa to opraví) interpretovať, čo získaný výstup hovorí.

  1. Uvažujme hádzanie kockou z videa zo slajdov. Testujte zhodu s rovnomerným rozdelením pomocou funkcie chisq.test. Dokumentáciu k funkcii v R môžeme získať pomocou otáznika s názvom funkcie v konzole:

    ?chisq.test

    Samozrejme, aj na internete sa dajú informácie k funkciám. V prípade použitia umelej inteligencie si treba odpoveď overiť (videli sme v priebehu semestra vo videu, že nie všetky odpovede sú správne).

    Výstup na kontrolu (časť data sa môže líšiť v závislosti od použitého označenia):

    ## 
    ##  Chi-squared test for given probabilities
    ## 
    ## data:  as.table(x)
    ## X-squared = 3.582, df = 5, p-value = 0.611

    Štatistiku porovnajte s ručne vypočíanou hodnotou na poslednom cvičení

  2. Chí kvadrát testom dobrej zhody testuje dáta z Weldonových pokusov z videa zo slajdov.

    • Aké sú očakávané pravdepodobnosti jednotlivých hodnôt, ak platí hypotéza o pravidelnej kocke?
    • Použitie testu predpokladá (kvôli opodstatnenosti použitia aproximácie rozdelenia štatitiky pomocou chí kvadrát rozdelenia), že očakávané početnosti sú pre každú možnosť aspoň 5. Vytvorte poslednú skupinu z tabuľke tak, že zlúčite niekoľko posledných, aby ste dosiahli splnenie tejto podmienky (napr. “aspoň 11 úspechov”, “aspoň 10 úspechov” - vyberte možnosť, ktorá ponechá čo najviac riadkov v tabuľke).
    • Testuje hypoézu o pravidelnej kocke pomocou chí kvadrát testu dobrej zhody. Vypočítajte štatistiku priamo pomocou vzorca z hodiny, aj pomocou funkcie zabudovanej v R-ku.

  3. Pri simuláciách nasledovného príkladu vznikla hypotéza o rovnomernom rozdelení na intervale \((-1,1)\).

    Náhodné premenné \(X\), \(Y\) sú nezávislé a každá z nich má exponenciálne rozdelenie s tou istou strednou hodnotou. Zvoľte si niekoľko (2-3) hodnôt pre túto spoločnú strednú hodnotu náhodných premenných. Zistite (t. j. vyslovte na základe simulácií hypotézu), aké rozdelenie má náhodná premenná \(\frac{X-Y}{X+Y}\).

    Testujte túto hypotézu pomocou Kolmogorovovho-Smirnovovho testu.

  4. Testovanie normálneho rozdelenia pre zadané dáta (ak nie sú presne dané parametre) robíme pomocou Lillieforsovho testu. Funkcia lillie.test je v balíku `nortest. Ak treba, najskôr ho nainštalujte, potom balík načítajte.

    install.packages("nortest") # instalacia
    library(nortest) # nacitanie

    Otestujte normalitu dát vo vektoroch y1, y2, y3, y4 z poslednej hodiny.

  5. Podobne ako v nainštalujte knižnicu ipsRdbs, z ktorej budeme používať dáta na testovanie. Zistite, čo vyjadrujú nasledovné dáta (pomocou otáznika, rovnako ako v prípade zisťovania použitia funkcie)

    library(ipsRdbs)
    
    data(bodyfat)  # nacitame data na analyzovanie
    str(bodyfat)   # struktura objektu
    ## 'data.frame':    102 obs. of  2 variables:
    ##  $ Skinfold: num  44.5 41.8 33.7 50.9 40.5 51.2 54.4 52.3 57 65.3 ...
    ##  $ Bodyfat : num  8.47 7.68 6.16 8.56 6.86 ...
    head(bodyfat)  # zaciatok dat
    ##   Skinfold Bodyfat
    ## 1     44.5    8.47
    ## 2     41.8    7.68
    ## 3     33.7    6.16
    ## 4     50.9    8.56
    ## 5     40.5    6.86
    ## 6     51.2    9.40
    class(bodyfat) # trieda 
    ## [1] "data.frame"

    Ide o data frame, k jednotlivým stĺpcom sa dostaneme pomocou bodyfat$Skinfold a bodyfat$Bodyfat. Zobrazte histogram a otestujte normálne rozdelenie týchto dát a následne ich logaritmov.

    Na kontrolu výstup pre prvý stĺpec dát:

    ## 
    ##  Lilliefors (Kolmogorov-Smirnov) normality test
    ## 
    ## data:  bodyfat$Skinfold
    ## D = 0.12774, p-value = 0.000309
    ## 
    ##  Lilliefors (Kolmogorov-Smirnov) normality test
    ## 
    ## data:  log(bodyfat$Skinfold)
    ## D = 0.067625, p-value = 0.3007
  6. Zistite, čo obsahujú dáta ffood z toho istého balíka a akú interpretáciu má testovanie zhody pravdepdobobnostného rozdelenia dát v jednotlivých stĺpcoch. Spravte vhodný test, ktorým túto hypotézu otestujete.

    data(ffood)
    ffood
    ##     AM PM
    ## 1   38 45
    ## 2  100 62
    ## 3   64 52
    ## 4   43 72
    ## 5   63 81
    ## 6   59 88
    ## 7  107 64
    ## 8   52 75
    ## 9   86 59
    ## 10  77 70
  7. Naprogramujte jedno kolo nasledovnej hry (to znamená, že ignorujeme inštrukciu “he is also the starter of the new game” – vždy sa odohrá len jedna hra). Spravte simulácie hry a zaznamenávajte, ktorý hráč vyhral (prvý, druhý alebo tretí). Testujte hypotézu, že pravdepodobnosti víťazstva všetkých troch hráčov sú rovnaké.

    Text je z článku Wai-Sum Chan: Mang Kung Dice Game.

  8. Vyberte si niektorý príklad a zadajte ho umelej inteligencii s otázkou, aký test máte na testovanie použiť a ako to spraviť v R-ku. Priložte screenshot alebo skopírovanú otázku a odpoveď (a prípadný ďalší rozhovor s doplňujúcimi otázkami) a váš komentár. Štatistických testov je veľa, často je viac možností, ktoré použiť. Môžu však mať napríklad rôzne predpoklady. Ak ide o neznámy test, treba sa s ním oboznámiť, nielen použiť navrhnutý kód. Spíšte svoje skúsenosti.