Úlohu vypracováva každý samostatne alebo v dvojici. Komunikácia ohľadom riešenia, zdieľanie kódu a pod. je zakázané. Pri odpísaní úlohy alebo jej časti je DÚ hodnotená 0 bodmi, a to aj pre tých, ktorí úlohu odpísali aj pre tých, ktorí ju dali odpísať.
Úlohu posielajte elektronicky na adresu beata.ulohy@gmail.com s predmetom CR 2020 - DU1 - priezvisko/priezviská Podľa neho sa maily automaticky triedia, preto tento formát treba dodržať.
Body za DÚ dostanete mailom. V prípade, že úlohu riešite v skupine, pri odovzdávaní pošlite kópiu mailu aj ostatným členom skupiny, aby aj oni dostali informáciu o hodnotení, keď ju budem posielať pomocou reply all. Ak to nespravíte, je vašou úlohou informovať kolegov o bodoch.
Posielajte vypracovanú úlohu v pdf formáte (súvislý, dobre čitateľný text doplnený grafmi, nie iba výstupy z R so stručnými poznámkami) a použitý kód ako samostatný súbor. Môžete použiť aj R markdown s HTML výstupom, kde spojíte kompletný kód a sprievodný text, v tom prípade posielajte vygenerovaný dokument.
V druhom príklade pracuje s inými dátami, rezervácia dát na stránke (píšte svoje meno/mená a názov akcie, neuvádzajte svoj e-mail) http://www.websitegoodies.com/guestbook.php?a=view&id=1737049
Budeme pracovať s dátami Nile
z knižnice datasets
. Podľa popisu v dokumentácii: Measurements of the annual flow of the river Nile at Aswan (formerly Assuan), 1871–1970, in 10^8 m^3. Z nich zoberieme dáta z rokov 1901-1950.
library(datasets)
y <- window(Nile, start=1901, end=1950)
plot(y)
acf(y, plot = FALSE, lag.max = 10)
##
## Autocorrelations of series 'y', by lag
##
## 0 1 2 3 4 5 6 7 8 9 10
## 1.000 0.149 -0.031 -0.223 -0.379 -0.195 0.054 0.009 0.174 -0.068 -0.106
Úloha A. Pomocou týchto zaokrúhlených hodnôt testujte Ljung-Boxovým testom hypotézu, že prvé tri autokorelácie tohto časového radu sú nulové. Odpovedzte na nasledujúce otázky:
Úloha B. Pomocou funkcie Box.test
(teda už pomocou dát, nie horeuvedených zaokrúhlených hodnôt ACF) testujte Ljung-Boxovým testom hypotézu, že prvých K
autokorelácií, je nulových, postupne pre K
rovné 1, 2, ..., 10. Pre kontrolu uveďte minimálnu a maximálnu p-hodnotu, ktorá sa v týchto testoch dosiahla.
Úloha C. Môžeme tieto dáta považovať za biely šum posunutý o konštantu? Prečo?
Pre dáta v premennej y
odhadneme AR(2) model a vypíšeme odhadnuté koeficienty.
library(astsa)
m <- sarima(y, 2, 0, 0, details = FALSE)
m$fit$coef
## ar1 ar2 xmean
## 0.15578244 -0.05504351 841.21450599
Úloha D. Zapíšte model v tvare \[y_t = \delta + \alpha_1 y_{t-1} + \alpha_2 y_{t-2} + u_t\] a ukážte, že je stacionárny - napíšte polynóm, ktorého korene budete počítať, číslené hodnoty koreňov, ich absolútne hodnoty a čo z nich vyplýva
Úloha E.
Nájdite vhodný model pre tieto dáta a vysvetlite, ako ste spokojní s rezíduami. Vypočítajte predikcie pre nasledujúci rok a vypočítajte percentuálnu chybu (teda čomu sa rovná 100*(predikcia – skutočnosť)/skutočnosť)
, skutočná hodnota je v časovom rade Nile
).
Tak ako na cvičení (prvý týždeň v škole), pomocou knižnice quantmod
načítame priamo do R-ka ceny akcií a zistíme, či sa ich výnosy dajú modelovať ako biely šum.
Zvoľte si firmu (každý, resp. každá skupina inú) a stiahnite si ceny akcií tejto firmy za zvolené obdobie, minimálne za jeden rok. Trasformujte dáta na týždenné a vypočítajte logaritmické výnosy. Testujte pomocou ACF a Ljung-Boxovho testu, že tieto výnosy sa dajú modelovať ako konštanta (stredná hodnota výnosov - tá na autokorelácie nemá vplyv) plus biely šum.
V texte domácej úlohe uveďte: