Úlohu vypracováva každý samostatne alebo v dvojici. Komunikácia ohľadom riešenia, zdieľanie kódu a pod. je zakázané. Pri odpísaní úlohy alebo jej časti je DÚ hodnotená 0 bodmi, a to aj pre tých, ktorí úlohu odpísali aj pre tých, ktorí ju dali odpísať.
Úlohu posielajte elektronicky na adresu beata.ulohy@gmail.com s predmetom CR 2020 - DU4 - priezvisko/priezviská Podľa neho sa maily automaticky triedia, preto tento formát treba dodržať.
Body za DÚ dostanete mailom. V prípade, že úlohu riešite v skupine, pri odovzdávaní pošlite kópiu mailu aj ostatným členom skupiny, aby aj oni dostali informáciu o hodnotení, keď ju budem posielať pomocou reply all. Ak to nespravíte, je vašou úlohou informovať kolegov o bodoch.
Posielajte vypracovanú úlohu v pdf formáte (súvislý, dobre čitateľný text doplnený grafmi, nie iba výstupy z R so stručnými poznámkami) a použitý kód ako samostatný súbor. Môžete použiť aj R markdown s HTML výstupom, kde spojíte kompletný kód a sprievodný text, v tom prípade posielajte vygenerovaný dokument.
Každý pracuje s inými dátami, rezervácia dát na stránke (píšte svoje meno/mená a dáta, neuvádzajte svoj e-mail) http://www.websitegoodies.com/guestbook.php?a=view&id=1737049
Nájdite si vhodné dáta (t. j. také, pre ktoré nájdete vhodný ARIMA model).
Dáta majú byť bez pravidelnej sezónnosti. Pravidelnú sezónnosť majú napríklad mesačné hodnoty teploty alebo prietoku riek, sezónne neočistené kvartálne hodnoty HDP, dáta AirPassengers
zo začiatku semestra a pod. - je to na grafe s priebehom jasne viditeľné. Ak počas hľadania dát na takéto dáta narazíte, odložte si ich, zídu sa v poslednej domácej úlohe.
Z dát vynechajte niekoľko posledných hodnôt. Tieto nebudete používať pri hľadaní modelu, ale použite ich na zhodnotenie kvality predikcií.
V domácej úlohe:
Vysvetlite, čo vyjadrujú vaše dáta, uveďte ich zdroj a znázornite ich priebeh.
Zistite správny rád diferencovania - treba zobrať do úvahy trend a jednotkový koreň. Spíšte výsledky a doplňte ich výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu. Ukončenie diferencovania (ako aj diferencovanie bez jasného trendu) treba zdôvodniť testami, nestačí povedať "toto už vyzerá dobre".
Nájdite vhodný ARIMA model pre vaše dáta - t. j. model má nekorelované rezíduá. Overte stacionaritu a invertovateľnosť. Váš komentár k modelu znovu doplňte výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu.
Spravte predikcie z vášho modelu (pre pôvodnú premennú, nie pre prípadné diferencie) a porovnajte ich so skutočnými hodnotami.
Zhodnoťte váš model. Čo si o ňom myslíte?
Súčasťou predchádzajúceho zadania bolo testovanie jednotkového koreňa. V poslednom kroku (po prípadnom predchádzajúcom diferencovaní) nastala situácia, že v dátach nebol ani trend, ani jednotkový koreň, a preto ich nebolo potrebné diferencovať.
Podrobne vysvetlite, čo sa tam dialo. Napíšte, aké dáta ste testovali a uveďte ich graf. Napíšte, ktorou formou ADF testu (drift, trend, none) ste ich testovali a ako vyzeral výstup. Potom odpovedzte na otázky zo slajdu 43 prednášky http://www.iam.fmph.uniba.sk/institute/stehlikova/cr20/slajdy/cr05.pdf.