Úlohu vypracováva každý samostatne alebo v dvojici. Komunikácia ohľadom riešenia, zdieľanie kódu a pod. je zakázané. Pri odpísaní úlohy alebo jej časti je DÚ hodnotená 0 bodmi, a to aj pre tých, ktorí úlohu odpísali aj pre tých, ktorí ju dali odpísať.
Úlohu posielajte elektronicky na adresu beata.ulohy@gmail.com s predmetom CR 2019 - DU3 - priezvisko/priezviská Podľa neho sa maily automaticky triedia, preto tento formát treba dodržať.
Body za DÚ dostanete mailom. V prípade, že úlohu riešite v skupine, pri odovzdávaní pošlite kópiu mailu aj ostatným členom skupiny, aby aj oni dostali informáciu o hodnotení, keď ju budem posielať pomocou reply all.
Posielajte vypracovanú úlohu v pdf formáte (súvislý, dobre čitateľný text doplnený grafmi, nie iba výstupy z R so stručnými poznámkami) a použitý kód ako samostatný súbor.
Každý pracuje s inými dátami, rezervácia na stránke (píšte svoje meno/mená a použíté dáta, neuvádzajte svoj e-mail) http://www.websitegoodies.com/guestbook.php?a=view&id=1735405
Nájdite si vhodné dáta (t. j. také, pre ktoré nájdete vhodný ARIMA model).
Dáta majú byť bez pravidelnej sezónnosti (pravidelnú sezónnosť majú napríklad mesačné hodnoty teploty alebo prietoku riek, sezónne neočistené kvartálne hodnoty HDP, dáta AirPassengers
zo začiatku semestra a pod. - je to na grafe s priebehom jasne vidieteľné).
Nemôže ísť o dáta zabudované v knižniciach R-ka (také, aké sme používali na cvičení) ani dáta o HDP z knižnice WDI
(ale môžete túto knižnicu použiť na nájdenie iných dát), treba si nájsť vlastné.
Z dát vynechajte niekoľko posledných hodnôt. Tieto nebudete používať pri hľadaní modelu, ale použite ich na zhodnotenie kvality predikcií.
V domácej úlohe:
Vysvetlite, čo vyjadrujú vaše dáta, uveďte ich zdroj a znázornite ich priebeh.
Zistite správny rád diferencovania - treba zobrať do úvahy trend a jednotkový koreň. Spíšte výsledky a doplňte ich výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu.
Nájdite vhodný ARIMA model pre vaše dáta - t. j. model, ktorý je stacionárny, invertovateľný a má nekorelované rezíduá. Ukážte, že váš model má požadované vlastnosti. Váš komentár k modelu znovu doplňte výstupmi z R-ka tak, aby sa vaše tvrdenia dali skontrolovať bez spúšťania kódu.
Spravte predikcie z vášho modelu (pre pôvodnú premennú, nie pre prípadné diferencia) a porovnajte ich so skutočnými hodnotami.
Ako už bolo spomínané, dáta dostupné pomocou knižnice WDI
(okrem dát týkajúcich sa HDP - to bolo obsahom predchádzajúcej domácej úlohy)
Quandl: http://www.quandl.com/, dá sa k nim pristupovať priamo alebo pomocou R (to sa dá naučiť napríklad tu: https://www.datacamp.com/community/open-courses/quandl-r-tutorial)
Alebo iné :-)