Budeme hľadať AR model pre prvé diferencie úrokových mier a predikovať úrokové miery. Vyberte si jeden zo štátov, pre ktorý máme v dátach z cvičenia dostupné úrokové miery, s týmito podmienkami:
Nie Rakúsko - s tým sme pracovali na cvičení
Nie Grécko - tam sú dáta typu character
kvôli jednému chýbajúcemu pozorovaniu označenému ako -
, čo by bolo treba ošetrovať navyše.
Nie Estónsko - kvôli príliš malému počtu dát:
sum(!is.na(data[, "Estonia, Euro"])) # pocet hodnot, ktore nie su NA
## [1] 19
Každý, resp. každá dvojica pracuje s inými dátami, rezervácia v google dokumente.
Spravte z vašich dát časový rad, ktorý končí v decemberi 2021 a začína v januári 2001, resp. neskôr, odkedy sú dáta dostupné. S výnimkou už uvedeného Estónska to však nie je taký výrazne malý počet dostupných dát.
Napíšte časový rozsah dát, s ktorými pracujete. Zobrazte časový priebeh úrokových mier a ich diferencií.
Zistite, či môžeme diferencie úrokových mier považovať za biely šum. Zobrazte autokorelačnú funkciu a p-hodnoty Ljung Boxovho testu a skomentujte výsledky.
Presne napíšte, aká hypotéza sa pre každú jednotlivú hypotézu pri hodnotách ACF a pri každom zbehnutom Ljung-Boxovom teste. Teda namiesto "Je to biely šum, lebo všetky p-hodnoty Ljung-Boxovho testu sú väčšie ako 0,05" napíšte (vo vlastnej formulácii) "Jednotlivé Ljung-Boxove testy testujú hypotézy... Keďže p-hodnoty vyšli..., tieto hypotézy... To znamená, že ..."
Pre diferencie úrokových mier odhadnite AR modely rádu 1, 2, 3, 4, 5. Výsledky uveďte v tabuľke. V riadkoch budú jednotlivé modely, v stĺpcoch:
Za "dobrý model" budeme považovať taký, pre ktorý sú p-hodnoty Ljung-Boxovho testu pre všetky počty korelácií od minimálneho po 24 väčšie ako 0,05. Ktoré modely vyšli ako dobré?
Poznámky: Požiadavka na dáta zo začiatku zadania sa vzťahuje na to, že aspoň jeden z týchto modelov výjde ako dobrý.
Vyberte z dobrých modelov z predchádzajúcej časti ten, ktorý má najnižšiu hodnotu Bayesovho informačného kritéria.
V pôvodnom súbore s dátami sú k dispozícii aj dáta z roku 2022 od januára do júla, ktoré sme pri našom modelovaní nepoužili. Načítajte ich, použijeme ich na zhodnotenie predikcií.
Spravte pre tieto mesiace predikcie pomocou vášho modelu. Zakreslite do jedného grafu farebne odlíšené: priebeh dát, z ktorých sa odhadoval model (prípadne po vynechaní nejakého vhodného začiatku dát, aby bola časť s predikciami dobre viditeľná), predikované úrokové miery, intervaly spoľahlivosti pre predikcie (+/- jedna a dve štandardné odchýlky) a skutočné hodnoty úrokových mier.
Skomentujte získaný výsledok (Sú hodnoty systematicky vyšie alebo nižšie ako predikcie? Zmestia sa do intervalov spoľahlivosti? Iné podobné komentáre.)