Spojité pravdepodobnostné rozdelenia (1)

Metódy riešenia úloh z pravdepodobnosti a štatistiky

Generovanie náhodných čísel z rovnomerného rozdelenia na danom intervale

set.seed(12345)
x <- runif(5, min = 1, max = 2) # 5 cisel z intervalu (1, 2)
x
[1] 1.720904 1.875773 1.760982 1.886125 1.456481
y <- runif(3) # defaultne min = 0, max = 1
y
[1] 0.1663718 0.3250954 0.5092243
z <- runif(1000, min = -1, max = 1)
hist(z)

hist(z, breaks = 20)

prop.table(table(round(z)))

   -1     0     1 
0.227 0.520 0.253 

Cvičenie: Aké je presné pravdepodobnostné rozdelenie náhodnej premennej z posledného výpočtu (round(z))?

Príklad

Na úsečke dĺžky 1 sú náhodne zvolené dva body (každý rovnomerne na celej dĺžke úsečky, nezávisle jeden na druhom). Tieto dve body vytvoria úsečku. Aká je pravdepodobnosť, že jej dĺžka je menej ako 1/3?

priklad1 <- function(){
  body <- runif(2) # dva body, nezavisle rovnomerne na (0, 1)
  dlzka <- abs(body[1] - body[2])
  
  # ALEBO: 
  # dlzka <- abs(body[2] - body[2])
  
  # ALEBO:
  # funkcia `diff`
  # `diff(body)` je to iste ako `body[2] - body[1]`
  # dlzka <- abs(diff(body))
  
  return(dlzka < 1/3)
}

set.seed(123)
simulacie <- replicate(10^5, priklad1())
prop.table(table(simulacie))
simulacie
 FALSE   TRUE 
0.4455 0.5545 

Príklady s rovnomerným rozdelením na samostatné riešenie simuláciami

Vo všetkých zadaniach sa pod náhodnou voľbou bodov, čísel a pod. rozumie výber z rovnomerného rozdelenia na danej množine. V prípade výberu viacerých hodnôt sú tieto hodnoty nezávislé.

  • Na úsečke AB sú náhodne zvolené body L a M. Aká je pravdepodobnosť, že bod L je bližšie k bodu M ako k bodu A?

  • Na úsečke dĺžky 1 sú náhodne zvolené dva body, ktoré úsečku rozdelia na tri časti. Aká je pravdepodobnosť, že žiadna z tých častí nebude dlhšia ako 3/4?

  • Romeo a Júlia sa majú stretnúť na dohodnutom mieste. Každý tam príde v náhodnom čase medzi jedenástou a dvanástou hodinou. Aká je pravdepodobnosť, že sa im podarí stretnúť, ak budú na seba čakať 10 minút?

  • Dva parníky prichádzajú do toho istého prístavu. Príjazdy sú rovnako možné počas celého dňa. Určte pravdepodobnosť, že jeden z parníkov bude musieť čakať na uvoľnenie prístavu, ak prvý parník stojí v prístave jednu hodinu a druhý dve hodiny?

  • Tyč dĺžky 200 cm sa náhodne rozlomí na kusy. Určte pravdepodobnosť, že niektorý z nich bude mať dĺžku nanajvýš 10 cm, ak je tyč rozlomená na dvoch miestach?

  • Tyč dĺžky 200 cm sa náhodne rozlomí na kusy. Určte pravdepodobnosť, že niektorý z nich bude mať dĺžku nanajvýš 10 cm, ak je tyč rozlomená na troch miestach?

  • Na obvode štvorca so stranou 1 sú náhodne zvolené dva body. Určte strednú hodnotu druhej mocniny ich vzdialenosti.

Exponenciálne a normálne rozdelenie (a iné rozdelenia)

Videli sme:

  • runif: r je skratka random unif je skratka uniform

Analogicky náhodné čísla z iných rozdelení:

  • rnorm z normálneho rozdelenia
  • rexp z exponenciálneho rozdelenia

Zadávajú sa parametre:

x <- rnorm(10^5, mean = 10, sd = 2) # stredna hodnota 10, standardna odchylka 2
hist(x)

mean(x)
[1] 10.01043
var(x)  # vyberova disperzia
[1] 4.031245
y <- rexp(10^5, rate = 1/2) # pozrite vyznam parametra `rate` pomocou ?rexp
hist(y)

mean(y)
[1] 2.000623
var(y)
[1] 3.982792

Príklady s normálnym a exponenciálnym rozdelením na samostatné riešenie simuláciami

  • Životnosť žiarovky má exponenciálne rozdelenie so strednou hodnotou 1 (jednotku času teda uvažujeme takú, že je ňou očakávaná životnosť žiarovky). Kúpili sme 10 žiaroviek a postupne ich vymieňame. Aké je pravdepodobnostné rozdelenie času, počas ktorého nám týchto 10 žiaroviek bude stačiť?

  • Pri meraní prístrojom vzniká chyba, ktorá má normálne rozdelenie s nulovou strednou hodnotou a so štandardnou odchýlkou 2 mm. Aká je pravdepodobnosť, že dve nezávislé merania budú mať chyby v absolútnej hodnote väčšiu ako 1 mm, pričom tieto chyby budú mať rôzne znamienka?

  • Náhodná premenná \(X\) má exponenciálne rozdelenie. Aké je rozdelenie jej celej časti? Ako závisí odpoveď od parametra exponenciálneho rozdelenia?

  • Náhodná premenná \(X\) má normálne rozdelenie s nulovou strednou hodnotou. Určte disperziu, pri ktorej je maximálna pravdepodobnosť, že náhodná premenná nadobudne hodnotu z intervalu \((1, 2)\).

  • Náhodná premenná má lognormálne rozdelenie, ak má tvar \(exp(X)\), kde \(X\) je náhodná premenná s normálnym rozdelením. Určte strednú hodnotu lognormálne rozdelenej náhodnej premennej, ak jej logaritmus má rozdelenie \(N(0, 1)\).

  • Test obsahuje 60 otázok a na jeho vypracovanie je 180 minút. Práca na odpovedi sa skladá z dvoch častí. Najskôr sa spraví rozbor úlohy, čas potrebný na rozbor je náhodná premenná \(S\) (screen time). Počas rozboru sa určí čas \(W\) (working time), ktorý bude potrebný na vypracovanie, teda dokončenie výpočtov, úprava výsledku a pod. Predpokladá sa, že \(S\), \(W\) sú nezávislé náhodné premenné a sú nezávislé aj pre jednotlivé otázky. Predpokladajme, že študent zo skúsenosti so vzorovými testami vie, že \(S\), \(W\) majú exponenciálne rozdelenie so strednými hodnotami \(1,77\) a \(4,23\) minúty. Jeho stratégia je nasledovná: Ak sa po dokončení rozboru zistí, že doba vypracovania \(W\) bude väčšia ako \(K\), nebude strácať čas vypracovaním, ale pôjde robiť rozbor ďalšej úlohy. Úlohou je nájsť optimálnu hodnotu \(K\), ktorá maximalizuje strednú hodnotu počtu vyriešených príkladov. Ak bude príliš veľké, môže sa stať, že vypracovanie niekoľkých náročných otázok zaberie príliš veľa času a nezostane čas na ostatné. Pri malej hodnote sa zase budú robiť rozbory, ale riešiť sa bude len málo príkladov. Treba nájsť vhodný kompromis.