Table of Contents
PRAVDEPODOBNOST
Příklad 2
Provádíme test na nějakou nemoc. Máme danou pravděpodobnost, že u zdravých jedinců je test falešně pozitivní (10%) a pravděpodobnost, že u nemocných je falešně negativní (1%). Dále víme, že v náhodném vzorku osob byl test právě u 20% osob pozitivní. Určete, pravděpodobnost výskytu nemoci v populaci. Pravděpodobnost, že člověk s pozitivním testem je opravdu nemocný.
Řešení
1)
p = zdravých v populaci
<math>\frac{10}{100}p+\frac{99}{100}(1-p)=0,2</math>
<math>p=\frac{79}{89}</math>
<math>1-p=\frac{10}{89}=11,2 %</math>
Nemocných je v populaci 11,2 %.
2)
<math>\frac{\frac{99}{100}*\frac{10}{89}}{\frac{99}{100}*\frac{10}{89}+\frac{10}{100}*\frac{79}{89}} = \frac{99}{178} = 0,556</math>
Pravděpodobnost, že člověk s pozitivním testem je opravdu nemocný, je 55,6 %.
Příklad 1
Máme množinu A⊆ {1,2,3,…,49}, která obsahuje právě 6 čísel. Vyberme náhodně 10 čísel z množiny {1,2,3,…49}. Určete pravděpodobnost, že právě 4 z těchto 10 budou i v množině A.
Řešení
Hypergeometrické rozdělení:
<math> P(X=4)=\frac6_choose_4_49-6_choose_10-449_choose_10 </math>
Příklad 1
Šance na narození syna je 3/4, lidé v divné zemi mají potomky tak dlouho dokud se jim nenarodí první syn. Jaký je poměr chlapců a děvčat v populaci?
Řešení
Příklad 2
Mezi stoletými občany je 80% žen. Mužů se rodí 52%. Kolikrát měla žena narozená před 100 lety větší pravděpodobnost než muž, že se dožije alespoň 100 let?
Řešení
- P(Z|100) = 0.8
- P(M|100) = 0.2
- P(Z) = 0.48
- P(M) = 0.52
P(100|Z) / P(100|M) = …. = 13/3 = 4 + 1/3 ⇒ Žena narozená v této době měla 4.333 krát větší pravděpodobnost, že se dožije 100 let.
Příklad 1
V jisté zemi má manželský pár tolik potomků, dokud se jim nenarodí syn, potom další potomky nemají. Pravděpodobnost narození chlapce a dívky je stejná 50%. Jaký je poměr v jedné generaci? Odpověď zdůvodněte.
Řešení
každá rodina bude mít právě jednoho chlapce.
Počet dívek:
P(0) = 1/2 (mají jen jedno dítě - chlapce)
P(1) = 1/4 (mají jednu dívku a jednoho chlapce - 1/2 * 1/2)
P(2) = 1/8
P(3) = 1/16
…
takže pro počet dívek máme řadu:
0*1/2 + 1*1/4 + 2*1/8 + 3*1/16 + …
to můžem rozepsat jako součet řad:
1/4 + 1/8 + 1/16 + ... = 1/2 1/8 + 1/16 + ... = 1/4 1/16 + ... = 1/8 ... ...
tyto jednotlivé řady opet sečteme a dostáváme řadu 1/2 + 1/4 + 1/8 + 1/16 … a součet této řady je 1.
Takže poměr chlapců a dívek bude 1:1
Úloha 2
Pravděpodobnost, že vlk uloví zdravou kořist je 25% a nemocnou 85%. 80% kořistí je zdravých. Jaká je pravděpodobnost, že vlk uloví kořist? Jaká je pravděpodobnost, že kořist, kterou vlk ulovil, byla nemocná?
Řešení
P(Uloví) = 37%; P(Nemocná | Uloví) = 17/37
Riešil by som to takto:
P(Zdravý)=80%, P(Uloví | Zdravý) = 25%, P(Uloví | Nemocný) = 85% P(Uloví)=P(Uloví | Zdravý)*P(Zdravý) + P (Uloví|Nemocný)*P(Nemocný) = 37% P(Nemocný|Uloví) = P(Uloví|Nemocný)*P(Nemocný)/P(U)
Úloha 1
Fotbalový míč se skládá z pětiúhelníků a šestiúhelníků. Pětiúhelníky jsou očíslovány 1,2…12. Šestiúhelníky 13,14..32. Pravděpodobnost, že míč dopadne pětiúhelníkem nahoru je 40% a šestiúhelníkem 60%. Jaká je pravděpodobnost, že po dvou hodech míčem dostaneme součet 23.
Řešení
Příklad 1
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek nevytáhl, když kontrolka hlásí OK? Zapište ve zlomkovém tvaru.
Řešení
<math>\frac{\frac{1}{1000}\cdot \frac{3}{1000}}{\frac{1}{1000}\cdot \frac{3}{1000} + \frac{995}{1000}\cdot \frac{997}{1000}}</math>
Příklad 2
Předpokládejme, že v prezidentských volbách má kandidát A 30% šanci vyhrát a kandidát B 70% šanci.
- Vyplatí se vsadit si na kandidáta A korunu, pokud je kurz takový, že buď prohrajete korunu, nebo vyhrajete 1.2 koruny? (v sazkarskem slangu kurz 2.2)
- Kdybyste si v milionech na sobě nezávislých případech vsadili korunu se stejným kurzem a se stejnou pravděpodobností úspěchu 60 %, kolik byste vyhráli nebo prohráli? snad opraveno na doslovné zadání, řešení se nemění
Řešení
- 0.3 * 1.2 + 0.7 * (-1) , Pokud je vysledek kladny tak se to vyplati a pokud zaporne tak se to nevyplati . Tady to vyjde zaporne proto se to nevyplati
- Uplne nechapu zadani ale typuju ze kurz je stejnej ale sance ze Vyhraje A je 60 % a B 40 % . Tudiz A vyhraje 600 000 x a B vyhraje 400 000x . Tudiz bych to pocital jako 600000 * 1.2 + 400000*(-1)
Varianta A i B
f(x) = cxe^-x, určete c tak aby f(x) byla pravděpodobnostní fce, x(0,∞)
Řešení
Buď si říct, že po zintegrovani f(x) od -inf do inf to musí být 1. Integruje se per partes.
<math>
\int_{-\infty }^{\infty } f(x) dx = 1 =
\int_{0}^{\infty}cx e^{-x} dx =
c\int_{0}^{\infty} xe^{-x}dx =
c \cdot \left [ -xe^{-x}\right ]_0^\infty-\int_{0}^{\infty}-e^{-x}dx =
c \cdot \left [ -xe^{-x}-e^{-x}\right ]_0^\infty =
c \cdot \left [ -\frac{x}{e^{x}} - \frac{1}{e^{x}} \right ]_0^\infty =
= c \cdot \left [ (\lim_{x\to\infty} -\frac{x}{e^{x}} + \lim_{x\to\infty} -\frac{1}{e^{x}}) - (0 - 1) \right] =
</math>
pomocí L'Hospitalova pravidla (typ inf/inf) pokračuji:
<math>
c \cdot 1) = c = 1
</math>
Takže:
c=1
<math>
f(x)=xe^{-x}
</math>
Varianta A
Na 8 kluků ve tříde připadá jedna dívka, 60% dívek dlouhé vlasy, 3/24 kluků dlouhé vlasy (asi tak). Vidím před sebou dlouhé vlasy, jaká je pravděpodobnost, že to je dívka?
Řešení
V. Bayess
P(M)= 8/9
P(Z)= 1/9
P(D|M)= 3/24 = 1/8
P(D|Z)= 6/10 = 3/5
<math> P(Z|D)= {P(Z)*P(D|Z)\over P(Z)*P(D|Z)+P(M)*P(D|M)} = { { {1\over 9} * {3\over 5} }\over { {\over 1 9} * {\over 3 5} + {\over 8 9} * {\over 1 8} } } = {3\over 8} </math> myslim :D -edit: ano, potvrzuji
Příklad 1
Systém Windows používá 80 % uživatelů, systém Linux 40 % uživatelů. Dále 5 % uživatelů nepoužívá ani Windows ani Linux. Jaká je pravděpodobnost, že uživatel používá zároveň Windows a Linux?
Řešení
P(W) = 0.8, P(L) = 0.4, P(Jiný) = 0.05
P(W ∪ L) = P(W) + P(L) - P(W ∩ L)
P(Jiný) = 1 - P(W ∪ L)
1 - P(W ∪ L) = 1 - (P(W) + P(L) - P(W ∩ L))
0.05 = 1 - (0.8 + 0.4 - P(W ∩ L))
0.05 = -0.2 + P(W ∩ L)
P(W ∩ L) = 0.25 ⇒ 25 %
Příklad 1
(10%)
V krabici máme 10 míčků modrých a 5 červených. Vytáhli jsme postupně 4 míčky, aniž bychom je vraceli zpět. Víme, že třetí a čtvrtý míček byl červený. O druhém míčku nám nebyla sdělena žádná informace. Jaká je pravděpodobnost, že první vytažený míček byl modrý?
Řešení
Třetí a čtvrtý červený míček můžeme “rezervovat” předem, takže nám zůstane 10 modrých a 3 červené. Pravěpodobnost, že vytáhneme jeden z 10 modrých z celkového počtu 13 míčků je 10/13.
Příklad 5
Šance že semínko vyklíčí je 90%. Máme jich 100. Najděte E(X), var(X) a počet květináčů, které si musíme připravit, aby nám s 95% P stačily. (už to tu někde bylo)
reseni
rozptyl, střední hodnota
<math>E(X) = p*n = 0.9*100 = 90</math>
<math>Var(X) = p*n*(1-p) = 9</math>
počet květináčů
Najít P(X⇐n)=0.95, kde n je počet květináčů.
<math>P(Z⇐\frac{n-90}{3}) = 0,95</math>
potřebujeme tedy pod gaussovkou 95% plochu: někde mezi 1.64 a 1.65
<math>\frac{n-90}{3} = 1.64</math> ⇒ n=94,9 ⇒ potřebujeme 95 květináčů
Příklad 1
V prvním podlaží nastoupili do výtahu 3 lidi. Každý z nich může vystoupit v kterémkoliv ze sedmi podlaží (tedy ve druhém až sedmém). Jaká je pravděpodobnost, že vystoupí všichni v jednom podlaží?
Řešení
Počet všech jevů je <math>6^3</math> (každý člověk má 6 možností kde vystoupit a ty se mezi sebou vynásobí) a počet příznivých jevů je <math>6</math> (celá trojice má jen 6 možností kde vystoupí společně).
<math>\frac{6}{6^3}=\frac{1}{36}</math>
Příklad 2
Sportovní klub přihlásil 20 běžců na maraton. Jsou mezi nimi 4 výborní, 10 dobrých a 6 průměrných. Pravděpodobnost, že běžec splní časový limit pro kvalifikaci na olympiádu, je pro výborné běžce 0.9, pro dobré 0.7 a pro průměrné 0.5. Jaká je pravděpodobnost, že náhodně vybraný běžec tohoto sportovního klubu splní kvalifikační limit?
Řešení
vypocet podobnej jako ve skupine B, vysledek stejnej - 0.68
Příklad 3
Sportovní klub přihlásil 20 běžců na maraton. Je mezi nimi 6 výborných, 6 dobrých a 8 průměrných. Pravděpodobnost, že běžec splní časový limit pro kvalifikaci na olympiádu, je pro výborné běžce 0.9, pro dobré 0.7 a pro průměrné 0.5. Jaká je pravděpodobnost, že náhodně vybraný běžec tohoto sportovního klubu splní kvalifikační limit?
Řešení
P(V) = 6/20
P(D) = 6/20
p(P) = 8/20
P(K|V) = 0.9
P(K|D) = 0.7
P(K|P) = 0.5
P(K) = ?
P(K) = P(K|V) P(V) + P(K|D) P(D) + P(K|P) P(P) = 9/10 * 6/20 + 7/10 * 6/20 + 5/10 * 8/20 = 136/200 = 17/25 = 0,68
Dá se na to přijít i tak, že spočítáte aritmetický průměr ze všech pravděpodobností běžců, tedy (6*0,9 + 6*0,7 + 8*0,5) / 20.
Příklad 4
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek nevytáhl, když kontrolka hlásí OK? Zapište ve zlomkovém tvaru.
Řešení
<math>\frac{\frac{1}{1000}\cdot \frac{3}{1000}}{\frac{1}{1000}\cdot \frac{3}{1000} + \frac{995}{1000}\cdot \frac{997}{1000}}</math>
Příklad 5
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek vytáhl, když kontrolka hlásí závadu? Zapište ve zlomkovém tvaru.
Řešení
<math> \frac{\frac{5}{1000}\cdot \frac{997}{1000}} {\frac{5}{1000}\cdot \frac{997}{1000} + \frac{999}{1000}\cdot \frac{3}{1000}} = \frac{1}{1000} \cdot \frac{4985}{4985 + 2997} = 0.00062453 = 0,062453% </math>
BAYES
Příklad 1
Na každé 4 studenty (muže) připadá jedna studentka (žena). 75% studentek (žen) má dlouhé vlasy. Z 20ti studentů (mužů) 3 nosí dlouhé vlasy. Sedím na přednášce a přede mnou je student s dlouhými vlasy, jaká je pravděpodobnost, že to není dívka?
Řešení
Klasická úložka na Bayesovu formuli.
D → dlouhé vlasy
M → muž
Z → žena
<math>P(D|M)=\frac{3}{20}</math>
<math>P(D|Z)=\frac{3}{4}</math>
<math>P(M)=\frac{4}{5}</math>
<math>P(Z)=\frac{1}{5}</math>
<math> P(M|D)=\frac{P(D|M)*P(M)}{P(D|M)*P(M)+P(D|Z)*P(Z)}=\frac{\frac{3}{20}*\frac{4}{5}}{\frac{3}{20}*\frac{4}{5}+\frac{3}{4}*\frac{1}{5}}=\frac{4}{9} </math>
Příklad 2
Zadání
V osudí je 24 koulí - 4 černé barvy, 12 červené barvy, 8 bílé barvy. Koule se po tazích nevrací.
oddělení a)
- Jaká je pravděpodobnost, že v 1. tahu vytáhnu černou kouli, když vím, že ve 2. tahu vytáhnu červenou kouli?
- Jaká je pravděpodobnost, že vytáhnu ve 2. tahu černou kouli, aniž bych znal výsledek 1. tahu?
oddělení b)
- Jaká je pravděpodobnost, že vytáhnu ve 2. tahu bílou kouli, aniž bych znal výsledek 1. tahu? = 1/3
- Jaká je pravděpodobnost, že v 1. tahu vytáhnu bilou kouli, když vím, že ve 2. tahu vytáhnu červenou kouli? = 8/23
Řešení
a1 - Klasická úložka na Bayesovu formuli.
Označme si černé koule B, bílé W a červené R.
Bayesova formule má tento vzorec:
<math>P(A_i|B) = \frac{P(B|A_i) * P(A_i)}{\sum_j P(B|A_j) * P(A_j)}</math>
Takže když hledáme <math>P(1B|2R)</math>, jen dosadíme do vzorce:
<math>P(1B|2R) = \frac{P(2R|1B) * P(1B)}{P(2R|1B) * P(1B) + P(2R|1R) * P(1R) + P(2R|1W) * P(1W)}</math>
A jednotlivé pravděpodobnosti zjistíme strašně jednoduše. Koulí je celkem 24, B jsou 4, R 12 a W 8. Takže <math>P(1B) = \frac{4}{24}</math>, <math>P(1R) = \frac{12}{24}</math>, <math>P(1W) = \frac{8}{24}</math>. Dále zřejmě vidíme, že <math>P(2R|1B) = \frac{12}{23}</math>, <math>P(2R|1R) = \frac{11}{23}</math>, <math>P(2R|1W) = \frac{12}{23}</math>. A teď už tedy můžeme dosadit rovnou konkrétní čísla:
<math>P(1B|2R) = \frac{\frac{12}{23} * \frac{4}{24}}{\frac{12}{23} * \frac{4}{24} + \frac{11}{23} * \frac{12}{24} + \frac{12}{23} * \frac{8}{24}} = \frac{4}{23}</math>
a2 Tady si to holt musíme rozpočítat. Pro každou barvu musíme spočítat pravděpodobnost, že ji vytáhneme v prvním tahu, vynásobit pravděpodobností, že v druhém tahu vytáhneme černou za podmínky, že v prvním padla ta předchozí, a to všechno pak sečíst. Takže:
<math>P(2B|1X) = P(1R) * P(2B|1R) + P(1W) * P(2B|1W) + P(1B) * P(2B|1B) = \frac{48}{552} + \frac{32}{552} + \frac{12}{552} = \frac{1}{6}</math>
Příklad 3
Pravděpodobnost že nastane požár je 0.01. Za předpokladu, že je požár stroj nahlásí požár s p = 0.99. Za předpokladu, že není požár stroj nahlásí požár s p = 0.02.
- jaká je pst., že stroj hlásí požár? (tuším)
- jaká je pst., že hoří, když stroj hlásí požár?
Řešení
- <math>P(hlasi | hori) = 0.01 * 0.99 = 0.0099\\</math>
- <math>P(hlasi | nehori) = 0.99 * 0.02 = 2 * 0.0099</math>
- <math>P(hori | hlasi)=\frac{P(hori)*P(hlasi|hori)}{P(hori)*P(hlasi|hori) + P(nehori)*P(hlasi|nehori)}
=\frac{0.01*0.99}{0.01*0.99 + 0.02*0.99}=\frac{1*0.0099}{3*0.0099}=\frac{1}{3}</math>
CLV
Příklad 5
Nákladní výtah má nosnost 1400 kg. Přijel náklad se 64 banánovými krabicemi. Ze zkušeností víme, že váha takovéto krabice má střední hodnotu 21 kg a standardní odchylku 0,7 kg. Určete pravděpodobnost, se kterou po naložení všech krabic nedojde k přetížení výtahu. Použijte CLT!
Řešení
<math>P(\sum Xi < 1400) = P(\frac{\sum Xi - n*\mu}{\sqrt{n} * s } < \frac{1400 - n *\mu}{\sqrt{n} * s }) = P(Z < \frac{1400 - 64*21}{8*0.7}) = \phi(\frac{56}{5.6}) = \phi(10) = 1</math>
Příklad 1
Zasadíme 100 semínek a je pravděpodobnost 0,9, že semínko vyklíčí.
- Spočtěte střední hodnotu a rozptyl počtu semínek, která vyklíčí.
- Když semínka vyklíčí, tak je chceme přesadit do květináčů. Kolik si máme připravit květináčů, abych měl 95% jistotu, že mi budou stačit. (Použijte CLV)
Řešení
1) Jedná se o binomické rozdělení (semínko buď vyklíčí - pravděpodobnost p - nebo nevyklíčí - pravděpodobnost 1 - p).
Tady si člověk prostě musí pamatovat vzorečky pro E(X) a var(X). Bacha, každé rozdělení má tyto vzorečky jiné.
<math>E(X)=n * p=100 * 0,9 = 90</math>
<math>var(X)=n * p * (1-p) = 100 * 0,9 * 0,1 = 9</math>
-
2) Centrální limitní věta říká, že po vhodné normalizaci se rozdělení výběrového průměru blíží k normálnímu rozdělení. Normální rozdělení má parametry <math>\mu, \sigma^2</math>, navíc <math>E(X) = \mu, var(X) = \sigma^2</math>.
Máme tedy normální rozdělení <math>X \overset{\text{approx.}}\sim \text{Norm}(90, 9)</math>
Provedeme transformaci:
<math>P(X < n) = \phi(\frac{n-\mu}{\sigma}) = 0,95</math>
Předchozí řádek zapsán lidsky: Chceme, aby se pravděpodobnost, že počet vyklíčených semínek (náhodná veličina X) bude menší než počet květináčů (n), rovnala 0,95 (<math>\alpha</math>).
V tabulce normálního rozdělení zjistíme, že pro <math>\phi</math> = 0,95 je hodnota 1,65. Můžeme tedy dosadit naše čísla, která jsme dostali jako parametry normálního rozdělení, a víme, že:
<math>\frac{n - 90}{3} = 1,65</math>
Po triviální úpravě pak víme, že
<math>n = 94,95</math>
Závěr: Připravíme si 95 květináčů.
BTW: Pěstování kytek fakt pomáhá na nervy. Vyzkoušeno v tomto semestru.
Příklad 2
Hrajeme hru, při které se hází vyváženou šestistěnnou kostkou a vyhrajeme, když padne pětka nebo šestka.
- Určete střední hodnotu a rozptyl relativní četnosti (tj. podílu) výher v
n
hodech. - Kolikrát musíme hodit, aby na 95 % byla relativní četnost mezi 1/4 a 5/12? Použijte CLV!
Řešení 1
Počet výher = Binomické rozdělení s parametrem p = 1/3.
EX = n*p = n * 1/3
VarX = n*p*(1-p) = n*1/3*2/3 = 2n/9
↑ detailní popis: Víme, že se jedná o binomické rozdělení (buď vyhrajeme, nebo prohrajeme, nic jiného nemůže nastat). Vyhrajeme s pravděpodobností <math>\frac{2}{6} = \frac{1}{3}</math>. Vzoreček na střední hodnotu u binomického rozdělení je <math>EX = n * p</math> a rozptyl <math>var X = n * p * (1 - p)</math>. Tedy:
<math>EX = \frac{n}{3}</math>
<math>var X = \frac{n}{3} * \frac{2}{3} = \frac{2n}{9}</math>
Takže když si hodíme třeba devětkrát, bude střední hodnota 3 a rozptyl 2.
spíš takhle:
Podíl výher v celkovém počtu = X/n. (Zadání chce relativní četnost výher!!!)
E(X/n) = EX/n = n * 1/3 * 1/n = 1/3. (Logicky, podíl výher odpovídá pravděpodobnosti výher)
Var(X/n) = VarX/n^2 = 2n/9 * 1/n*n = 2/9n
Řešení 2
<math>
P(\frac{\frac{3}{12}-\mu}{\sqrt{\sigma^2}} < Z < \frac{\frac{5}{12}-\mu}{\sqrt{\sigma^2}}) > 0.95
P(\frac{-\frac{1}{12}}{\sqrt{\frac{2}{9n}}} < Z < \frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}}) > 0.95
\Phi(\frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}}) = 0.475
\frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}} = 1.96
n=122.9312
</math>
Musíme hodit alespoň 123 krát, abychom dosáhli 95% pravděpodobnosti.
Příklad 3
Házíme vyváženou šestistěnnou kostkou a zaznamenáváme si relativní četnost hozených šestek
- Určete střední hodnotu a rozptyl relativní četnosti (tj. podílu) šestek v
n
hodech. - Kolikrát musíme hodit, aby na 95 % byla relativní četnost mezi 1/12 a 3/12? Použijte CLV!
Řešení 1)
<math>
Ex = x * px = \frac{1}{6}
var X = n \cdot p \cdot (1-p) = \frac{5n}{36}
</math>
Řešení, které bylo uznáno na plný počet bodů:
<math>
EX = \frac{1}{6}
var X = \frac{1}{n} \sum_{i=1}^{n}X_i = \frac{1}{n^2} \cdot n \cdot p \cdot q = \frac{p \cdot q}{n} = \frac{1 \cdot 5}{6 \cdot 6 \cdot n} = \frac{5}{36n}
</math>
Řešení 2)
<math>
P(\frac{\frac{1}{12}-\mu}{\sqrt{\sigma^2}} < Z < \frac{\frac{3}{12}-\mu}{\sqrt{\sigma^2}}) > 0.95
P(\frac{-\frac{1}{12}}{\sqrt{\frac{5}{36n}}} < Z < \frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}})>0.95
\Phi(\frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}}) = 0.475
\frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}} = 1.96
n=76.832
</math>
Musíme hodit alespoň 77 krát, abychom dosáhli 95% pravděpodobnosti.
SDRUZENA a MARGINALNI a EX a F(X)
Příklad 4
Definujte pojem nezávislost, a dokažte že var(X + a*Y) = var(X)+ a²*var(Y)
Reseni
Pokud je <math>Cov(X,Y) = 0</math> jsou X a Y nezávislé náhodné veličiny.
<math> var(X + a*Y) = Cov(X,X) + 2*Cov(X,aY) + Cov(a*Y,a*Y) = Cov(X,X) + 2a*Cov(X,Y) + a^2*Cov(Y,Y)=.. </math>
⇒ pokud jsou X a Y nezavisle, je Cov(X,Y) = 0, tzn nam vypadne ⇒
<math> ..= Cov(X,X) + a^2 *Cov(Y,Y) = var(X)+ a^2 *var(Y) </math>
Příklad 3
Máme definovanou hustotu pravděpodobnosti X, <math>f_{X}(x) = {1\over \sqrt{2\pi}} e^{-\left({x^2\over2}\right )}</math>, x <math>\in</math> R. Jaká je hustota pravděpodobnosti <math>Y = a^2X-2</math>, a>0?
Řešení
Je videt ze je to definice hustotu pro normalni rozdelni a samozrejmne vime <math>\mu = 0</math> a <math>\sigma^2 = 1</math>
- Ted muzeme vypocitat <math>\mu_{Y} = a^2*\mu_{X}-2 = -2</math>
- A muzeme vypocitat <math>\sigma_{Y}^2 = 2) dx = \frac{3}{2} \cdot \int_{-1}^{1} (x^3+(1+p)x^4)) dx = \frac{3}{2} \cdot \left [\frac{x^4}{4}+\frac{(1+p)x^5}{5} \right ]_{-1}^1 =
= \frac{3}{2} \cdot \left [(\frac{1}{4}+\frac{(1+p)}{5}) - (\frac{1}{4}-\frac{(1+p)}{5}) \right ] = \frac{3}{2} \cdot 2 \cdot \frac{(1+p)}{5} = \frac{3 \cdot (1+p)}{5}
</math>
<math>
EX^2 = \int_{-1}^{1} x^2 \cdot (\frac{3}{2}(x^2+(1+p)x^3)) dx = \frac{3}{2} \cdot \int_{-1}^{1} (x^4+(1+p)x^5)) dx = \frac{3}{2} \cdot \left [\frac{x^5}{5}+\frac{(1+p)x^6}{6} \right ]_{-1}^1 =
= \frac{3}{2} \cdot \left [(\frac{1}{5}+\frac{(1+p)}{6}) - (-\frac{1}{5}+\frac{(1+p)}{6}) \right ] = \frac{3}{2} \cdot \frac{2}{5} = \frac{3}{5}
</math>
<math>
m_1 = \frac{3 \cdot (1+p)}{5}
;
m_2 = \frac{3}{5}
m_1 = \frac{3}{5} + \frac{3}{5} \cdot p
m_1 - \frac{3}{5} = \frac{3}{5} \cdot p
p = \frac{5}{3} m_1 - 1
</math>
Příklad 5
f(x)=ax na intervalu (0,1), jinde 0.
Najděte parametr a, distribuční funkci F(x), P(<math>X\in\left(\frac{1}{3};\frac{2}{3}\right)</math>).
Řešení
parametr a
<math>\int_{-\infty}^{\infty} f(x) = \int_{0}^{1} a.x_{dx} = a.\left[\frac{x^2}{2}\right]_0^1 = \frac{a}{2}</math>
<math>\int_{-\infty}^{\infty} f(x) = 1 \Rightarrow \frac{a}{2} = 1 \Rightarrow a = 2</math>
distribuční funkce
<math>\int_{-\infty}^{\infty} f(x) = \int_{0}^{1} 2x = x^2</math> (platí pouze pro (0;1), bylo potřeba napsat jak to vypadá jinde)
Obsah v intervalech
c=1/3, d=2/3 dosadit a vypočítat ?. Ano, buď integrovat f(x) v mezích, nebo dosadit do F(x).
Příklad 1
Máme definovanou sdruženou hustotu pravděpodobnosti, x <math>\in</math> R, y > 0. <math>f_{X,Y}(x, y) = {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}</math>
- Jsou jevy X, Y nezávislé?
- Spočtěte E(Y|X).
Řešení
1. část
Jsou-li náhodné veličiny X, Y nezávislé, pak platí <math>f_{X,Y}(x,y) = f_X(x) f_Y(y)</math>. Najdeme marginální hustoty a ověříme.
Poznámka: <math>\varphi(x)</math> značí hustotu standardního normálního rozdělení.
<math>
\begin{align*}
f_X(x) &= \int_0^\infty f_{X,Y}(x,y) \text{ d}y
&= \int_0^\infty {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}\text{ d}y
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \int_0^\infty e^{-y}\text{ d}y
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \left[ -e^{-y} \right ]_0^\infty
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \left( 0 - (-1) \right )
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}}
\end{align*}
</math>
<math>
\begin{align*}
f_Y(Y) &= \int_{-\infty}^\infty f_{X,Y}(x,y) \text{ d}x
&= \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}\text{ d}x
&= \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-{x^2\over2}} e^{-y}\text{ d}x
&= e^{-y} \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-{x^2\over2}}\text{ d}x
&= e^{-y} \int_{-\infty}^\infty \varphi(x) \text{ d}x
&= e^{-y}
\end{align*}
</math>
<math>
\begin{align*}
f_X(x) f_Y(y) &= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} e^{-y}
&= {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}
&= f_{X,Y}(x,y)
\end{align*}
</math>
X a Y jsou nezávislé.
2. část
<math>
\begin{align*}
f_{Y|X}(y|x) &= {f_{X,Y}(x,y) \over f_X(x)}
&= {f_X(x) f_Y(y) \over f_X(x)}
&= f_Y(y)
\end{align*}
</math>
<math>
\begin{align*}
\mathbf{E}(Y|X = x) &= \int_{0}^\infty y f_{Y|X}(y|x) \text{ d}y
&= \int_{0}^\infty y f_Y(y) \text{ d}y
&= \int_{0}^\infty y e^{-y} \text{ d}y
&= 1
\end{align*}
</math>
HUSTOTA
Příklad 1
Hustota náhodné veličiny X je definována na intervalu (2, 3) jako f(x) = k*x*(x-2), jinak f(x)=0.
- spočtěte konstantu k
- vypočtěte střední hodnotu E(X)
- P(x < E(X))
Řešení
<math>1)\ \ \int_2^3 kx(x-2)\, \mbox{d}x = 1</math>
…
<math>\frac{4}{3}k = 1</math>
<math>k = \frac{3}{4}</math>
<math>2)\ \ EX = \int_{-\infty}^\infty xf(x)\, \mbox{d}x = \int_2^3 kx^2(x-2)\, \mbox{d}x = \frac{3}{4}\int_2^3 x^3-2x^2\, \mbox{d}x = \frac{3}{4}\left[\frac{x^4}{4}-\frac{2x^3}{3}\right]^3_2 = \frac{3}{4}\left(\frac{81}{4}-18-4+\frac{16}{3}\right) = \frac{43}{16} = 2.6875</math>
<math>3)\ \ P(X < E(X)) = \int_{-\infty}^{E(X)} f(x)\, \mbox{d}x = \int_2^{\frac{43}{16}} \frac{3}{4}x(x-2)\, \mbox{d}x = \ldots = \frac{7139}{16384} = ,43572998046875</math>
Příklad 2
Sdružená diskrétní hustota pravděpodobností náhodných veličin X a Y má tvar
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 0.12 | 0.09 | 0.06 | 0.03 |
2 | 0.28 | 0.21 | 0.14 | 0.07 |
- Najděte marginální rozdělení náhodných veličin X a Y.
- Jsou náhodné veličiny X a Y nezávislé?
- Spočtěte kovarianci náhodných veličin X a Y, tj. cov(X,Y).
Řešení
1. Posčítat čísla v řádcích a sloupcích. Tzn.:
P(X = 1) = 0,12 + 0,09 + 0,06 + 0,03 = 0,30
P(X = 2) = 0,28 + 0,21 + 0,14 + 0,07 = 0,70
P(Y = 1) = 0,12 + 0,28 = 0,40
P(Y = 2) = 0,09 + 0,21 = 0,30
P(Y = 3) = 0,06 + 0,14 = 0,20
P(Y = 4) = 0,03 + 0,07 = 0,10
2. Potvrdit, že vynásobení čísel v řádcíh a sloupcích daj dohromady číslo v pruniku = nezávislé
3. Na napocitane marginalni rozdeleni spocitame stredni hodnoty EX, EY a EXY, ktere potrebujeme na cov.
<math>
EX =1\frac{3}{10} + 2 \frac{7}{10} = \frac{17}{10} = 1.7
EY =1\frac{4}{10} + 2 \frac{3}{10} + 3\frac{2}{10} + 4 \frac{1}{10} = \frac{20}{10} = 2
EXY = 1\frac{12}{100} + 2 \frac{9}{100} + 3\frac{6}{100} + 4 \frac{3}{100} + 2\frac{28}{100} + 4 \frac{21}{100} + 6\frac{14}{100} + 8 \frac{7}{100} = \frac{340}{100} = 3.4
cov(X,Y) = EXY - EXEY = 3.4 - 2 \cdot 1.7 = 0
</math>
(bez počítání - jsou nezávislé, takže cov(X, Y)=0)
Příklad 3
Sdružená diskrétní hustota pravděpodobností náhodných veličin X a Y má tvar
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
2 | 0.08 | 0.04 | 0.12 | 0.16 |
4 | 0.12 | 0.06 | 0.18 | 0.24 |
- Najděte marginální rozdělení náhodných veličin X a Y.
- Jsou náhodné veličiny X a Y nezávislé?
- Spočtěte kovarianci náhodných veličin X a Y, tj. cov(X,Y).
Řešení
1. Opět jen posčítat čísla v řádcích a sloupcích:
P(X = 2) = 0,4
P(X = 4) = 0,6
P(Y = 1) = 0,2
P(Y = 2) = 0,1
P(Y = 3) = 0,3
P(Y = 4) = 0,4
2. Pokud pro všechny x,y platí, že P(X=x, Y=y) = P(X=x) · P(Y=y), pak jsou nezávislé. Např. P(X=2, Y=1) = 0,08. P(X=2)·P(Y=1) = 0,4·0,2 = 0,08. Tady to platí u všech ⇒ jsou nezávislé.
3. Pokud jsou nezávislé tak je cov(X,Y)=0
INTERVALY
Příklad 1
Uvažujme náhodný výběr n=36 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako <math>\overline{x}</math>=7.3 a s=2,5 (Hodnotí se správné dosazení do vzorců).
- Najděte intervalový odhad pro střední hodnotu <math>\mu</math> s věrohodností 90%
- Najděte intervalový odhad pro rozptyl <math>\sigma^2</math> s věrohodností 90%
Řešení 1. část
V intervalovém odhadu zjišťujeme interval, ve kterém bude hodnota parametru ležet s určitou pravděpodobností. Zde máme zadanou pravděpodobnost 90%.
Takže máme tedy:
<math> n = 36 </math>
<math> \overline{x} = 7,3 </math>
<math> s = 2,5 </math>
<math> p = 0,9 </math>
z p = 0,9 uděláme <math>\alpha = 1 - 0,9 = 0,1</math>
Nejprve si spočítáme oboustranný interval. K tomu nám poslouží vzoreček, který si pak dále rozebereme:
<math>(\overline{x} - \delta, \overline{x} + \delta)</math>, kde <math>\delta = t_\alpha^n * \frac{s}{\sqrt{n}}</math>. s, n i p máme zadané, takže zde asi žádný problém. Teď jak najít to t s těmi indexy.
<math>t_\alpha^n = T_{\frac{\alpha}{2}}^{n - 1}</math>.
Dosadíme:
<math>T_{0,05}^{35}</math>, a to už najdeme v tabulce t-rozdělení (někdy nazýváno studentovo rozdělení).
Hodnota tam je bohužel jen pro 34 a 36, takže tyto dvě zprůměrujeme. V písemce to samozřejmě nemusí vyjít úplně přesně, když se váš výsledek bude lišit o pár desetinných míst, body by se strhávat neměly. Vyjde nám tedy
<math>T_{0,05}^{35} = 2,724</math> EDIT: Spatne vyctena hodnota z tabulek. Ma byt mezi 1,691 a 1,688 tedy 1,6895.
Teď už krásně dopočítáme i tu deltu:
<math>\delta = 1,6895 * \frac{2,5}{6} = 0,704</math>
A oboustranný interval tak vychází
<math>(6,596; 8,004)</math>
Jednostranný je podobný, jen se malinko liší výpočet T, kde se dolní index nedělí dvěma. Teď už prostý výpočet bez komentáře:
<math>t_p^n = T_{\alpha}^{n - 1} = T_{0,1}^{35} = 2,03</math>
Jeden jednostranný interval:
<math>(-\infty; 9,33)</math>
A druhý:
<math>(5,27; \infty)</math>
Řešení 2. část
Tady je to podobné, jen použijeme jiný vzorec a jinou tabulku.
<math>(\frac{(n - 1) * s^2}{\chi_{1 - \frac{\alpha}{2}}^2 (n - 1)}; \frac{(n - 1) * s^2}{\chi_{\frac{\alpha}{2}}^2 (n - 1)})</math>
Pozn.: Vypadá to jako X, ale je to chí, bacha na to. Ty nožičky to má na každé straně trošku zakroucené.
Takže pro úplnost:
Dosadíme…:
<math>(\frac{218,75}{\chi_{0,95}^2 (35)}; \frac{218,75}{\chi_{0,05}^2 (35)})</math>
Mrkneme se do tabulky chí-kvadrátu a dopočítáme.
Příklad 2
Máme normální rozdělení X s rozptylem 9 (2. zadání: 4).
- V první části se mělo spočítat n tak, aby byl krajní bod od X (s pruhem) vzdálen 0.84. Pravděpodobnost intervalu je 97.5%.
- V druhé, určit pravostranný interval pro X(s pruhem) = 2.
Řešení a
Protože neznáme n(které tedy chceme zjistit), musíme použít z rozdělení. <math> \bar{x} + z \cdot \frac{s}{\sqrt{n}}</math>
Protože víme, že krajní bod je od střední hodnoty vzdálen 0.84, tak už stačí jen řešit rovnici.
<math> z \cdot \frac{s}{\sqrt{n}} = 0.84</math>
<math> \frac{s \cdot 100 \cdot z}{84} = \sqrt{n}</math>
<math> \frac{s \cdot 100 \cdot 1.96}{84} = \sqrt{n}</math>
<math> 7 = \sqrt{n}</math>
<math> n = 49</math>
Řešení b
Víme, že krajní bod intervalu leží 0.84 od střední hodnoty, takže stačí pouze odečíst od střední hodnoty vzdálenost a dostaneme krajní bod intervalu.
<math> \bar{x} - 0.84 = 1.16 </math>
výsledný interval je tedy <math>(1.16, +inf)</math>
??? Neměl by být pravostranný interval spíše od <math>(-inf, \bar{x} - \delta)</math> ??? Viz např. http://www.math.muni.cz/~pokora/vyuka/IS_text.pdf
V tom případě by to bylo <math>(-inf, 1.16)</math>
blbost A když už by jsi chtěl dolní tak bude <math>(-inf, 2,84)</math>
Příklad 3
Uvažujme náhodný výběr <math>n = 16</math> napozorovaných hodnot z normálního rozdělení. Výběrový průměr a součet kvadrátů napozorovaných hodnot jsme spočetli jako <math>\overline{X} = 11</math> a <math>\normalsize\sum\nolimits_{i=0}^{16}x_i^2 = 1952</math>.
V odpovědích níže nemusíte přesně numericky dopočítat krajní body intervalů, ale musíte dosadit správné numerické hodnoty do správných vzorců.
- Najděte oboustranný intervalový odhad pro střední hodnotu
μ
s věrohodností 99 %. - Najděte oboustranný intervalový odhad pro rozptyl
σ²
s věrohodností 99 %.
Řešení
1)
Tady je trochu zrada v tom, že nemáme zadanou směrodatnou odchylku, která je pro výpočet potřeba. Takže si musíme pamatovat další vzorec, který kromě zkoušky z PST uplatníme ještě u státnic.
Směrodatnou odchylku spočítáme <math>s = \sqrt{\frac{1}{n - 1}3)dx + \int_1^2 x\cdot a dx</math>
Vysledek = 1/2 viz mathematica
3. (Spočtěte P(x < 4/3).)
<math>P = \int_0^14)dx + \int_1^{\frac{4}{3}} a dx</math>
Pozn. Pokud vime jak funkce vypada (dokazem to nakreslit), tak si muzeme vybrat jakej obsah pod krivkou budem pocitat (logicky to jednodussi). Takze v tomhle pripade je to urcite P(x < 4/3) = 1 - P(x > 4/3) = 1 - a*(2 - 4/3).
- Výsledek 8/9 zkoušel jsem oba postupy a sedí to.
Skupina B
Řešení
Příklad 3
Skupina A
Sdružená hustota pravděpodobnosti náhodných veličin X a Y má tvar
- <math> f_{X, Y} (x, y)</ = \lambda^{2} e^{-\lambda y}</math> pro <math> 0 \le x \le y \le \infty </math>
- Najděte marginální hustotu X.
- Najděte podmíněnou hustotu Y dáno X.
Řešení
1.
<math> f_x(x)= \int_x^\infty \left(\lambda^{2} e^{-\lambda y}\right)\mbox{d}y = \lambda^{2} \int_x^\infty \left(e^{-\lambda y}\right)\mbox{d}y = \lambda^{2} \left[\frac{e^{-\lambda y}}{(-\lambda y)'}\right]^{\infty}_{x} = \lambda^{2} \left[\frac{e^{-\lambda y}}{-\lambda}\right]^{\infty}_{x} = \lambda^{2} \left(0 + \frac{1}{\lambda e^{\lambda x}}\right) = \lambda e^{-\lambda x}</math>
W.A.: Integrate[lambda^2 * e^(-lambda*y), {y, x, infinity}]
Souhlasím.
2.
<math>f_{y|x}(y,x)=\frac{f_{x,y}(x,y)}{f_{x}(x)} = \frac{\lambda^{2} e^{-\lambda y}}{\lambda e^{-\lambda x}}= \lambda e^{-\lambda y}e^{\lambda x} = \lambda e^{\lambda(x-y)}</math>
Skupina B
<math> \\f(x) = \left\{ \begin{array}{1 1}
a& \quad \mbox{pro 0 \leq x \leq 1}\\ (x-3)*(x-1) + 1 & \quad \mbox{pro 1 \leq x \leq 2}\\ 0& \quad \mbox{jinak}\\ \end{array} \right. \
</math>
- vypočítejte parametr a
- vypočítejte střední hodnotu
- P(x>1/2)
Příklad 4
Skupina A
Výletní loď má kapacitu 40 pasažérů. Hmotnost lidí má střední hodnotu <math>\mu = 80 kg </math>a směrodatnou odchylku <math>\sigma = 20 kg</math>.
- Určete střední hodnotu a rozptyl celkové hmotnosti pasažérů při naplnění kapacity lodi.
- Na jakou hmotnost je potřeba loď zkonstruovat, aby se na 99 % při plném obsazení nepotopila? Použijte CLV!
Řešení
1. Určete střední hodnotu a rozptyl celkové hmotnosti pasažérů při naplnění kapacity lodi.
<math>EX = n\cdot \mu = 40 \cdot 80 = 3 200
varX = n \cdot \sigma^2 = 40 \cdot 20^2 = 16 000 </math>
podle mě by to mělo být spíš takhle:
X - hmotnost jednoho pasažéra
<math>EX = 80 </math>
<math>
sqrt(var X) = 20
var X = 20^2 = 400
</math>
Y - součet hmotností pasažérů
<math>
Y=40X
EY = E(40 X) = 40*EX = 40*80 = 3200</math> (linearita střední hodnoty)
<math> var Y = var(40 Y)=40^2 var X = 1600*400 = 64000</math> (protože var (a X + b) = a^2 var(X))
2. Na jakou hmotnost je potřeba loď zkonstruovat, aby se na 99 % při plném obsazení nepotopila? Použijte CLV!
<math> \frac{n - 3200}{sqrt (16000)} = 2.33 </math> ( 2.33 je z tabulky normalniho rozdeleni pro 0.99)
n = 3495 kg
pokud je rozptyl 64000, tak by to bylo
<math> \frac{n - 3200}{sqrt (64000)} = 2.33 </math> ( 2.33 je z tabulky normalniho rozdeleni pro 0.99)
<math> n = 2.33sqrt(64000) + 3200 = 3789 </math>
Skupina B
- nějaká brutální fce x,y a vypočítejte marginální rozdělení f x (x) a f y|x (x|y)
- myslim ze to bylo ve tvaru <math>\lambda^2 \cdot e^{-\lambda x}</math>, coz je distribucni fce exponencionalniho rozdeleni
- <math>0\le x \le y \le \infty</math>
Řešení
<math>f_{X}(x) = \int_x^\infty (f_{X,Y} (x,y))dy</math>
<math>f_{Y|X} (x|y) = \frac{f_{X,Y} (x,y)}{f_{Y}(y)}</math> Pozn. Za tohle bych ruku do ohne opravdu nedal.
Příklad 5
Skupina A
Uvažujeme náhodnou veličinu X mající normální rozdělení s rozptylem sigma^2 = 6. Chceme odhadnout její střední hodnotu mí s pomocí oboustranného 99% konfidenčního intervalu délky 2,524
- Jak velký náhodný výběr budeme potřebovat?
- Předpokládáme, že náhodným výběrem o velikosti určené v předchozím bodě jste spočetli výběrový průměr X = 1,5. Najděte oboustranný 90% konfidenční interval pro mí.
Řešení
1.
Prosím potvrdit.
<math>k = \frac{1-0,99}{2}</math>
<math>2,254 = 2*Z_{k}\frac{sqrt{6}}{sqrt{n}}</math>
V tabulce normálního rozdělení hledáme hodnotu pro <math>0,5 - k</math> tedy pro <math>0,495 ⇒ Z_k=2,58</math>
… upravíme …
<math>n=31,4=\approx31</math>
alternativa: mě z toho vzorce teda vyšlo n=25 a vyšlo to hodně přesně, takže by to mohlo být správně. Nesplet ses někde v tom výpočtu?
Řešení
2.
Prosím potvrdit. / Souhlasím s výpočtem, jedná se o poměrně častý příklad, objevující se i v předchozích zadáních
<math>\delta=T_{tab}(n-1;\frac{1-p}{2})*\frac{sqrt{s}}{sqrt{n}}</math>
Z předchozího bodu víme, že <math>n=31</math>
<math>\delta=T_{tab}(31-1;\frac{1-0,90}{2})*\frac{sqrt{6}}{sqrt{31}}</math>
<math>T_{tab}=1,697</math>
… upravíme …
<math>\delta=0,747</math>
Výsledný oboustranný interval: <math>(1,5-0,747;1,5+0,747)</math>
Poznámka: proč používat T-rozdělení když víme rozptyl?. IMO by se měla hodnota hledat v N tabulce
Poznámka 2: Souhlasím s předchozí poznámkou. Při použití správného n=25 z prvního podpříkladu a tabulky normálního rozdělení mi vychází <math>(1.5-1.65\frac{\sqrt{6}}{\sqrt{25}}; 1.5+1.65\frac{\sqrt{6}}{\sqrt{25}}) = (0.692; 2.308)</math>
Skupina B
Loď má kapacitu 50 míst, hmotnost cestujících je proměná s odchylkou 20 a středem v 80KG.
- Při plném naplnění urči celkovou hmotnost cestujících a její rozptyl (Nemela se urcit stredni hodnota a rozptyl?)
- Na kolik Kg by měla být loď projektovaná, aby se na 99,95% nepotopila při plném naplnění?
Řešení
- <math>EX = n \cdot x = 50 \cdot 80 = 4000 </math>
<math>var X = n \cdot \sigma^2 = 50 \cdot 400 = 20000</math>, ale tohle se mi zda jako blbost. X~N(80,20) (μ=80, σ² = 20) (← prosím o kontrolu či opravu ↓) (← NEMAJI SE TADY POUZIT HODNOTY SOUCTU,TEDY 4000,20000 ??↓)
P(X < a) = 0.9995
v tabulkách (http://www.ba.metu.edu.tr/~soytas/Business%20Statistics/tabla_normal1.pdf) nalezneme hodnotu pro 0.4995 (0.9995-0,5) → 3.27 až 3.32 → dále počítám s 3.32.
<math> 3.32= \frac{(X - 80)}{ \sqrt{20}}
X = 3.32 * \sqrt{20} + 80
X = 94,85 </math>
A jelikož výsledek má být při plném naplnění (ne jen pro jednu osobu), vynásobíme hmotnost kapacitou lodi, tj. X * 50 = 4742,37Kg.
- Dost dlouho se s tim trapim a uz se citim opravnen to skrtnout.
- <math>\Phi(\frac{m-80 \cdot 50}{20 sqrt{50}}) = 0.9995</math>; v tabulce normalniho rozdeleni hledam souradnice 0.4995 → 3.27; <math>\frac{m-80 \cdot 50}{20 sqrt{50}} = 3.27</math>; <math>m = 4462.44</math>
- Souhlas.
- Mohl by tady prosím někdo vysvětlit proč při počítání <math>Var(x) = n* \sigma^2</math> dosazujete za <math>\sigma^2 = 20^2</math> ? Myslel jsem že <math>\sigma^2 = 20</math>. Děkuji
- Odpoved: Mel sem to tak opraveny v testu. (Spocital sem varX taky na 50*20 = 1000, ale nebylo to spravne…) Ovsem rad bych taky znal nejakou lepsi odpoved.
- Odpověd: Protože je zadaná odchylka hmotnosti cestujícího a ne její rozptyl!
- Moje riešenie (inšpirované tým vyššie…):
- <math>a) Y=50X\\EY=E(50X)=50EX=50\cdot 80=4000\\varY=var(50X)=50^2varX=50^2\cdot 400=1.000.000\\</math>
20 je smerodajná odchýlka!! Teda rozptyl je 20^2
- <math>b) P(\sum_{i=1}^{50}x_i ⇐ n)=0,9995\\P(Z⇐\frac{n-4000}{\sqrt{1.000.000}})=0.9995\\\frac{n-4000}{1000}=3,27\\n=3270+4000=7270</math>
Příklad 6
Skupina A
V aerodynamickém tunelu byl testován nový typ automobilu na aerodynamický odpor. Při rychlosti x_i km/h byla 5 krát měřena odporová síla y_i v Newtonech. Jelikož očekáváme, že závislost odporové síly na rychlosti je kvadratická, vezměme model <math>y_i = \gamma_0 + \gamma_2x_i^2+\epsilon_i</math> , <math> i = 1,…,n</math>
s normálně rozdělenými chybami <math>\epsilon_i</math>.
Data byla zpracována jako:
<math> \sum_{i=1}^{5}x_i = 300</math>
<math> \sum_{i=1}^{5}x_i^2 = 22 000 </math>
<math> \sum_{i=1}^{5}y_i = 650 </math>
<math> s_x^2 = \frac{1}{4} \sum_{i=1}^{5}(x_i - \overline{x})^2 = 1 000</math>
<math> s_{x^2}^2 = \frac{1}{4} \sum_{i=1}^{5}(x_i^2 - \overline{x^2})^2 = 15 000 000</math>
<math> s_y^2 = \frac{1}{4} \sum_{i=1}^{5}(y_i - \overline{y})^2 = 13 000</math>
<math> S_{X,Y} = \frac{1}{4} \sum_{i=1}^{8}(x_i - \overline{x})(y_i - \overline{y}) = 3 500</math>
<math> S_{X^2,Y} = \frac{1}{4} \sum_{i=1}^{8}(x_i^2 - \overline{x^2})(y_i - \overline{y}) = 450 000</math>
Pri testu Blazek napsal na tabuli, ze vsechny sumy v tomto prikladu jsou pro i od 1 do 5, tedy i ty dve vyse.
- Najděte odhady parametrů γ0 a γ2.
- Najděte odhad korelačního koeficientu ρX,Y.
- Odhadněte odporovou sílu při rychlosti 100 km/h.
Řešení
- odhad parametru <math>\gamma_{2}</math>
<math>\gamma_{2} = \frac{S_{X^2,Y}}{s_{X^2}^2} =\frac{450000}{15000000} = 0.03</math>
- odhad parametru <math>\gamma_{0}</math>
<math>\overline{y} = \frac{\sum_{i=1}^{5}y_i}{n} = \frac{650}{5} = 130</math>
<math>\overline{x^2} = \frac{\sum_{i=1}^{5}x_i^2}{n} = \frac{22000}{5} = 4400</math>
<math>\gamma_{0} = \overline{y} - \gamma_{2}*\overline{x^2} = 130 - {0.03 * 4400} = -2</math>
- Najděte odhad korelačního koeficientu ρX,Y.
<math>\rho_{X,Y} = \frac{S_{X^2,Y}}{s^2_{X^2} * s^2_{Y}}</math> Je toto spravne? Nemelo by byt: <math>\rho_{X,Y} = \frac{S_{X,Y}}{s^2_{X} * s^2_{Y}}</math>? Já jsem spíše pro <math>\rho_{X,Y} = \frac{S_{X,Y}}{s_{X} * s_{Y}}</math>.
- Odhadněte odporovou sílu při rychlosti 100 km/h.
<math>x = 100</math>
<math>y = \gamma_{0} + \gamma_{2}*x^2</math>
Skupina B
Řešení
Příklad 7
Skupina A
Bezpečnostní senzor pravidelně monitoruje počítačovou učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X = W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem sigma^2 = 1,63. V případě pohybu zařízení vrací signál X = W + theta, kde theta >0 je neznámá konstanta. Na základě n = 49 nezávislých pozorování jsme spočetli konfidenční intervaly pro mí = EX takto:
90% interval A: (0,0569; 0,6033) 95% interval B: (0,0026; 0,6576)
- Otestujte hypotézu H0: mí = 0 proti alternativě Ha: mí > 0 pomocí těchto intervalů, tak aby pravděpodobnost chyby prvního druhu (tedy chybné zamítnutí H0) byla 5%. Popište přesně jak a proč jste se rozhodli.
- Použili jste intervalu A nebo B. Proč?
Řešení
Skupina B
Hypotézy, vyvrátit/potvrdit
*nevím skupinu, ani přesná čísla, ale bylo to zhruba takto: (Variace na 7.př z 21.5.2012)
H0: μ=0 , Ha: μ>0 K tomu jsou zadané dva intervaly A(-0,123; 2,123)(90%) a B(-3,123; 5,123)(95%)
a) otestujte hypotezu + zdůvodnit, chyba prvního druhu má být max 5%
μ=0 leží v obou intervalech, takže H0 nelze zamítnout.
b) Který z intervalů jste použili a proč
Ha: μ>0 … takže se to testuje jen jednostranně, pro chybu max 5% lze použít oba intervaly. To bych moc neřekl že se dají využít oba intervaly .. dá se využít jen ten A
Příklad 1
Skupina A
Na třech výrobních linkách jsou vyráběny výrobky. První linka zajišťuje 50% produkce a ppst. vzrobení vadného výrobku je 1%, druhá linka zajišťuje 30% produkce a ppst vyrobení vadného výrobku je 2% a třetí linka zajišťuje 20% produkce a ppst vyrobení vadného výrobku je 3,5%. Určete ppst., že náhodně vybraný vadný výrobek pochází z 2. linky.
Řešení
<math>P(1L)=\frac{5}{10}</math>
<math>P(2L)=\frac{3}{10}</math>
<math>P(3L)=\frac{2}{10}</math>
<math>P(V|1L)=\frac{1}{100}</math>
<math>P(V|2L)=\frac{2}{100}</math>
<math>P(V|3L)=\frac{35}{1000}</math>
<math>P(2L|V)=\frac{P(2L)P(V|2L)}{P(1L)P(V|1L)+P(2L)P(V|2L)+P(3L)P(V|3L)}</math>
<math>P(2L|V)=\frac{\frac{3}{10}.\frac{2}{100}}{\frac{5}{10}.\frac{1}{100}+\frac{3}{10}.\frac{2}{100}+\frac{2}{10}.\frac{35}{1000}} = \frac{6}{18} = \frac{1}{3}</math>
Příklad 2
Skupina A
Nechť náhodné veličiny X,Y jsou výsledky dvou nezávislých hodů vyváženou čtyřstěnnou hrací kostkou.
- Popište rozdělení náhodné veličiny Z = min(X,Y).
- Spočítejte střední hodnotu Z.
- Jsou X a Z nezávislé? Vysvětlete proč.
Řešení
info: jestli je tohle (1.+2.) řešení ne/správné zjistím zítra a případně ho smažu. Pokud už ale někdo ví teď, že je blbe, nechť prosím zasáhne, ať to nemate ostatní. Díky.
Počet možností jak hodit dvěma kostkama je 4*4, viz nasledující tabulka. Ve vnitřku tabulky je napsané Z, tj. minimum z toho hodu. Vim, dost primitivní tabulka, ale je to snad názorné.
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 1 | 1 | 1 | 1 |
2 | 1 | 2 | 2 | 2 |
3 | 1 | 2 | 3 | 3 |
4 | 1 | 2 | 3 | 4 |
- <math>P(Z==1)=\frac{7}{16}</math>
<math>P(Z==2)=\frac{5}{16}</math>
<math>P(Z==3)=\frac{3}{16}</math>
<math>P(Z==4)=\frac{1}{16} </math> - <math>E(Z)=1*\frac{7}{16} + 2*\frac{5}{16} + 3*\frac{3}{16} + 4*\frac{1}{16}=\frac{30}{16}=\frac{15}{8}=1+\frac{7}{8}</math>
- že by to bylo takhle?:
P(X,Y) =?= P(X) * P(Y)
P(X = 1, Y = 1) = 1/16
P(X = 1) = 4/16 = 1/4
P(Y = 1) = 4/16 = 1/4
1/16 == 1/4 * 1/4
P(X = 2, Y = 1) = 1/16
P(X = 2) = 4/16 = 1/4
P(Y = 1) = 4/16 = 1/4
1/16 == 1/4 * 1/4
P(X = 3, Y = 1) = 1/16
P(X = 3) = 4/16 = …
… a takhle porovnat pro všechny možné kombinace
if P(X,Y) == P(X)*P(Y) pro všechny kombinace, then Nezávislé
tak oprava: to, co jsem napsal tady u bodu 3. sice obecně platí, ale v zadání se ptáme jestli jsou X a Z nezávislé. (Z = min(X,Y) - tedy minimum z těch dvou hodů)
Tedy zjišťujeme:
P(X,Z) =?= P(X) * P(Z) ⇒ vyjde, že X a Z nejsou nezávislé VJ's neověřený postup jak spočítat P(X,Z): např. P(X=3,Z=1) ⇔ hledáme, kdy X je pořád rovno 3, a přitom výsledek Z=min(3,Y)=1. Tenhle jev nastává jenom když Y=1, a to může nastat když X=3 jenom jednou. Takže P(X=3,Z=1)=1/16. prosím potvrdit
Příklad 3
Skupina A
Nechť X a Y jsou stejně rozdělené nezávislé náhodné veličiny s geometrickým rozdělením s parametrem p∈(0,1)
- Najděte rozdělení min{X,Y}. O jaké rozdělení se jedná (jaký má název)?
- Spočtěte pravděpodobnost P(X>Y).
Řešení
https://www.facebook.com/groups/141862482499684/permalink/446990938653502
- <math>P(X>k) * P(Y>k) = \left[1-\left(2p-p^2\right)\right]^2 \rightarrow Geom(2p - p^2)</math>
- <math>P(X>Y) = \frac{(1-p)}{(2-p)}</math>
Příklad 4
Skupina A
Automat generuje číslice 0 až 9, každou se stejnou pravděpodobností.
- Spočtěte střední hodnotu a rozptyl počtu sudých čísel mezi n generovanými hodnotami (nulu považujeme za sudé číslo).
- Kolik čísel musíme generovat, aby se mezi nimi s pravděpodobností 0.975 nacházela alespoň dvě sudá? Použijte CLV!
Řešení
Jedná se o binomické rozdělení.
1.)
Střední hodnota pro binomické rozdělení:
<math>EX = n*p = n * \frac{1}{2} = \frac{n}{2}</math>
Rozptyl pro binomické rozdělení:
<math>varX = n*p*(1-p) = n * \frac{1}{2} * \frac{1}{2} = \frac{n}{4}</math>
2.)
Prosím potvrdit.
Vycházel jsem z pst_zkouška_2012-05-21#řešení2.
<math>\alpha = 0,975-0,5 = 0,475</math>
<math>x = 2</math> “Počet sudých čísel”
<math>P(X>n)=1-P(X<n)=1-\frac{x-E(X)}{sqrt{var(X)}}=\alpha</math>
<math>1-\left(\frac{2-\frac{n}{2}}{sqrt{\frac{n}{4}}}\right)=T_{normal}(0,475)</math>
<math>1-\left(\frac{2-\frac{n}{2}}{sqrt{\frac{n}{4}}}\right)=1,96</math> Wolfram
<math>n = 6,43 =\approx 7</math>
Příklad 5
Skupina A
Uvažujeme náhodný výběr n = 25 napozorovaných hodnot z normálního rozdělení. Součet napozorovaných hodnot a součet kvadrátů hodnot jsme sopočetli jako <math> \sum_{i=1}^{n}x_i = 250 </math> a <math> \sum_{i=1}^{n}x^2_i = 2509</math> .
- Najděte oboustranný intervalový odhad pro střední hodnotu μ s věrohodností 95%.
- Najděte oboustranný intervalový odhad pro rozptyl σ^2 s věrohodností 95%.
Řešení
1.
<math>\overline{X}=\frac{250}{25}=10</math>
<math>n=25</math>
Nevíme směrodatnou odchylku, tu zjistíme stejně jako zde.
<math>s = \sqrt{\frac{1}{n - 1}5) </math>
<math> -P(X >= x) = - \phi(2)</math>
<math> P(X >= x) = \phi(2) </math>
<math> P(X >= x) = 0.5 + 0.4772 </math>
Příklad 6
Rodina má tři malé chlapce, jejichž věk je postupně 3, 21 a 63 měsíců a kteří měří (<math> y_i </math>) 67, 82 a 121 cm. Předpokládejme, že závislost výšky na věku by byla lineární a vezměme model <math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math>, <math> i = 1…n </math> s normálně rozdělenými chybami <math>\epsilon_i</math>. Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>. Z výše uvedených dat jsme získali:
<math> \overline{x} = 30 </math>
<math> \sum_{i=1}^{3}x^2_i = 4446 </math>
<math> \overline{y} = 90 </math>
<math> \sum_{i=1}^{3}y^2_i = 25854 </math>
<math> \sum_{i=1}^{3}x_i y_i = 9747 </math>
(Zadání bylo úplně stejné jako 12.6. - možná tam byla trochu jiná čísla, ale jinak to samé)
Řešení
pst_zkouška_2012-06-12 - příklad 6
Příklad 7
Testování hypotézy
Z n=25 hodnot náhodného výběru z normálního rozdělení jsme spočetli průměr <math> \overline{x} = 2.08 </math> a směrodatnou odchylku <math>s_x = 0,5</math>. Otestujte hypotézu <math>H_0 </math> : μ = 2 versus <math>H_A </math> : μ > 2 tak, aby pravděpodobnost chybného zamítnutí <math>H_0 </math> byla 5%. Vysvětlete detailně své rozhodnoutí.
Řešení
<WRAP left alert 90%> Původní chybné řešení:
<math>p=90%</math> (Na každé straně potřebujeme 5% - budeme totiž hledat oboustranný interval)
<math>\alpha=\frac{1-p}{2}=\frac{1-0,90}{2}=0,05</math>
<math>\delta=T_{\alpha}^{n-1}*\left(\frac{s}{\sqrt{n}}\right)=T_{0,05}^{24}*\left(\frac{0,5}{5}\right)</math>
Hodnotu T nalezneme v T-Table.
<math>\delta=1,711*0,1=0,1711</math>
<math>\mu=(\overline{x}-\delta; \overline{x}+\delta)=(2,08-0,1711; 2,08+0,1711)=\approx(1,909; 2,251)</math>
Testujeme hypotézu <math>H_0: \mu=2</math>. Leží číslo 2 ve vypočítaném intervalu? ANO, tuto hypotézu tedy nemůžeme zamítnout. </WRAP> <WRAP left download 90%> Oprava:
Měl by se použít jednostranný interval <math>\mu=(\overline{x} -T_{0,05}^{24}*\left(\frac{0,5}{5}\right),+\infty) </math>, což dává <math>(1.9089,+\infty)</math>.
-edit: potvrzuji, že je to správně
Testujeme hypotézu <math>H_0: \mu=2</math>. Leží číslo 2 ve vypočítaném intervalu? ANO, tuto hypotézu tedy nemůžeme zamítnout.
</WRAP>
Poznámka: Nemělo by se počítat s <math>p=95%</math>, když má být 5% pravděpodobnost chybného zamítnutí hypotézy? Odpověď: Jak je výše správně dosazeno - má se použít p=95%, tedy do t Studentova rozdělení dávám hodnotu (1-p), tedy 0,05. Protože hledám (1-p)konfidenční interval.
Příklad 7 - B
Testování hypotézy
Z n=25 hodnot náhodného výběru z normálního rozdělení jsme spočetli průměr <math> \overline{x} = 1,94 </math> a směrodatnou odchylku <math>s_x = 0,5</math>. Otestujte hypotézu <math>H_0 </math> : μ = 2 versus <math>H_A </math> : μ < 2 tak, aby pravděpodobnost chybného zamítnutí <math>H_0 </math> byla 10%. Vysvětlete detailně své rozhodnoutí.
Řešení
jednostranný interval <math>\mu=(-\infty,\overline{x} +T_{0,1}^{24}*\left(\frac{0,5}{5}\right)) </math>, což dává <math>(-\infty,2,0718)</math>
2 leží v intevalu ⇒ h0 NEZAMÍTÁM
PST - zkouška 20. 5. 2011
Kalkulačky se používat nesmí, 90 minut, tabulky u testu.
1. úloha
Házíme čtyřstěnnou kostkou (1 - 4 tečky). Házíme 2x. Pokud je součet teček větší než 4, již neházíme. Pokud ne, máme jěště jeden hod. Jaká je pravděpodobnost, že součet je alespoň 6?
řešení
pravděpodobnost toho, že nám padne alespoň součet 6 ve dvou hodech + pravděpodobnost, že nám padne součet 6, když předtím házíme součty pod 4 = 38/64 = 19/32
pravděpodobnost že hodíme více jak šest v prvních dvou hodech +
pravděpodobnost že hodíme 2 a v třetím 4 +
pravděpodobnost že hodíme 3 a v třetím 3 || 4 +
pravděpodobnost že hodíme 4 a v třetím 2 || 3 || 4
2. úloha
X je náhodná veličina s husotou f(x) = 1 - Cx na intervalu [0,2]
- Určete C
- P(X <math>\in</math> I), kde I=[a,b] podmnzina [0,2] ?
- <math>P6) = 0</math>
<math>Cov(Y,Z) = 0 - E(Y)E(Z) = -2</math>
4. úloha
S100 je počet hodů panen ve 100 hodech. Máme vyváženou minci, použijte centrální limitní větu. Vypočítejte pravděpodobnosti:
- P(S100 <math>⇐</math> 45)
- P(45 < S100 < 55)
řešení
1.způsob
Binomické rozdělení - Bernoulliho schéma
N(EX,VARX)
EX=n*p
VARX=n*p*(1-p)
<math>P(x⇐A)=\Phi (\frac{A - EX}{\sqrt{VARX}})</math>
N(100*<math>\frac{1}{2}</math>,100*<math>\frac{1}{4})</math>
A=45
<math>P(x⇐45)=\Phi (\frac{45 - 50}{\sqrt{25}})=\Phi (-1)=0.5-\Phi (1)</math>
což se rovná 0,1587 → 16%
2.způsob
Moivreova-Laplaceova věta
<math>Zn= (\frac{Sn - n*\mu}{\sigma*\sqrt{n}})</math>
Sn=45
n=100
<math>\mu=\frac{1}{2}</math>
<math>\sigma^2=\frac{1}{4}</math>
ručně nedopočitatelný způsob
- prosím o ověření
SUM (1⇐i⇐45) (100 nad i) * <math>0.5^i</math> * <math>0.5^{100-i}</math> = 18 %
Jedná se o symetrické rozdělení se střední hodnotou 50. V předchozím případě jsme spočítali, že méně než 45 hodů je pouhých 16%, což je ale to samé jako na druhé straně, tedy více jak 55 hodů. Takže dohromady máme na tento interval 68%. Ověřeno i předchozím postupem.
5. úloha
Uvažujme náhodný výběr n=16 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako <math>\overline{x}</math>=10.3 a s=1,2 (Hodnotí se správné dosazení do vzorců).
- Najděte intervalový odhad pro střední hodnotu <math>\mu</math> s věrohodností 99%
- Najděte intervalový odhad pro rozptyl <math>\sigma^2</math> s věrohodností 99%
řešení
Studentovo rozdělení
1.
<math>\overline{x} \pm T_{(\frac{\alpha}{2},n-1)} . \frac{s}{\sqrt{n}}</math>
<math>\alpha = 1-0.99 = 0.01</math>
hledáme: <math>T_{(0.005,15)}=2.947</math>
<math>10.3 \pm 2.947 . \frac{1.2}{4} = 10.3 \pm 0.8841</math>
2.
<math>\frac{(n-1).s^2}{\chi_{(\frac{\alpha}{2},n-1)}^2} \le \sigma^2 \le \frac{(n-1).s^2}{\chi_{(1-\frac{\alpha}{2},n-1)}^2}</math>
<math>\frac{(15).1,44}{\chi_{(0.005,15)}^2} \le \sigma^2 \le \frac{(15).1,44}{\chi_{(1-0,005,15)}^2}</math>
<math>\frac{(15).1,44}{32,8} \le \sigma^2 \le \frac{(15).1,44}{4,6}</math>
<math>0.658 \le \sigma^2 \le 4.695</math>
6. úloha
Uvažujme lineární model
<math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math> pro i=1,…,n
s normálně rozdělenými chybami <math>\epsilon_i</math>. Pro n=100 napozorovaných párů hodnot (<math>x_i</math>,<math>y_i</math>) jsme spočetli:
<math> \overline{x}=10 \Rightarrow (s_x)^2=\frac{1}{99} \sum_{n=1}^{100} (x_i-\overline{x})^2=1.2 </math>
<math>\overline{y}=158.3 \Rightarrow (s_y)=\frac{1}{99} \sum_{n=1}^{100} (y_i-\overline{y})=19.6 </math>
<math>S_{x,y}=\frac{1}{99} \sum_{n=1}^{100} (x_i-\overline{x})(y_i-\overline{y})=19.4</math>
Najděte správné odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>.
řešení
<math>\beta_1 = \frac{S_{x,y}}{(S_x)^2} = 16,1666</math>
<math>\beta_0 = \overline{y} - \beta_1 \overline{x} = -3,36</math>
7. úloha
Bezpečnostní senzor pravidelně monitoruje PC učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X=W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem <math>\sigma^2</math> 2,3. V případě pohybu zařízení vrací signál X=W+O, kde O>0 je neznámá konstanta. Na základě n=35 nezávislých pozorování jsme spočetli konfidenční intervaly pro <math>\mu</math>=35:
90% interval A (0,405456;5,394544)
95% interval B (-0,07243255;587243255)
Rada: jednostranná altervativa
- Otestujete <math>H_0:\mu=0</math> vs. <math>H_1:\mu>0</math> tak, aby pravd. chyby prvního druhu (chybné zamítnutí <math>H_0</math>) byla 5%. Jak jste se rozhodli a proč.
- Použili jste interval A nebo B a proč.
řešení
2. interval A: alfa=0.05 100%-90%=10% /2 → 5%
řešení by Ondra Chochola :)
v zadani bylo, ze to jsou konfidencni inervaly pro u (<math>\mu</math>, str. hodnotu).
Protoze je to jednostranny test, je potreba dostat 95% JEDNOSTRANNY int.
spolehlivost. (ze zadano vyplyva, ze na kazdou stranu intervalu A je 5%,
tj. kdyz vezmu interval (0,405456;infinity) tak mam 95% spolehlivost.
Protoze tam 0 nespadne, tak zamitam <math>H_0</math> (s max chybou 5%).
Odpovida to na 1) i 2)
Zdravi Ondra
pozn.: díííííííííky! Nikdo jsme si s tím nevěděl rady!
zkoušky předměty škola s_řešením
PST - Zkouška 26. 5. 2011 12:30
1. úloha
Házíme 2x vyváženou (férovou) čtyřstrannou kostkou. Je-li Xi výsledek i-tého hodu, i = 1,2, určete Podmíněnou pravděpodobnost P(max(x1, x2) = m | min(x1, x2) = n) pro všechna m,n = {1,2,3,4}
Řešení
n \ m | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 1/7 | 2/7 | 2/7 | 2/7 |
2 | 0 | 1/5 | 2/5 | 2/5 |
3 | 0 | 0 | 1/3 | 2/3 |
4 | 0 | 0 | 0 | 1 |
Vycházíme z tabulky všech možných výsledků pro dva hody.
Např. pro podmínku <math>min(x1, x2) = 2</math> bereme jako množinu všech výsledků jen <math>\{22, 23, 24, 32, 42\}</math>.
11 | 12 | 13 | 14 |
21 | 22 | 23 | 24 |
31 | 32 | 33 | 34 |
41 | 42 | 43 | 44 |
<math>
P(max(x1, x2) = 1 | min(x1, x2) = 2) = 0
P(max(x1, x2) = 2 | min(x1, x2) = 2) = 1/5
P(max(x1, x2) = 3 | min(x1, x2) = 2) = 2/5
P(max(x1, x2) = 4 | min(x1, x2) = 2) = 2/5
</math>
A takto je to správně. Pokud dosadíme do definice podmíněné pravděpodobnosti, tak např.
<math>
P(max(3, 2) | min(3, 2)) = \frac{P(max(3, 2) \cap min(3, 2))}{min(3, 2)}
\frac{\frac{2}{16}}{\frac{5}{16}} = \frac {2}{5}
</math>
2. úloha
Posluchači mají tendenci vynechávat cvičení při hezkém počasí: každý student přijde (nezávisle na ostatních) s prvděpodobností Ph při hezkém počásí a Ps při škaredém počasí. Učitel je rozhodnut, že cvičení zruší, pokud přijde méně než k z n zapsaných studentů
- Napište formulku určující pravděpodobnost, že cvičení se bude konat za podmínky že je hezké počasí
- Napište formulku určující pravděpodobnost, že cvičení se bude konat za podmínky že je ošklivé počasí
- V daný den bude hezky s pravděpodobností 1/3 a škaredě s pravděpodoností 2/3. Napište formulku určující pravděpodobnost, že cvičení se bude konat.
Řešení
Binomická náhodná veličina
<math>
P(A) = \sum_{k \leq i \leq n} {n \choose i} (p_h)^i(1-p_h)^{n-i}
P(B) = \sum_{k \leq i \leq n} {n \choose i} (p_s)^i (1-p_s)^{n-i}
P(C) = \frac{1}{3}*P(A) + \frac{2}{3}*P(B)
</math>
Postup
P že se cvičení bude konat je P že příjde k nebo více studentů. P že příjde k určitých studentů a zbytek nepřijde <math> p_h^k(1-p_h)^{n-k} </math> ale nam je jedno kterých studentů tudíž musime započítat každou jejich kombinaci <math> {n \choose k} p_h^k(1-p_h)^{n-k} </math> nyní máme pravděpodobnost že přijde přesně k nějakých studentů. Teď tento vzorec použijeme na všechny vyhovující počty studntů tj od k včetně do n včetně a máme výsledek.
5. úloha
Náhodná veličina Y má normální rozdělení s rozptylem o^2 = 1.96^-2. Potřebujeme odhadnout její střední hodnotu pomocí 95% konfidenčního intervalu šířky 0.01. Jak veliký výběr budeme potřebovat?
Řešení
Možný postup, asi ale nejde pořádně dopočítat.
<math>
\bar{x} \pm t_{\frac{\alpha}{2},n-1}\frac{s}{\sqrt{n}}
2t_{0.025,n-1}\frac{1.96^{-1}}{\sqrt{n}} = 0.01
t_{0.025,n-1}\frac{1.96^{-1}}{\sqrt{n}} = 0.005
n = (t_{0.025,n-1}\frac{1.96^{-1}}{0.005})^2
</math>
Jiné řešení:
Jelikož je zadaný rozptyl, používá se normální rozdělení a ne studentovo rozdělení a to <math>z_{\alpha/2}</math>, což si dohledám v tabulce jako 0,475 což je 1,96.
<math>
\bar{x} \pm z_{\frac{\alpha}{2}}\frac{s}{\sqrt{n}}
2z_{0.025}\frac{1.96^{-1}}{\sqrt{n}} = 0.01
z_{0.025}\frac{1.96^{-1}}{\sqrt{n}} = 0.005
1,96*\frac{1.96^{-1}}{\sqrt{n}} = 0.005
\frac{1.96}{1,96 * \sqrt{n}} = 5/1000
\frac{1}{\sqrt{n}} = 5/1000
\sqrt{n} = 200
n = 40 000
</math>
6. úloha
Vodárenská společnost potřebuje odhadnout vztah mezi teplotou během letních dnů a denní spotřebou vody na osobu. Pro den i označme teplotu a spotřebu vody jako (<math>x_i, y_i</math>) v daném pořadí. Uvažujeme lineární model
<math> y_i = \beta_0 + \beta_1 + \eps_i, i = 1 …, n </math>
s normálně rozdělenými chybami <math>\eps</math>. Společnost měřila teploty a spotřebu během 49 dní a spočetla
<math> \overline{x} = 20 </math> <math> s_x = \sqrt{\frac{1}{48} \sum_{i=1}^{49} (x_i - \overline{x})^2} = 4 </math>
<math> \overline{y} = 280 </math> <math> s_y = \sqrt{\frac{1}{48} \sum_{i=1}^{49} (y_i - \overline{y})^2} = 20 </math>
<math> S_{X,Y} = \frac{1}{48} \sum_{i=1}^{49} (x_i - \overline{x})(y_i - \overline{y}) = 12 </math>
Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>.
Řešení
<math> \beta_1 = \frac{S_{X,Y}}{s_x^2} = \frac{12}{16} = 3/4 </math>
<math> \beta_0 = \overline{y} - \beta_1\overline{x} = 280 - \frac{3}{4}20 = 265 </math>
Téměř stejné jako u předchozí zkoušky, najít B0 a B1
Řešení podle vzorečků z přednášky 12, slide 5.
7. úloha
Téměř stejné jako u předchozí zkoušky - zdůvodnit výběr intervalu, otestovat hypotézu.
škola zkoušky předměty
PST - Zkouška 26. 5. 2011, 14:30
Pokud vím, tak byla jen jedna skupina, na písemku bylo 90 minut. Nesměly se používat kalkulačky ani jiné pomůcky (kromě statistických tabulek, které byly před zkouškou rozdány).
1. úloha
15%
Ve tride je 16 studentu; 12 chlapcu a 4 divky
Jaka je pravdepodobnost, ze pri nahodnem rozdeleni na 4 skupiny po ctyrech bude v kazde skupine jedna divka?
Napoveda: pouzijte multiplikativni zakon
Řešení
<math>\frac{576}{5915} = 0,097379544 = 10%</math> (?)
Postup
<math> \frac{ {12\choose{3}} {4\choose{1}} }{ {16\choose{4}} }. \frac{ {9\choose{3}} {3\choose{1}} }{ {12\choose{4}} }. \frac{ {6\choose{3}} {2\choose{1}} }{ {8\choose{4}} }. \frac{ {3\choose{3}} {1\choose{1}} }{ {4\choose{4}} } = 0,140659341 = 14% </math> (?)
dá se interpretovat jako součin pravděpodobností u každé skupiny
Nezapomínejte zdůvodnit postup - Nejdřív si vezmu první čtveřici, a podělím možnosti jak vybrat ze 4 holek právě jednu a ze 12ti kluků právě 3 počtem možností, jak ze 16 lidí vybrat 4. No a stejně pokračuji dalšími čtveřicemi, ale vybírám jen z možností co zbývají - kluků je jen 9 (tři už jsou v první čtveřici…) atd.
Další možností je hrubá síla:
- celkem kombinací: 16!
- kombinace chlapů: 12!
- kombinace dívek mezi sebou(v prvni, druhe, treti nebo ctvrte ctverici): 4!
- pozice dívek v rámci čtveřice(prvni, druha, treti nebo ctvrta): 4^4
<math>\frac{12! \cdot 4! \cdot 4^4}{16!} = 0,140659341 = 14%</math>
2. úloha
Budova je vybavena automatickym pozarnim systemem, ktery provadi detekci pozaru jednou za vterinu. Pri pozaru spusti poplach s pravdepodobnosti 0,95. Pokud pozar nenastal spusti falesny poplach s pravdepodobnosti 0,01. Pravdepodobnost pozaru je 0,02.
- spoctete pravdepodobnost poplachu
- jaka je podminena pravdepodobnost pozaru za predpokladu, ze hlasic spustil poplach?
Řešení
- <math>\frac{18}{625} = 0,0288 = 3%</math>
- <math>\frac{95}{144} = 0,659722222 = 66%</math>
Postup
Dekompozice na pravděpodobnosti od 4 nezávislých jevů:
- P(požár, poplach) = 0.02 * 0.95
- P(ne požár, poplach) = 0.98 * 0.01
- P(požár, ne poplach)
- P(ne požár, ne poplach)
Napřed se ptají, jaká je pravděpodobnost poplachu. Je to jednoduše součet pravděpodobností, kde figuruje poplach:
- <math>P(pozar,poplach) + P(nepozar,poplach) = 0,0288 = 3%</math>
Normovat nemusíme, součet všech 4 pravděpodobností by ve jmenovateli dával 1.
Potom, jaká je pravděpodobnost požáru při poplachu:
- <math>\frac{P(pozar,poplach)}{P(pozar,poplach) + P(nepozar,poplach)} = \frac{0,019}{0,019 + 0,0098} = 0,659722222 = 66%</math>
Tady už musíme normovat součtem pravděpodobností, ve kterých figuruje poplach.
edit: přeloženo do lidštiny: Bayesova věta
Čistý Bayes:
- * <math>\frac{P(poplach | pozar) * P(pozar)}{P(poplach | pozar) * P(pozar) + P(poplach | nepozar) * P(nepozar)} = 0,6597 = 66%</math>
3. úloha
Studenti mají tendence vynechávat cvičení při hezkém počasí. Každý student přijde (nezávisle na ostatních) s pravděpodobností <math>p_s</math> při škaredém počasí a <math>p_h</math> když je hezky. Cvičení je zrušeno pokud přijde méně než <math>k</math> z <math>n</math> zapsaných.
- Napište formulku pro pravděpodobnost, že se cvičení bude konat za škaredého počasí.
- Napište formulku pro pravděpodobnost, že se cvičení bude konat za hezkého počasí.
- Hezky bude s pravděpodobností 0,6, škaredě s pravděpodobností 0,4. Napište formulku, že se cvičení bude konat.
Řešení
- <math>1 - \sum_{i=0}^{k-1} {n \choose i} {p_s}^i (1-p_s)^{n-i}</math>
- <math>1 - \sum_{i=0}^{k-1} {n \choose i} {p_h}^i (1-p_h)^{n-i}</math>
- <math>0,4 (1 - \sum_{i=0}^{k-1} {n \choose i} {p_s}^i (1-p_s)^{n-i}) + 0,6 (1 - \sum_{i=0}^{k-1} {n \choose i} {p_h}^i (1-p_h)^{n-i})</math>
Postup
Prostě zapamatovat si tyhle vzorečky od Burdy…
… a nebo je jako správný MatFyzák odvodit během písemky. (Jak na odvození? viz test 26. 5. 2011 12:30 - 3.úloha)
U třetí části stačí jen psát P(a) a P(b) a správně je násobit.
5. úloha
Náhodná veličina <math>Y</math> má normální rozdělení s rozptylem <math>\sigma^2 = 3,92^{-2}</math>. Potřebujeme odhadnout její střední hodnotu pomocí 95% konfidenčního intervalu šířky 0,02. Jak velký náhodný výběr budeme potřebovat?
Řešení
2500
6. úloha
Vodárny chtějí odhad vztahu mezi denní teplotou během léta a spotřebou vody na osobu. Naměřené hodnoty ve tvaru <math>(x_i, y_i)</math> znamenají teplotu a spotřebu pro den <math>i</math>. Máme lineární model <math>y_i = \beta_0 + \beta_1 x_i + \epsilon_i</math> pro <math>i=1..n</math>. Určete odhady <math>\beta_0</math> a <math>\beta_1</math> když znáte:
<math>\overline{x}=21</math>
<math>\overline{y}=245</math>
<math>s_X = 3</math>
<math>s_Y = 25</math>
<math>S_{X,Y} = 12</math>
Řešení
<math>b_0 = 217</math>, <math>b_1 = \frac{4}{3}</math>
7. úloha
Před bouřkou se obvykle zvýší rozptyl naměřených hodnot síly větru. Pokud se blíží bouřka, rozptyl měření překročí 2,65 m/s. Na základě n=200 nezávislých měření jsme spočetli následující konfidenční intervaly pro <math>\sigma^2 = Var X</math>: 99% interval A:(2.64, 4,43); 98% interval B:(2.7, 4.31)
a) Blíží se bouřka? Otestujte hypotézu <math>H_0:\sigma^2 ⇐ 2.65</math> versus alternativa <math>H_A:\sigma^2 > 2.65</math> (tj. blíží se bouřka) pomocí těchto intervalů, tak aby pravděpodobnost chyby prvního druhu (tedy chybné zamítnutí <math>H_0</math>) byla 1%. Popiště přesně jak a proč jste se rozhodli.
b) Použili jste intervalu A nebo B. Proč?
Řešení
Na těchto příkladech je nejtěžší to, že jsou tak jednoduché, že se tomu člověk až zdráhá uvěřit. Naměřili jsme nějaké hodnoty, a z nich jsme vypočítali dva rúzné konfidenční intervaly. Interval A je jistější, ale proto je také o něco delší, zatímco interval B sice není tak jistý, ale proto je kratší. U intervalu B je jedno procento šance, že je skutečná hodnota menší než 2.7, a jedno procento, že je větší než 4,43. To by nám ale nevadilo, protože pak by se bouřka blížila stejně. Pro nás je ale důležitá strana druhá. Aby se bouřka blížila, musí být rozptyl větší než 2,65 - my ale víme že je pouze 1% šance (což je ta naše chyba prvního druhu), že je menší než 2,7. Takže můžeme s klidem říci že bouřka se blíží.
edit: nevím, mě to teda vyšlo že cokoliv do 2,65 neleží v (2.7, infinity) a tedy hypotézu zamítám a bouřka by se blížit neměla… Tak si docti zadani. Pokud přesáhne 2.65 tak je bourka a tam je i tenhle interval.
škola písemky zkoušky pahýl
2. úloha
Náhodná veličina X může nabývat hodnot {1,2,3}. P(X=1) = 1/2, P(X=2) = 1/4, P(X=3) = 1/4
- Určete EX, E(X^2), E(X^3)
Řešení
- EX = 7/4
- E(X^2) = 15/4
- E(X^3) = 37/4
5. úloha
Uvažujme náhodný výběr n=16 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako průměr=(už si nepamatuji) a s=2.5 (Hodnotí se správné dosazení do vzorců).
- Najděte intervalový odhad pro střední hodnotu <math>\mu</math> s věrohodností 90%
- Najděte intervalový odhad pro rozptyl <math>\sigma^2</math> s věrohodností 90%
Řešení
- (průměr - 1.0956; průměr + 1.0956)
- <math>\sigma^2</math>=<3,75;12,91>
6. úloha (myslím)
Máme S100 hodů nevyváženou mincí. Pravděpodobnost panny je 0.9. Pracujeme s pravděpodobností, že padne panna.
- Určete EX, Var(X) pro jeden hod
- Určete P(87 < S100 < 96)
1. Řešení
<math>n=1</math> (počítáme pro jeden hod)
<math>EX = n \cdot p = 1 \cdot 0.9 = 0.9 </math>
<math> var(X)= n \cdot p \cdot (p-1) = 1 \cdot 0.9 \cdot 0.1 = 0,09 </math>
2. Řešení
Zhruba 81,8%. řešení: střed Gaussovky je v 90, tudíž si musím problém rozdělit na 2 výpočty. Nejprve od 90 do 96 (nějakých 0.4772) a potom od 90 do 93 (nějakých 0.34) (90 + (90-87) = osově obrácená plocha)- Dohromady po dá těch 0.818 ⇒ 81,8%
Reseni nize je podle me spatne
Edit =
<math> \frac {X - \mu}{\sigma} = z </math>
<math> \frac {87 - 90}{3} = 2 </math>
<math> \frac {96 - 90}{3} = -1 </math>
Po nalezeni intervalu z rozdeleni dostaneme <math> (0.977) - (1 - 0.841) = 0.977-0,159=0,818 </math>
PST - Zkouška 6. 6. 2011
- 90 minut, (asi) jedna skupina, žádné pomůcky kromě tabulek
1. úloha
Úsečka délky d je rozdělena ve dvou náhodných bodech (body jsou vybrány s rovnoměrným rozdělením na intervalu [0,d]). Jaká je pravděpodobnost, že ze vzniklých 3 fragmentů je možné sestavit trojúhelník. (Nápověda: Uvažte, že součet každých dvou stran trojúhelníka je větší než třetí strana.)
Řešení
(copy&paste ze stránek magisterského předmětu MI-SPI)
Jak je naznačeno v nápovědě k příkladu vybereme náhodně čísla B a C, které odpovídají bodům zlomu od počátku tyčky.
Aby bylo možné složit trojúhelník musí platit trojúhelníková nerovnost. Proto nesmí být žádná z částí zlomené tyčky delší než 1/2. Podmínky v nápovědě pak odpovídají délkám částí tyčky.
- B < 1/2 - 1. část tyčky je menší než 1/2
- 1-C < 1/2 - 3. část tyčky je menší než 1/2
- |B-C| < 1/2 - 2. část tyčky je menší než 1/2
Pokud platí všechny tři podmínky, tak pravděpodobnost, že vybereme náhodně z rovnoměrného distribučního rozdělení současně (nezávisle na sobě) správné délky B a C je 1/8. Protože lze ale B a C prohodit výsledek je 2*1/8 = 1/4. Nejlepší je si nakreslit obrázek s hodnotami B (osa X) a C(osa Y). Dobře popsané je to v tomto pdfku.
Neviem ci to niekomu pomoze, ale ja som to z tade celkom pochopil http://www.cut-the-knot.org/Curriculum/Probability/TriProbability.shtml
Výsledek
Vysledek by mel být 1/4. Je to dáno tím že body lomu vybíráme najednou (jak je zdůrazněno). Výsledek <math>2 log 2 - 1</math> odpovídá postupnému lámání.
Grafový přístup
Stejný přístup jako při Romeovi a Julii, obsah čtverce je 1, červená oblast je 1/4, pro tyto hodnoty lze sestavit trojuhelník.
2. úloha
Zpráva obsahující 5000 písmen byla vyslána kanálem s pravděpodobnosti chyby rozložené podle Poissonova rozdělení s průměrně jednou chybou na 1000 písmen.
- Určete intenzitu (parametr lambda) příslušného Poissonova rozdělení
- Jaká je pravděpodobnost, že zpráva obsahuje 1 chybu?
- Jaká je pravděpodobnost, že zpráva obsahuje alespoň 1 chybu?
- Jaká je pravděpodobnost, že zpráva obsahuje alespoň 2 chyby?
Řešení
<math>P( X = x ) = \frac{\lambda^x}{x!}e^{-\lambda}</math>
<math>\lambda = \frac{5000}{1000} = 5</math>
<math>P( X = x ) = \frac{5^x}{x!}e^{-5}</math>
<math>P( X = 1 ) = 5e^{-5} = 0,034</math>
<math>P( X >= 1 ) = 1 - P( X = 0 ) = 1 - e^{-5} = 0,993</math>
<math>P( X >= 2 ) = 1 - P( X = 1 ) - P( X = 0 ) = 1 - 5e^{-5} - e^{-5} = 1 - 6e^{-5} = 0,960</math>
3. úloha
Náhodná veličina <math>Y</math> má normální rozdělení s rozptylem <math>\sigma^2 = 2,576^{-2}</math>. Potřebujeme odhadnout její střední hodnotu pomocí 99% konfidenčního intervalu šířky 0,04. Jak velký náhodný výběr budeme potřebovat?
Řešení
reseni primo od Blazka kdyz jsem u nej byl:
<math>
\alpha = 0,01 (1%)
\frac{\alpha}{2} = 0,005
</math>
intervalovy odhad pri znamem sigma^2: <math>
(\bar{x} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}})
</math>
<math>
2z_{0.005}\frac{2.576^{-1}}{\sqrt{n}} = 0.04
z_{0.005}\frac{2.576^{-1}}{\sqrt{n}} = 0.02
</math>
z tabulek chceme na kazdem konci ukrojit 0.005 tj bereme 0,5 - 0.005 = 0.495 ⇒ 2.57
<math>
2,57*\frac{2.576^{-1}}{\sqrt{n}} = 0.02
\frac{2.57}{2,576 * \sqrt{n}} = 2/100
\frac{1}{\sqrt{n}} = 2/100
\sqrt{n} = 50
n = 2500
</math>
4. úloha
X je náhodná veličina na intervalu [0,2]. Má hustotu:
f(x) = Cx na intervalu [0,1]
f(x) = C(2 - x) na intervalu [1,2]
- určete C
- nakreslete graf hustoty
- P (X náleží [0,3/2])
- vypočíst střední hodnotu X^2
Řešení
- C = 1
- rovnoramenný trojúhelník s vrcholem v [1,1]
- 7/8
- EX^2 = Integral x^2 * f(x) = Integral_0^1 x^2*x + Integral_1^2 x^2*(2-x) = <math> \frac{7}{6}</math>
Postup
- Integral (Cx) [0,1] + Integral (C(2-x)) [1,2] = 1
- dosazení za C a nakreslení grafu
- Integral (x) [0,1] + Integral (2-x) [1,3/2] (dosazeno za C)
5. úloha
Nechť X je náhodná veličina, která nabývá hodnot 1, 3, 5 s pravděpodobností P(X=1) = 1/3, P(X=3) = 1/4, P(X=5) = 5/12
- Nalezněte moment generující funkci veličiny X
- Vypočtěte momenty E(X), E(X^2), E(X^3)
Řešení
Generující fce: <math>M(s) = E(e^{sX}) = \frac{1}{3}e^{s} + \frac{1}{4}e^{3s} + \frac{5}{12}e^{5s}</math>
Momenty: Buď z derivací generující fce nebo normálně: k-tý moment: <math>\mu_k^\prime = \operatorname{E}\left[X^k\right]</math>
- <math>E(X) = \frac{1}{3} + 3*\frac{1}{4} + 5*\frac{5}{12} = \frac{19}{6}</math>
- <math>E(X^2) = \frac{1}{3} + 9*\frac{1}{4} + 25*\frac{5}{12} = 13</math>
- <math>E(X^3) = \frac{1}{3} + 27*\frac{1}{4} + 125*\frac{5}{12} = \frac{355}{6}</math>
6. úloha
Data centrum potřebuje odhadnout vztah mezi počtem serverů a spotřebou elektrické energie na jejich napájení a chlazení. Pro měření <math>i</math> označme počet serverů a spotřebu jako (<math>x_i,y_i</math>) v daném pořadí. Uvažujme lineární model
<math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math> pro i=1,…,n
s normálně rozdělenými chybami <math>\epsilon_i</math>. Spotřebu pro 25 konfigurací a spočetla: ( horní mez sumy byla 49, dle mého blbost, dal jsem 25)
<math> \overline{x}=10 \Rightarrow (s_x)= \sqrt{\frac{1}{24}\sum_{i=1}^{25}(x_i - \overline{x})^2} = 2.5</math>
<math>\overline{y}=500 \Rightarrow (s_y)=\sqrt{\frac{1}{24}\sum_{i=1}^{25}(y_i - \overline{y})^2} = 5500</math>
<math>S_{X,Y}=\frac{1}{24} \sum_{i=1}^{25} (x_i-\overline{x})(y_i-\overline{y}) = 12</math>
- Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>.
- Najděte odhad korelačního koeficientu <math>\rho_{X,Y}</math>.
Řešení
<math>\beta_1</math> = 1,92
<math>\beta_0</math> = 480,8
Postup
- <math>\beta_1 = \frac{S_{X,Y}}{s_x^2}</math>
- <math>\beta_0 = \overline{y} - \beta_1 * \overline{x}</math>
- odhad <math>\rho_{X,Y} = \frac{S_{X,Y}}{s_x*s_y}</math>
škola zkoušky předměty
- Dosadime to definice normalniho rozdeleni <math>f_{Y}(y) = {1\over \sqrt{2\pi}*a^2} * e^{-\left({(x+2)^2\over2*a^4}\right )}</math>
X\Y | |||
---|---|---|---|
Y | X | 1 | 2 |
2 | 4/9 | 5/9 | |
4 | 7/11 | 4/11 |
a) E(X|Y=2) ?
b) Sdružená P a Marginální X
c) Jsou veliciny X a Y nezavislé ?
==== Řešení === a) 1 * 4/9 + 2 * 5/9 = 14/9 b) sdružená
X & Y | |||
---|---|---|---|
Y | X | 1 | 2 |
2 | 11/45 | 11/36 | |
4 | 63/220 | 9/55 |
Pokud by byly nezávislé pak by pro všechny kombinace mělo platit, že f(xi,yi) = f(xi)*f(yi).
f(x=1,y=2) = 11/45 ≠ 1051/3600 = (1051/1980) * (11/20) = f(x=1) * f(y=2)
Dále není třeba řešit - toto už je důkazem, že nejsou nezávislé. ===== Příklad 2 ===== Momentová metoda. Zadané f(x) a určit parametr odhadu. f(x) = 3/2(x^2+(1+p)x^3) na < -1;1 > (jinde 0). ==== Řešení ==== Postup: Podobné jako ve cvičebnici (myslím k cvičení 9) poslední příklad. <math> f(x) = \frac{3}{2}(x^2+(1+p)x^3); ←1,1> </math>
V následujícím řešení nejspíš není nutné počítat parametr m2, jelikož parametr p lze vyjádřit jen pomocí m1 (já měl ale oba a měl jsem 100 %, tak sem radši píšu oba):
<math> EX = \sum_{i=1}^{n} X_i = m_1
EX^2 = \sum_{i=1}^{n} X_i^2 = m_2
EX = \int_{-1}^{1} x \cdot (\frac{3}{2}(x^2+(1+p)x^3
↑ Tomuhle moc nerozumím. Podle slidů je <math>s^2 = \frac{1}{n - 1}\sum_{i=1}^{n}(x_i - \overline{x})^2</math>. Z toho “s” získám odmocněním, ok. Jak se ale z vnitřku té sumy stane <math>x_i^2 - n\overline{x}^2</math>? ↑ odvozeni vzorce zde - EN ↑ Mtasra: Stejně tam byla chyba - odečítat se musí až po sumě, jinak by tam bylo n^2 a už by to nevycházelo. Dosadíme…: <math>s = \sqrt{\frac{1}{16 - 1}(1952 - 1936)}</math> A vyjde nám <math>s = \sqrt{\frac{16}{15}} = \frac{4}{\sqrt{15}}</math> Máme najít oboustranný intervalový odhad pro střední hodnotu s věrohodností 99%. Hm. Uděláme si tedy další proměnnou: <math>\alpha = 1 - p = 1 - 0,99 = 0,01</math> Na oboustranný intervalový odhad máme vzoreček: <math>(\overline{x} - \delta; \overline{x} + \delta)</math>, kde <math>\delta = t_\alpha^n * \frac{s}{\sqrt{n}}</math>. Všechno máme zadané, jen jedno nám chybí. Takže jak najít to t s těmi indexy. <math>t_\alpha^n = T_{\frac{\alpha}{2}}^{n - 1}</math>. Dosadíme a najdeme v tabulce t-rozdělení (někdy také studentovo rozdělení): <math>T_{0,005}^{15} = 2,95</math> Fuj, tak teď na tu deltu: <math>\delta = 2,95 * \frac{\frac{4}{\sqrt{15}}}{4}</math> Jelikož to explicitně říkají v zadání, nebudeme dopočítávat, jen už dosadíme do výsledného intervalu: <math>\left(11 - 2,95 * \frac{\sqrt{15}}{15}; 11 + 2,95 * \frac{\sqrt{15}}{15}\right)</math> 2) Tady je to podobné, jen použijeme jiný vzorec a jinou tabulku.
- Najděte oboustranný intervalový odhad pro střední hodnotu
μ
s věrohodností 95 %. - Najděte oboustranný intervalový odhad pro rozptyl
σ²
s věrohodností 95 %.
Ho:sigma≤2,8 Ha:sigma>2,8
a) blíží se bouřka?
b) který interval a proč jste použili?
==== Řešení ==== Předpokládám, že chtěli 99% jistotu
pro Ha je interval (číslo, nekonečno)
chci jednostranný 99% (1% vlevo, vpravo do nekonečna) a pro obousměrné to je 1% na každé straně (tedy 98%)
Volim B interval a použiji z něj číslo vlevo
Výsledek (2.875 , nekonečno)
2.8 do něj nepatří, takže zamítáme Ho
===== Příklad 7 ===== Blíží se bouřka, pokud přijde vítr rychlejší než 2.9 m/s. Máme dva intervaly A (2.7; 5.5) s pravděpodobností 98% a B (2.8; 5.3). Hypotéza H0 že bude bouřka proti H1, že nebude. ==== řešení ==== Nemůžeme nic zamítnout, protože tam leží 2.9 v obou intervalech. Pouzijeme interval A, abychom se dopustili chyby 1%, ale stejne nam z nej nic nevyleze. ===== Příklad 6 ===== Uvažujme náhodný výběr n = 25 napozorovaných hodnot z normálního rozdělení. Spočetli jsme následující charakteristiky: <math>\mbox{ }\sum_{i=1}^{25} X_i = 325\mbox{ }\sum_{i=1}^{25} X_i^2 = 4325</math> V odpovědích níže nemusíte přesně numericky dopočítat krajní body intervalů, ale musíte dosadit správné numerické hodnoty do správných vzorců. Otázky:
- Najděte intervalový odhad pro střední hodnotu μ s věrohodností 98%.
- Otestujte hypotézu H0: σ2 = 4 proti alternativě HA: σ2 > 4, tak aby chyba prvního druhu byla 5%.
<math>EX^2 = 1</math>
<math>EX^3 = 0</math>
<math>EX^4 = 2</math>
<math>Y = 1 + 2x + 2x^2</math>
==== Řešení ==== <math>EY = E(1 + 2X + 2X^2) = 1 + 2EX + 2EX^2 = 3</math>
<math>EY^2 = E[(1 + 2X + 2X^2)^2] = E(1 + 4X + 8X^2 + 8X^3 + 4X^4) = 1 + 4EX + 8EX^2 + 8EX^3 + 4EX^4 = 17</math>
<math>var X = EX^2 - (EX)^2 = 1 - 0 = 1</math>
<math>var Y = EY^2 - (EY)^2 = 17 - 9 = 8</math>
<math>cov X,Y = E(XY) - EXEY = 2 - 0 = 2</math>
<math>\rho = \frac{cov (X,Y)}{\sqrt{varX \cdot varY}} = \frac{2}{\sqrt{8}} = \frac{2}{\sqrt{8}} * \frac{\sqrt{8}}{\sqrt{8}} = \frac{\sqrt{2}}{2}</math> souhlas Dotaz: Jak jsi zjistil, že <math>E(XY) = 2</math> ?
Odpoved: <math>XY = (1X + 2X^2 + 2X^3) ⇒ E(XY) = EX + 2EX^2 + 2EX^3</math> ====== NE/ZAVISLOST ====== ===== Příklad 1 ===== Jsou zadané veličiny nezávislé? Vypočítejte <math>E(X|Y)</math>
<math>f_{XY} = \frac{1}{10}(2xy + 5x + 2y); x \in(0,1), y \in (1,2)</math>
== závislé POSTUP: vyřešíme určitý intergrál pro obě proměnné. Vyjdou nám dvě funkce, které dohromady nedají funkci původní. POSTUP2: E(X|Y) se vypočte jako podíl dvou funkcí: fxy a fy - po porácení vyjde -
<math>\frac{23x+7}{15(x+\frac{3}{2})}</math>
nebo spis mozna to ma byt jinak, protoze v tom papire zapomnel <math>\frac{7}{3}</math> vynásobit 5
<math>\frac{23x+35}{15(x+\frac{3}{2})}</math>
Fx = 1/10 * (8x + 3) Fy = 1/20 * (6y + 5) Fx * Fy != Fxy ⇒ jsou závislé <math>Fx|y(X|Y) = \frac{Fxy(X,Y)}{Fy(Y)}</math>
<math>Fx|y(X|Y) = \frac{2(2xy+5x+2y)}{6y+5}</math>
====== GENERAL ====== ===== Příklad 1 ===== Franta čeká pravidelně na tramvaj a jeho čekání má exponenciální rozdělení s koeficientem <math>\lambda = \frac{1}{4}</math> (pro druhé oddělení <math>\lambda = \frac{1}{5}</math>) - příjezdů tramvaje za minutu. Zatím čekal 25x. Doby čekání jsou nezávislé.
- Vypočtěte střední hodnotu a rozptyl rozdělení doby, kterou pročekal.
- Jaká je pravděpodobnost, že čekal alespoň 2 hodiny (n = 120)? použijte CLV.
===== Příklad 2 ===== Nechť X je výsledek následujícího procesu. Hodíme vyváženou kostkou a pokud padne číslo větší než jedna, pak X je toto číslo. Pokud padla jednička, hodíme ještě jednou a X je výsledek druhého hodu.
- Určete (spočtěte) rozdělení náhodné veličiny X.
- Spočtěte střední hodnotu E(X).
- Jaká je pravděpodobnost, že při 10 náhodných nezávislých realizacích X budou právě tři jedničky? (Stačí napsat správný výraz.)
Petka <math>\frac{1}{6}+\frac{1}{6}*\frac{1}{6} = \frac{7}{36}</math>
… Dvojka <math>\frac{1}{6}+\frac{1}{6}*\frac{1}{6} = \frac{7}{36}</math>
jednicka padnou s pravdepodobnosti <math>\frac{1}{6}*\frac{1}{6} = \frac{1}{36}</math>
<math>EX = x \cdot px = 6\frac{7}{36} + 5\frac{7}{36} + 4\frac{7}{36} + 3\frac{7}{36} + 2\frac{7}{36} + \frac{1}{36} = \frac{141}{36} = \frac{47}{12} = 3,91 </math>
Trocha teorie: budem mít deset hodů - 3 chceme aby padly (to jsou ty jednicky) a 7 aby nepadlo(zbyle hodnoty) podle binomického rozdělení dostáváme
<math> p = \frac{1}{36}
1-p = \frac{35}{36}
{10 \choose 3} p^3 (1-p)^7
</math> ===== Příklad 3 ===== Nechť X je výsledek následujícího procesu. Hodíme vyváženou kostkou a pokud padne číslo menší než šest, pak X je toto číslo. Pokud padla šestka, hodíme ještě jednou a X je výsledek druhého hodu.
- Určete (spočtěte) rozdělení náhodné veličiny X.
- Spočtěte střední hodnotu E(X).
- Jaká je pravděpodobnost, že při 10 náhodných nezávislých realizacích X budou právě tři dvojky? (Stačí napsat správný výraz.)
- Padnou v prvním hodě - pak je to jedno číslo z šesti = <math>\frac{1}{6}</math>
- Padnou v druhém hodě - v prvním padne šestka (<math>\frac{1}{6}</math>) a v druhém padne to číslo, které potřebujeme (opět <math>\frac{1}{6}</math>)
P(6) = \frac{1}{6} \cdot \frac{1}{6} = \frac{1}{36} </math> 2. <math> EX = \sum_{x=1}^6x \cdot P(x) = (1 + 2 + 3 + 4 + 5) \cdot \frac{7}{36} + 6 \cdot \frac{1}{36} = \frac{105}{36} + \frac{6}{36} = \frac{111}{36} = \frac{37}{12} </math> 3. 3 dvojky z 10 ⇒ binomické rozdělení <math> P_n(k) = {n \choose k} \cdot p^k \cdot q^{n-k}
n = 10
k = 3
p = P(2) = \frac{7}{36}
q = 1 - p = \frac{29}{36}
P_{10}(3) = {10 \choose 3} \cdot \left( \frac{7}{36} \right)^3 \cdot \left( \frac{29}{36} \right)^7 </math> ====== REGRESE ====== ===== Příklad 1 ===== Regresní model. x - počet počítačů, y - spotřeba elektřiny. <math>y_i = \beta_0 + \beta_1 x_i + \varepsilon_i
\overline{x} = 15; \qquad S_X = 3
\overline{y} = 450; \qquad S_Y = 3000
S_{X, Y} = 15</math>
- Spočítej <math>\beta_0, \beta_1</math>
- Spočítej korelační koeficient <math>\rho_{X, Y}</math>
- Jakou přibližně spotřebu bude mít 30 počítačů?
yi
v tunách na hektar na použitém množství hnojiva xi
. Pro osm měření nám vyšla data:
<math>
\overline{x} = 440 \overline{y} = 60
s_x^2 = \frac{1}{7} \sum_{i=1}^{8}(x_i-\overline{x})^2 = 50000
s_y^2 = \frac{1}{7} \sum_{i=1}^{8}(y_i-\overline{y})^2 = 200
\sum_{i=1}^{8}x_i y_i = 29400 </math> Pokud by závislost výnosů na množství hnojiva byla lineární, vezměme model <math> y_i = \beta_0 + \beta_1 x_i + \eps_i, i = 1, …, n </math> s normálně rozdělenými chybami εi.
- Najděte odhady parametrů β0 a β1.
- Najděte odhad korelačního koeficientu ρX,Y.
- Odhadněte spotřebu hnojiva, chcete-li vypěstovat 90 t pšenice.
s_{x,y} = \frac{1}{n-1} \displaystyle\sum\limits_{i=0}^{n-1} (x_i y_i - \bar{x} y_i - x_i \bar{y} + \bar{x}\bar{y})
s_{x,y} = \frac{1}{n-1} \displaystyle\sum\limits_{i=0}^{n-1} (x_i y_i) - \bar{x}\bar{y}
</math> ====== PST - zkouška 4. 6. 2012 ====== ===== Příklad 1 ===== ==== Skupina A ==== Nechť A, B a C jsou tři nezávislé jevy s pravděpodobností P(A) = 0.1, P(B) = 0.2 a P(C) = 0.3
- Vypočítejte P(A ∪ B)
- Vypočítejte P(A ∪ B ∪ C)

- P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 0,1 + 0,2 - 0,1*0,2 = 0,3 - 0,02 = 0,28
- P(A ∪ B ∪ C) = P(A) + P(B) + P(C) - P(A ∩ B) - P(C ∩ B) - P(A ∩ C) + P(A ∩ B ∩ C) = 0,1 + 0,2 + 0,3 - 0,02 - 0,06 - 0,03 + 0,006 = 0,496
Pozn: v případě, že by v zadání bylo napsáno, že se jedná o disjunktní (jinými slovy neslučitelné nebo také vzajemně exklusivní) jevy, potom by P(A ∪ B) = P(A) + P(B) Pozn2: …, protoze v pripade disjunktnich jevu se P(A ∩ B) == 0. ==== Skupina B ==== Nechť A, B a C jsou tři nezávislé jevy s pravděpodobností P(A) = 0.2, P(B) = 0.3 a P(C) = 0.2
- Vypočítejte P(A ∪ B)
- Vypočítejte P(A ∪ B ∪ C)
(x-1)(x-2)& \quad \mbox{pro 0 \le x \le 1}\\ a & \quad \mbox{pro 1 \le x \le 2}\\ 0& \quad \mbox{jinak}\\ \end{array} \right. \</math>
- Pro jaké a je f hustotou náhodné veličiny X?
- Najděte EX.
- Spočtěte P(x < 4/3).

Edit: Technicky vzato, nemelo by byt <math>\int_1^2 a dx = \frac{1}{6}</math>? V tomto priklade je to jedno, ale pokud by tam bylo treba ax, tak uz ne. 2. (Najděte EX.) <math>EX = \int_0^1(x\cdot (x-1)(x-2
<math>s = \sqrt{\frac{1}{25 - 1}(2509-25*10^2)}</math>
<math>s=0,6123</math>
<math>\delta=T_{\frac{1-p}{2}}^{n-1}\cdot\frac{s}{sqrt{n}}</math>
<math>\delta=T_{\frac{1-0,95}{2}}^{25-1}\cdot\frac{0,6123}{sqrt{25}}</math> T najdeme v T-tabulka (student). <math>\delta=0,253</math> Interval: <math>(10-0,253;10+0,253)</math> 2. <math>s=0,6123</math> Viz předchozí řešení <math>\left[\left(\frac{(25-1)\cdot 0,6123^2}{\chi_{1-\frac{1-0,95}{2}}^{2}(25-1)}\right); \left(\frac{(25-1)\cdot 0,6123^2}{\chi_{\frac{1-0,95}{2}}^{2}(25-1)}\right)\right]</math> Hledáme v CHI tabulce… <math>\left(\frac{9}{39,364}\right); \left(\frac{9}{12,401}\right)</math> ===== Příklad 6 ===== ==== Skupina A ==== Rodina má tři malé chlapce, jejichž věk je postupně 6, 21 a 63 měsíců a kteří měří (<math> y_i </math>) 67, 82 a 121 cm. Předpokládejme, že závislost výšky na věku by byla lineární a vezměme model <math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math>, <math> i = 1…n </math> s normálně rozdělenými chybami <math>\epsilon_i</math>. Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>. Z výše uvedených dat jsme získali: <math> \overline{x} = 30 , \sum_{i=1}^{3}x^2_i = 4446 </math> <math> \overline{y} = 90 , \sum_{i=1}^{3}y^2_i = 25854 </math> <math> \sum_{i=1}^{3}x_i y_i = 9747 </math> === Řešení === Jednoduchšie riešenie: <math> \frac{1}{n-1} </math> sa vo výpočte hneď na začiatku vykráti <math>\beta_1 = \frac{S_{X, Y}}{S_X^2} = \frac{\sum_{i=1}^{n}(x_i-\overline{x})(y_i-\overline{y})}{\sum_{i=1}^{n}(x_i - \overline{x})^2} = \frac{\sum_{i=1}^{n}(x_iy_i)- n\overline{x}\overline{y}}{\sum_{i=1}^{n}(x_i^2)- n\overline{x}^2} = \frac{9747 - 3*30*90}{4446 - 3*30^2} = \frac{1647}{1746} = \frac{183}{194} </math> <math>\beta_0 = \overline{y} - \beta_1\overline{x} = 90 - \frac{183*30}{194} = \frac{5985}{97} </math> Zložité riešenie: <math>\beta_1 = \frac{S_{X, Y}}{S_X^2}</math> potřebujeme spočítat <math>S_{X, Y}</math> a <math>S_X^2</math> <math>S_{X,Y} = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\overline{x})(y_i-\overline{y}) = \frac{1}{3-1}\sum_{i=1}^{3}(x_iy_i-x_i\overline{y}-\overline{x}y_i+\overline{x}\overline{y}) = \frac{1}{2}(\sum_{i=1}^3x_iy_i - \sum_{i=1}^3x_i\overline{y}-\sum_{i=1}^3\overline{x}y_i+\sum_{i=1}^3\overline{x}\overline{y})= \\</math>
- <math>\overline{x}</math> a <math>\overline{y}</math> jsou konstanty, ty tedy můžeme vytknout před sumu
- <math>x_i</math> a <math>y_i</math> se v sumě sčítají přes <math>_i</math>
</math>
- teď se zbavíme několika sum tak, že je nahradíme tímto: <math>\overline{x} = \frac{1}{n}\sum_{i=1}^n x_i ⇒ \sum_{i=1}^n x_i = \overline{x} n</math>
- <math>\sum_{i=1}^n 1 = n</math> (je to součet n jedniček)
- Udělejte vzorec, s jakou pravděpodobností bude jízda úspěšná za hezkého počasí
- Udělejte vzorec, s jakou pravděpodobností bude jízda úspěšná za hnusného počasí
- Hezké počasí nastane s pravděpodobností 0.6 a ošklivé s 0.4. Napište vzorec úspěšnosti jízdy.
- <math> P(A) = \sum_{k=22}^{n} {n \choose k}p_h^{k} (1 - p_h)^{n-k} </math>
- <math> P(B) = \sum_{k=22}^{n} {n \choose k}p_s^{k} (1 - p_s)^{n-k} </math>
- <math> P(C) = 0.6 * P(A) + 0.4 * P(B) </math>
& 100 = E(X^2)-100^2
& E(X^2)=10100 \end{align*} </math> <math>E(XY)=E(4X^2-300X)=4E\left(X^2\right)-300E(X)=4*10100-300*100=10400</math> <math>cov(X,Y)=10400-100*100=400</math> ===== Příklad 3 B ===== Nechť X má normální rozdělení se střední hodnotou <math>\mu=10</math> a směrodatnou odchylkou <math>\sigma=2</math>. Buď <math>Y=9X-90</math>.
- Spočtěte a takové, že <math>P\left(Y<a\right)=0,99</math>
- Jaká je kovariance <math>cov\left(X,Y\right)?</math>
& \frac{a}{18}=2,33
& a = 41,94 \end{align*} </math> Hodnota
2,33
je z tabulek normálního rozdělení pro <math>0,99-0,5=0,49</math>
Výpočet var(Y)
: přednáška 5, slide 22. var(Y) = var(9X-90) = 9^2*var(X)
var(X) spočítáte ze směrodatné odchylky, která je tam zadaná jako sigma = 2, rozptyl z toho je 2^2, takže to je 9^2*2^2 2. <math>cov(X,Y)=E(XY)-E(X)E(Y)</math> Pro výpočet EXY musíme znát hodnotu E(X^2), která se opravdu nevypočítá jako druhá mocnina střední hodnoty X! <math>var(X)= E(X^2)-(EX)^2</math> <math>4 = E(X^2)-10^2</math> <math>104 = E(X^2)</math> <math>E(XY)=E\left(9X^2-90X\right)=9E(X^2)-90EX=9*104-90*10 = 36</math> <math>cov(X,Y)= 36 - 10*0=36</math> ===== Příklad 4 ===== Sdružená hustota pravděpodobnosti náhodných veličin X a Y má tvar <math>f_{X,Y}(x,y)=\frac{1}{3}(x+y+1)</math> pro <math>x\in\left[-1,1\right]</math> a <math>y\in\left[0,1\right]</math> Najděte korelační koeficient náhodných veličin X a Y, tj. <math>\rho(X,Y)</math> ==== Řešení ==== <math>\rho(x,y)=\frac{cov(x,y)}{sqrt{var(X)*var(Y)}}</math> <math>f_X(x)=\int_0^1 f(x)\, \mbox{d}y=\int_0^1\frac{1}{3}\left(x+y+1\right)\mbox{d}y=\frac{1}{6}(2x+3)</math> W.A. <math>f_Y(y)=\int_{-1}^1 f(x)\, \mbox{d}x=\int_{-1}^1\frac{1}{3}\left(x+y+1\right)\mbox{d}x=\frac{2(y+1)}{3}</math> W.A. Nyní zjistíme, že veličiny jsou nezávislé (jinak by se pravá a levá strana rovnaly): <math>f_{X,Y}(x,y)==f_Xx*f_Yy</math> <math>\frac{1}{3}\left(x+y+1\right)=?=\left(\frac{1}{6}(2x+3)\right)*\left(\frac{2(y+1)}{3}\right)</math> <WRAP center round tip 60%> Kdyby byly nezávislé, pak <math>cov(x,y)==0</math> ⇒ <math>\rho(x,y)==0</math>. </WRAP> Dále mě napadá použít následující postup: <math>cov(X,Y)=E(XY)-E(X)E(Y)</math> <math> \begin{align*} E(X)=\int_A^A x*f(x) \mbox{d}x =
&= \int_{-1}^1 x*\frac{1}{6}\left(2x+3\right)\mbox{d}x = \frac{2}{9} \end{align*} </math> <math> \begin{align*} E(Y)=\int_A^A y*f(y) \mbox{d}y =
&= \int_{0}^1 y*\frac{2(y+1)}{3}\mbox{d}y = \frac{5}{9} \end{align*} </math> <math> \begin{align*} E(XY)=\int_0^1 \int_{-1}^1 \left(x*y*\frac{1}{3}(x+y+1)\right) \mbox{d}x \mbox{d}y = \frac{1}{9} \end{align*} </math> <math>cov(X,Y)=E(XY)-E(X)E(Y)=\frac{1}{9}-\frac{2}{9}*\frac{5}{9}=-\frac{1}{81}</math> po nekolika hruznostech, ktere zde neuvadim jsem dosel k pribliznemu vysledku: <math>\rho(x,y)=\frac{cov(x,y)}{sqrt{var(X)*var(Y)}}=-0,081</math>
- A) Určete střední hodnotu a rozptyl celkové doby práce, na kterou nám tato sada vrtáků vydrží.
- B) Jaká je pravděpodobnost, že nám vrtáky vydrží alespoň 400 hodin? Použijte CLV!
- stejně jako v předchozím, ale za C dosadíme 1/2 a jako meze dáme a, b
- vyřešíme nerovnici a intervaly a ty pro které rovnice platí dosadíme do vzorce který nám vyšel v předchozím bodě
- <math>1/2</math>
- <math>b - a - (b^2-a^2)/4</math>
- <math>1/2</math>
- Určete rozptyly a střední hodnoty Y a Z
- Určete kovarianci cov(Y,Z)