Provádíme test na nějakou nemoc. Máme danou pravděpodobnost, že u zdravých jedinců je test falešně pozitivní (10%) a pravděpodobnost, že u nemocných je falešně negativní (1%). Dále víme, že v náhodném vzorku osob byl test právě u 20% osob pozitivní. Určete, pravděpodobnost výskytu nemoci v populaci. Pravděpodobnost, že člověk s pozitivním testem je opravdu nemocný.
1)
p = zdravých v populaci
<math>\frac{10}{100}p+\frac{99}{100}(1-p)=0,2</math>
<math>p=\frac{79}{89}</math>
<math>1-p=\frac{10}{89}=11,2 %</math>
Nemocných je v populaci 11,2 %.
2)
<math>\frac{\frac{99}{100}*\frac{10}{89}}{\frac{99}{100}*\frac{10}{89}+\frac{10}{100}*\frac{79}{89}} = \frac{99}{178} = 0,556</math>
Pravděpodobnost, že člověk s pozitivním testem je opravdu nemocný, je 55,6 %.
Máme množinu A⊆ {1,2,3,…,49}, která obsahuje právě 6 čísel. Vyberme náhodně 10 čísel z množiny {1,2,3,…49}. Určete pravděpodobnost, že právě 4 z těchto 10 budou i v množině A.
Hypergeometrické rozdělení:
<math> P(X=4)=\frac6_choose_4_49-6_choose_10-449_choose_10 </math>
Šance na narození syna je 3/4, lidé v divné zemi mají potomky tak dlouho dokud se jim nenarodí první syn. Jaký je poměr chlapců a děvčat v populaci?
Mezi stoletými občany je 80% žen. Mužů se rodí 52%. Kolikrát měla žena narozená před 100 lety větší pravděpodobnost než muž, že se dožije alespoň 100 let?
P(100|Z) / P(100|M) = …. = 13/3 = 4 + 1/3 ⇒ Žena narozená v této době měla 4.333 krát větší pravděpodobnost, že se dožije 100 let.
V jisté zemi má manželský pár tolik potomků, dokud se jim nenarodí syn, potom další potomky nemají. Pravděpodobnost narození chlapce a dívky je stejná 50%. Jaký je poměr v jedné generaci? Odpověď zdůvodněte.
každá rodina bude mít právě jednoho chlapce.
Počet dívek:
P(0) = 1/2 (mají jen jedno dítě - chlapce)
P(1) = 1/4 (mají jednu dívku a jednoho chlapce - 1/2 * 1/2)
P(2) = 1/8
P(3) = 1/16
…
takže pro počet dívek máme řadu:
0*1/2 + 1*1/4 + 2*1/8 + 3*1/16 + …
to můžem rozepsat jako součet řad:
1/4 + 1/8 + 1/16 + ... = 1/2 1/8 + 1/16 + ... = 1/4 1/16 + ... = 1/8 ... ...
tyto jednotlivé řady opet sečteme a dostáváme řadu 1/2 + 1/4 + 1/8 + 1/16 … a součet této řady je 1.
Takže poměr chlapců a dívek bude 1:1
Pravděpodobnost, že vlk uloví zdravou kořist je 25% a nemocnou 85%. 80% kořistí je zdravých. Jaká je pravděpodobnost, že vlk uloví kořist? Jaká je pravděpodobnost, že kořist, kterou vlk ulovil, byla nemocná?
P(Uloví) = 37%; P(Nemocná | Uloví) = 17/37
Riešil by som to takto:
P(Zdravý)=80%, P(Uloví | Zdravý) = 25%, P(Uloví | Nemocný) = 85% P(Uloví)=P(Uloví | Zdravý)*P(Zdravý) + P (Uloví|Nemocný)*P(Nemocný) = 37% P(Nemocný|Uloví) = P(Uloví|Nemocný)*P(Nemocný)/P(U)
Fotbalový míč se skládá z pětiúhelníků a šestiúhelníků. Pětiúhelníky jsou očíslovány 1,2…12. Šestiúhelníky 13,14..32. Pravděpodobnost, že míč dopadne pětiúhelníkem nahoru je 40% a šestiúhelníkem 60%. Jaká je pravděpodobnost, že po dvou hodech míčem dostaneme součet 23.
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek nevytáhl, když kontrolka hlásí OK? Zapište ve zlomkovém tvaru.
<math>\frac{\frac{1}{1000}\cdot \frac{3}{1000}}{\frac{1}{1000}\cdot \frac{3}{1000} + \frac{995}{1000}\cdot \frac{997}{1000}}</math>
Předpokládejme, že v prezidentských volbách má kandidát A 30% šanci vyhrát a kandidát B 70% šanci.
f(x) = cxe^-x, určete c tak aby f(x) byla pravděpodobnostní fce, x(0,∞)
Buď si říct, že po zintegrovani f(x) od -inf do inf to musí být 1. Integruje se per partes.
<math>
\int_{-\infty }^{\infty } f(x) dx = 1 =
\int_{0}^{\infty}cx e^{-x} dx =
c\int_{0}^{\infty} xe^{-x}dx =
c \cdot \left [ -xe^{-x}\right ]_0^\infty-\int_{0}^{\infty}-e^{-x}dx =
c \cdot \left [ -xe^{-x}-e^{-x}\right ]_0^\infty =
c \cdot \left [ -\frac{x}{e^{x}} - \frac{1}{e^{x}} \right ]_0^\infty =
= c \cdot \left [ (\lim_{x\to\infty} -\frac{x}{e^{x}} + \lim_{x\to\infty} -\frac{1}{e^{x}}) - (0 - 1) \right] =
</math>
pomocí L'Hospitalova pravidla (typ inf/inf) pokračuji:
<math>
c \cdot 1) = c = 1
</math>
Takže:
c=1
<math>
f(x)=xe^{-x}
</math>
Na 8 kluků ve tříde připadá jedna dívka, 60% dívek dlouhé vlasy, 3/24 kluků dlouhé vlasy (asi tak). Vidím před sebou dlouhé vlasy, jaká je pravděpodobnost, že to je dívka?
V. Bayess
P(M)= 8/9
P(Z)= 1/9
P(D|M)= 3/24 = 1/8
P(D|Z)= 6/10 = 3/5
<math> P(Z|D)= {P(Z)*P(D|Z)\over P(Z)*P(D|Z)+P(M)*P(D|M)} = { { {1\over 9} * {3\over 5} }\over { {\over 1 9} * {\over 3 5} + {\over 8 9} * {\over 1 8} } } = {3\over 8} </math> myslim :D -edit: ano, potvrzuji
Systém Windows používá 80 % uživatelů, systém Linux 40 % uživatelů. Dále 5 % uživatelů nepoužívá ani Windows ani Linux. Jaká je pravděpodobnost, že uživatel používá zároveň Windows a Linux?
P(W) = 0.8, P(L) = 0.4, P(Jiný) = 0.05
P(W ∪ L) = P(W) + P(L) - P(W ∩ L)
P(Jiný) = 1 - P(W ∪ L)
1 - P(W ∪ L) = 1 - (P(W) + P(L) - P(W ∩ L))
0.05 = 1 - (0.8 + 0.4 - P(W ∩ L))
0.05 = -0.2 + P(W ∩ L)
P(W ∩ L) = 0.25 ⇒ 25 %
(10%)
V krabici máme 10 míčků modrých a 5 červených. Vytáhli jsme postupně 4 míčky, aniž bychom je vraceli zpět. Víme, že třetí a čtvrtý míček byl červený. O druhém míčku nám nebyla sdělena žádná informace. Jaká je pravděpodobnost, že první vytažený míček byl modrý?
Třetí a čtvrtý červený míček můžeme “rezervovat” předem, takže nám zůstane 10 modrých a 3 červené. Pravěpodobnost, že vytáhneme jeden z 10 modrých z celkového počtu 13 míčků je 10/13.
Šance že semínko vyklíčí je 90%. Máme jich 100. Najděte E(X), var(X) a počet květináčů, které si musíme připravit, aby nám s 95% P stačily. (už to tu někde bylo)
<math>E(X) = p*n = 0.9*100 = 90</math>
<math>Var(X) = p*n*(1-p) = 9</math>
Najít P(X⇐n)=0.95, kde n je počet květináčů.
<math>P(Z⇐\frac{n-90}{3}) = 0,95</math>
potřebujeme tedy pod gaussovkou 95% plochu: někde mezi 1.64 a 1.65
<math>\frac{n-90}{3} = 1.64</math> ⇒ n=94,9 ⇒ potřebujeme 95 květináčů
V prvním podlaží nastoupili do výtahu 3 lidi. Každý z nich může vystoupit v kterémkoliv ze sedmi podlaží (tedy ve druhém až sedmém). Jaká je pravděpodobnost, že vystoupí všichni v jednom podlaží?
Počet všech jevů je <math>6^3</math> (každý člověk má 6 možností kde vystoupit a ty se mezi sebou vynásobí) a počet příznivých jevů je <math>6</math> (celá trojice má jen 6 možností kde vystoupí společně).
<math>\frac{6}{6^3}=\frac{1}{36}</math>
Sportovní klub přihlásil 20 běžců na maraton. Jsou mezi nimi 4 výborní, 10 dobrých a 6 průměrných. Pravděpodobnost, že běžec splní časový limit pro kvalifikaci na olympiádu, je pro výborné běžce 0.9, pro dobré 0.7 a pro průměrné 0.5. Jaká je pravděpodobnost, že náhodně vybraný běžec tohoto sportovního klubu splní kvalifikační limit?
vypocet podobnej jako ve skupine B, vysledek stejnej - 0.68
Sportovní klub přihlásil 20 běžců na maraton. Je mezi nimi 6 výborných, 6 dobrých a 8 průměrných. Pravděpodobnost, že běžec splní časový limit pro kvalifikaci na olympiádu, je pro výborné běžce 0.9, pro dobré 0.7 a pro průměrné 0.5. Jaká je pravděpodobnost, že náhodně vybraný běžec tohoto sportovního klubu splní kvalifikační limit?
P(V) = 6/20
P(D) = 6/20
p(P) = 8/20
P(K|V) = 0.9
P(K|D) = 0.7
P(K|P) = 0.5
P(K) = ?
P(K) = P(K|V) P(V) + P(K|D) P(D) + P(K|P) P(P) = 9/10 * 6/20 + 7/10 * 6/20 + 5/10 * 8/20 = 136/200 = 17/25 = 0,68
Dá se na to přijít i tak, že spočítáte aritmetický průměr ze všech pravděpodobností běžců, tedy (6*0,9 + 6*0,7 + 8*0,5) / 20.
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek nevytáhl, když kontrolka hlásí OK? Zapište ve zlomkovém tvaru.
<math>\frac{\frac{1}{1000}\cdot \frac{3}{1000}}{\frac{1}{1000}\cdot \frac{3}{1000} + \frac{995}{1000}\cdot \frac{997}{1000}}</math>
Nevytáhne-li se letadlu podvozek, kontrolka značící chybu nic nezahlásí s pravděpodobností 1 promile, s pravděpodobností 0.005 však signalizuje závadu, i když vše proběhlo v pořádku. Podvozek se vytáhne v pořádku s pravděpodobností 0.997. Jaká je pravděpodobnost, že se podvozek vytáhl, když kontrolka hlásí závadu? Zapište ve zlomkovém tvaru.
<math> \frac{\frac{5}{1000}\cdot \frac{997}{1000}} {\frac{5}{1000}\cdot \frac{997}{1000} + \frac{999}{1000}\cdot \frac{3}{1000}} = \frac{1}{1000} \cdot \frac{4985}{4985 + 2997} = 0.00062453 = 0,062453% </math>
Na každé 4 studenty (muže) připadá jedna studentka (žena). 75% studentek (žen) má dlouhé vlasy. Z 20ti studentů (mužů) 3 nosí dlouhé vlasy. Sedím na přednášce a přede mnou je student s dlouhými vlasy, jaká je pravděpodobnost, že to není dívka?
Klasická úložka na Bayesovu formuli.
D → dlouhé vlasy
M → muž
Z → žena
<math>P(D|M)=\frac{3}{20}</math>
<math>P(D|Z)=\frac{3}{4}</math>
<math>P(M)=\frac{4}{5}</math>
<math>P(Z)=\frac{1}{5}</math>
<math> P(M|D)=\frac{P(D|M)*P(M)}{P(D|M)*P(M)+P(D|Z)*P(Z)}=\frac{\frac{3}{20}*\frac{4}{5}}{\frac{3}{20}*\frac{4}{5}+\frac{3}{4}*\frac{1}{5}}=\frac{4}{9} </math>
V osudí je 24 koulí - 4 černé barvy, 12 červené barvy, 8 bílé barvy. Koule se po tazích nevrací.
oddělení a)
oddělení b)
a1 - Klasická úložka na Bayesovu formuli.
Označme si černé koule B, bílé W a červené R.
Bayesova formule má tento vzorec:
<math>P(A_i|B) = \frac{P(B|A_i) * P(A_i)}{\sum_j P(B|A_j) * P(A_j)}</math>
Takže když hledáme <math>P(1B|2R)</math>, jen dosadíme do vzorce:
<math>P(1B|2R) = \frac{P(2R|1B) * P(1B)}{P(2R|1B) * P(1B) + P(2R|1R) * P(1R) + P(2R|1W) * P(1W)}</math>
A jednotlivé pravděpodobnosti zjistíme strašně jednoduše. Koulí je celkem 24, B jsou 4, R 12 a W 8. Takže <math>P(1B) = \frac{4}{24}</math>, <math>P(1R) = \frac{12}{24}</math>, <math>P(1W) = \frac{8}{24}</math>. Dále zřejmě vidíme, že <math>P(2R|1B) = \frac{12}{23}</math>, <math>P(2R|1R) = \frac{11}{23}</math>, <math>P(2R|1W) = \frac{12}{23}</math>. A teď už tedy můžeme dosadit rovnou konkrétní čísla:
<math>P(1B|2R) = \frac{\frac{12}{23} * \frac{4}{24}}{\frac{12}{23} * \frac{4}{24} + \frac{11}{23} * \frac{12}{24} + \frac{12}{23} * \frac{8}{24}} = \frac{4}{23}</math>
a2 Tady si to holt musíme rozpočítat. Pro každou barvu musíme spočítat pravděpodobnost, že ji vytáhneme v prvním tahu, vynásobit pravděpodobností, že v druhém tahu vytáhneme černou za podmínky, že v prvním padla ta předchozí, a to všechno pak sečíst. Takže:
<math>P(2B|1X) = P(1R) * P(2B|1R) + P(1W) * P(2B|1W) + P(1B) * P(2B|1B) = \frac{48}{552} + \frac{32}{552} + \frac{12}{552} = \frac{1}{6}</math>
Pravděpodobnost že nastane požár je 0.01. Za předpokladu, že je požár stroj nahlásí požár s p = 0.99. Za předpokladu, že není požár stroj nahlásí požár s p = 0.02.
=\frac{0.01*0.99}{0.01*0.99 + 0.02*0.99}=\frac{1*0.0099}{3*0.0099}=\frac{1}{3}</math>
Nákladní výtah má nosnost 1400 kg. Přijel náklad se 64 banánovými krabicemi. Ze zkušeností víme, že váha takovéto krabice má střední hodnotu 21 kg a standardní odchylku 0,7 kg. Určete pravděpodobnost, se kterou po naložení všech krabic nedojde k přetížení výtahu. Použijte CLT!
<math>P(\sum Xi < 1400) = P(\frac{\sum Xi - n*\mu}{\sqrt{n} * s } < \frac{1400 - n *\mu}{\sqrt{n} * s }) = P(Z < \frac{1400 - 64*21}{8*0.7}) = \phi(\frac{56}{5.6}) = \phi(10) = 1</math>
Zasadíme 100 semínek a je pravděpodobnost 0,9, že semínko vyklíčí.
1) Jedná se o binomické rozdělení (semínko buď vyklíčí - pravděpodobnost p - nebo nevyklíčí - pravděpodobnost 1 - p).
Tady si člověk prostě musí pamatovat vzorečky pro E(X) a var(X). Bacha, každé rozdělení má tyto vzorečky jiné.
<math>E(X)=n * p=100 * 0,9 = 90</math>
<math>var(X)=n * p * (1-p) = 100 * 0,9 * 0,1 = 9</math>
-
2) Centrální limitní věta říká, že po vhodné normalizaci se rozdělení výběrového průměru blíží k normálnímu rozdělení. Normální rozdělení má parametry <math>\mu, \sigma^2</math>, navíc <math>E(X) = \mu, var(X) = \sigma^2</math>.
Máme tedy normální rozdělení <math>X \overset{\text{approx.}}\sim \text{Norm}(90, 9)</math>
Provedeme transformaci:
<math>P(X < n) = \phi(\frac{n-\mu}{\sigma}) = 0,95</math>
Předchozí řádek zapsán lidsky: Chceme, aby se pravděpodobnost, že počet vyklíčených semínek (náhodná veličina X) bude menší než počet květináčů (n), rovnala 0,95 (<math>\alpha</math>).
V tabulce normálního rozdělení zjistíme, že pro <math>\phi</math> = 0,95 je hodnota 1,65. Můžeme tedy dosadit naše čísla, která jsme dostali jako parametry normálního rozdělení, a víme, že:
<math>\frac{n - 90}{3} = 1,65</math>
Po triviální úpravě pak víme, že
<math>n = 94,95</math>
Závěr: Připravíme si 95 květináčů.
BTW: Pěstování kytek fakt pomáhá na nervy. Vyzkoušeno v tomto semestru.
Hrajeme hru, při které se hází vyváženou šestistěnnou kostkou a vyhrajeme, když padne pětka nebo šestka.
n
hodech.
Počet výher = Binomické rozdělení s parametrem p = 1/3.
EX = n*p = n * 1/3
VarX = n*p*(1-p) = n*1/3*2/3 = 2n/9
↑ detailní popis: Víme, že se jedná o binomické rozdělení (buď vyhrajeme, nebo prohrajeme, nic jiného nemůže nastat). Vyhrajeme s pravděpodobností <math>\frac{2}{6} = \frac{1}{3}</math>. Vzoreček na střední hodnotu u binomického rozdělení je <math>EX = n * p</math> a rozptyl <math>var X = n * p * (1 - p)</math>. Tedy:
<math>EX = \frac{n}{3}</math>
<math>var X = \frac{n}{3} * \frac{2}{3} = \frac{2n}{9}</math>
Takže když si hodíme třeba devětkrát, bude střední hodnota 3 a rozptyl 2.
spíš takhle:
Podíl výher v celkovém počtu = X/n. (Zadání chce relativní četnost výher!!!)
E(X/n) = EX/n = n * 1/3 * 1/n = 1/3. (Logicky, podíl výher odpovídá pravděpodobnosti výher)
Var(X/n) = VarX/n^2 = 2n/9 * 1/n*n = 2/9n
<math>
P(\frac{\frac{3}{12}-\mu}{\sqrt{\sigma^2}} < Z < \frac{\frac{5}{12}-\mu}{\sqrt{\sigma^2}}) > 0.95
P(\frac{-\frac{1}{12}}{\sqrt{\frac{2}{9n}}} < Z < \frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}}) > 0.95
\Phi(\frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}}) = 0.475
\frac{\frac{1}{12}}{\sqrt{\frac{2}{9n}}} = 1.96
n=122.9312
</math>
Musíme hodit alespoň 123 krát, abychom dosáhli 95% pravděpodobnosti.
Házíme vyváženou šestistěnnou kostkou a zaznamenáváme si relativní četnost hozených šestek
n
hodech.
<math>
Ex = x * px = \frac{1}{6}
var X = n \cdot p \cdot (1-p) = \frac{5n}{36}
</math>
Řešení, které bylo uznáno na plný počet bodů:
<math>
EX = \frac{1}{6}
var X = \frac{1}{n} \sum_{i=1}^{n}X_i = \frac{1}{n^2} \cdot n \cdot p \cdot q = \frac{p \cdot q}{n} = \frac{1 \cdot 5}{6 \cdot 6 \cdot n} = \frac{5}{36n}
</math>
<math>
P(\frac{\frac{1}{12}-\mu}{\sqrt{\sigma^2}} < Z < \frac{\frac{3}{12}-\mu}{\sqrt{\sigma^2}}) > 0.95
P(\frac{-\frac{1}{12}}{\sqrt{\frac{5}{36n}}} < Z < \frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}})>0.95
\Phi(\frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}}) = 0.475
\frac{\frac{1}{12}}{\sqrt{\frac{5}{36n}}} = 1.96
n=76.832
</math>
Musíme hodit alespoň 77 krát, abychom dosáhli 95% pravděpodobnosti.
Definujte pojem nezávislost, a dokažte že var(X + a*Y) = var(X)+ a²*var(Y)
Pokud je <math>Cov(X,Y) = 0</math> jsou X a Y nezávislé náhodné veličiny.
<math> var(X + a*Y) = Cov(X,X) + 2*Cov(X,aY) + Cov(a*Y,a*Y) = Cov(X,X) + 2a*Cov(X,Y) + a^2*Cov(Y,Y)=.. </math>
⇒ pokud jsou X a Y nezavisle, je Cov(X,Y) = 0, tzn nam vypadne ⇒
<math> ..= Cov(X,X) + a^2 *Cov(Y,Y) = var(X)+ a^2 *var(Y) </math>
Máme definovanou hustotu pravděpodobnosti X, <math>f_{X}(x) = {1\over \sqrt{2\pi}} e^{-\left({x^2\over2}\right )}</math>, x <math>\in</math> R. Jaká je hustota pravděpodobnosti <math>Y = a^2X-2</math>, a>0?
Je videt ze je to definice hustotu pro normalni rozdelni a samozrejmne vime <math>\mu = 0</math> a <math>\sigma^2 = 1</math>
= \frac{3}{2} \cdot \left [(\frac{1}{4}+\frac{(1+p)}{5}) - (\frac{1}{4}-\frac{(1+p)}{5}) \right ] = \frac{3}{2} \cdot 2 \cdot \frac{(1+p)}{5} = \frac{3 \cdot (1+p)}{5}
</math>
<math>
EX^2 = \int_{-1}^{1} x^2 \cdot (\frac{3}{2}(x^2+(1+p)x^3)) dx = \frac{3}{2} \cdot \int_{-1}^{1} (x^4+(1+p)x^5)) dx = \frac{3}{2} \cdot \left [\frac{x^5}{5}+\frac{(1+p)x^6}{6} \right ]_{-1}^1 =
= \frac{3}{2} \cdot \left [(\frac{1}{5}+\frac{(1+p)}{6}) - (-\frac{1}{5}+\frac{(1+p)}{6}) \right ] = \frac{3}{2} \cdot \frac{2}{5} = \frac{3}{5}
</math>
<math>
m_1 = \frac{3 \cdot (1+p)}{5}
;
m_2 = \frac{3}{5}
m_1 = \frac{3}{5} + \frac{3}{5} \cdot p
m_1 - \frac{3}{5} = \frac{3}{5} \cdot p
p = \frac{5}{3} m_1 - 1
</math>
f(x)=ax na intervalu (0,1), jinde 0.
Najděte parametr a, distribuční funkci F(x), P(<math>X\in\left(\frac{1}{3};\frac{2}{3}\right)</math>).
<math>\int_{-\infty}^{\infty} f(x) = \int_{0}^{1} a.x_{dx} = a.\left[\frac{x^2}{2}\right]_0^1 = \frac{a}{2}</math>
<math>\int_{-\infty}^{\infty} f(x) = 1 \Rightarrow \frac{a}{2} = 1 \Rightarrow a = 2</math>
<math>\int_{-\infty}^{\infty} f(x) = \int_{0}^{1} 2x = x^2</math> (platí pouze pro (0;1), bylo potřeba napsat jak to vypadá jinde)
c=1/3, d=2/3 dosadit a vypočítat ?. Ano, buď integrovat f(x) v mezích, nebo dosadit do F(x).
Máme definovanou sdruženou hustotu pravděpodobnosti, x <math>\in</math> R, y > 0. <math>f_{X,Y}(x, y) = {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}</math>
Jsou-li náhodné veličiny X, Y nezávislé, pak platí <math>f_{X,Y}(x,y) = f_X(x) f_Y(y)</math>. Najdeme marginální hustoty a ověříme.
Poznámka: <math>\varphi(x)</math> značí hustotu standardního normálního rozdělení.
<math>
\begin{align*}
f_X(x) &= \int_0^\infty f_{X,Y}(x,y) \text{ d}y
&= \int_0^\infty {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}\text{ d}y
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \int_0^\infty e^{-y}\text{ d}y
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \left[ -e^{-y} \right ]_0^\infty
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} \left( 0 - (-1) \right )
&= {1\over \sqrt{2\pi}}e^{-{x^2\over2}}
\end{align*}
</math>
<math>
\begin{align*}
f_Y(Y) &= \int_{-\infty}^\infty f_{X,Y}(x,y) \text{ d}x
&= \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}\text{ d}x
&= \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-{x^2\over2}} e^{-y}\text{ d}x
&= e^{-y} \int_{-\infty}^\infty {1\over \sqrt{2\pi}} e^{-{x^2\over2}}\text{ d}x
&= e^{-y} \int_{-\infty}^\infty \varphi(x) \text{ d}x
&= e^{-y}
\end{align*}
</math>
<math>
\begin{align*}
f_X(x) f_Y(y) &= {1\over \sqrt{2\pi}}e^{-{x^2\over2}} e^{-y}
&= {1\over \sqrt{2\pi}} e^{-\left({x^2\over2} + y \right )}
&= f_{X,Y}(x,y)
\end{align*}
</math>
X a Y jsou nezávislé.
<math>
\begin{align*}
f_{Y|X}(y|x) &= {f_{X,Y}(x,y) \over f_X(x)}
&= {f_X(x) f_Y(y) \over f_X(x)}
&= f_Y(y)
\end{align*}
</math>
<math>
\begin{align*}
\mathbf{E}(Y|X = x) &= \int_{0}^\infty y f_{Y|X}(y|x) \text{ d}y
&= \int_{0}^\infty y f_Y(y) \text{ d}y
&= \int_{0}^\infty y e^{-y} \text{ d}y
&= 1
\end{align*}
</math>
Hustota náhodné veličiny X je definována na intervalu (2, 3) jako f(x) = k*x*(x-2), jinak f(x)=0.
<math>1)\ \ \int_2^3 kx(x-2)\, \mbox{d}x = 1</math>
…
<math>\frac{4}{3}k = 1</math>
<math>k = \frac{3}{4}</math>
<math>2)\ \ EX = \int_{-\infty}^\infty xf(x)\, \mbox{d}x = \int_2^3 kx^2(x-2)\, \mbox{d}x = \frac{3}{4}\int_2^3 x^3-2x^2\, \mbox{d}x = \frac{3}{4}\left[\frac{x^4}{4}-\frac{2x^3}{3}\right]^3_2 = \frac{3}{4}\left(\frac{81}{4}-18-4+\frac{16}{3}\right) = \frac{43}{16} = 2.6875</math>
<math>3)\ \ P(X < E(X)) = \int_{-\infty}^{E(X)} f(x)\, \mbox{d}x = \int_2^{\frac{43}{16}} \frac{3}{4}x(x-2)\, \mbox{d}x = \ldots = \frac{7139}{16384} = ,43572998046875</math>
Sdružená diskrétní hustota pravděpodobností náhodných veličin X a Y má tvar
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 0.12 | 0.09 | 0.06 | 0.03 |
2 | 0.28 | 0.21 | 0.14 | 0.07 |
1. Posčítat čísla v řádcích a sloupcích. Tzn.:
P(X = 1) = 0,12 + 0,09 + 0,06 + 0,03 = 0,30
P(X = 2) = 0,28 + 0,21 + 0,14 + 0,07 = 0,70
P(Y = 1) = 0,12 + 0,28 = 0,40
P(Y = 2) = 0,09 + 0,21 = 0,30
P(Y = 3) = 0,06 + 0,14 = 0,20
P(Y = 4) = 0,03 + 0,07 = 0,10
2. Potvrdit, že vynásobení čísel v řádcíh a sloupcích daj dohromady číslo v pruniku = nezávislé
3. Na napocitane marginalni rozdeleni spocitame stredni hodnoty EX, EY a EXY, ktere potrebujeme na cov.
<math>
EX =1\frac{3}{10} + 2 \frac{7}{10} = \frac{17}{10} = 1.7
EY =1\frac{4}{10} + 2 \frac{3}{10} + 3\frac{2}{10} + 4 \frac{1}{10} = \frac{20}{10} = 2
EXY = 1\frac{12}{100} + 2 \frac{9}{100} + 3\frac{6}{100} + 4 \frac{3}{100} + 2\frac{28}{100} + 4 \frac{21}{100} + 6\frac{14}{100} + 8 \frac{7}{100} = \frac{340}{100} = 3.4
cov(X,Y) = EXY - EXEY = 3.4 - 2 \cdot 1.7 = 0
</math>
(bez počítání - jsou nezávislé, takže cov(X, Y)=0)
Sdružená diskrétní hustota pravděpodobností náhodných veličin X a Y má tvar
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
2 | 0.08 | 0.04 | 0.12 | 0.16 |
4 | 0.12 | 0.06 | 0.18 | 0.24 |
1. Opět jen posčítat čísla v řádcích a sloupcích:
P(X = 2) = 0,4
P(X = 4) = 0,6
P(Y = 1) = 0,2
P(Y = 2) = 0,1
P(Y = 3) = 0,3
P(Y = 4) = 0,4
2. Pokud pro všechny x,y platí, že P(X=x, Y=y) = P(X=x) · P(Y=y), pak jsou nezávislé. Např. P(X=2, Y=1) = 0,08. P(X=2)·P(Y=1) = 0,4·0,2 = 0,08. Tady to platí u všech ⇒ jsou nezávislé.
3. Pokud jsou nezávislé tak je cov(X,Y)=0
Uvažujme náhodný výběr n=36 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako <math>\overline{x}</math>=7.3 a s=2,5 (Hodnotí se správné dosazení do vzorců).
V intervalovém odhadu zjišťujeme interval, ve kterém bude hodnota parametru ležet s určitou pravděpodobností. Zde máme zadanou pravděpodobnost 90%.
Takže máme tedy:
<math> n = 36 </math>
<math> \overline{x} = 7,3 </math>
<math> s = 2,5 </math>
<math> p = 0,9 </math>
z p = 0,9 uděláme <math>\alpha = 1 - 0,9 = 0,1</math>
Nejprve si spočítáme oboustranný interval. K tomu nám poslouží vzoreček, který si pak dále rozebereme:
<math>(\overline{x} - \delta, \overline{x} + \delta)</math>, kde <math>\delta = t_\alpha^n * \frac{s}{\sqrt{n}}</math>. s, n i p máme zadané, takže zde asi žádný problém. Teď jak najít to t s těmi indexy.
<math>t_\alpha^n = T_{\frac{\alpha}{2}}^{n - 1}</math>.
Dosadíme:
<math>T_{0,05}^{35}</math>, a to už najdeme v tabulce t-rozdělení (někdy nazýváno studentovo rozdělení).
Hodnota tam je bohužel jen pro 34 a 36, takže tyto dvě zprůměrujeme. V písemce to samozřejmě nemusí vyjít úplně přesně, když se váš výsledek bude lišit o pár desetinných míst, body by se strhávat neměly. Vyjde nám tedy
<math>T_{0,05}^{35} = 2,724</math> EDIT: Spatne vyctena hodnota z tabulek. Ma byt mezi 1,691 a 1,688 tedy 1,6895.
Teď už krásně dopočítáme i tu deltu:
<math>\delta = 1,6895 * \frac{2,5}{6} = 0,704</math>
A oboustranný interval tak vychází
<math>(6,596; 8,004)</math>
Jednostranný je podobný, jen se malinko liší výpočet T, kde se dolní index nedělí dvěma. Teď už prostý výpočet bez komentáře:
<math>t_p^n = T_{\alpha}^{n - 1} = T_{0,1}^{35} = 2,03</math>
Jeden jednostranný interval:
<math>(-\infty; 9,33)</math>
A druhý:
<math>(5,27; \infty)</math>
Tady je to podobné, jen použijeme jiný vzorec a jinou tabulku.
<math>(\frac{(n - 1) * s^2}{\chi_{1 - \frac{\alpha}{2}}^2 (n - 1)}; \frac{(n - 1) * s^2}{\chi_{\frac{\alpha}{2}}^2 (n - 1)})</math>
Pozn.: Vypadá to jako X, ale je to chí, bacha na to. Ty nožičky to má na každé straně trošku zakroucené.
Takže pro úplnost:
Dosadíme…:
<math>(\frac{218,75}{\chi_{0,95}^2 (35)}; \frac{218,75}{\chi_{0,05}^2 (35)})</math>
Mrkneme se do tabulky chí-kvadrátu a dopočítáme.
Máme normální rozdělení X s rozptylem 9 (2. zadání: 4).
Protože neznáme n(které tedy chceme zjistit), musíme použít z rozdělení. <math> \bar{x} + z \cdot \frac{s}{\sqrt{n}}</math>
Protože víme, že krajní bod je od střední hodnoty vzdálen 0.84, tak už stačí jen řešit rovnici.
<math> z \cdot \frac{s}{\sqrt{n}} = 0.84</math>
<math> \frac{s \cdot 100 \cdot z}{84} = \sqrt{n}</math>
<math> \frac{s \cdot 100 \cdot 1.96}{84} = \sqrt{n}</math>
<math> 7 = \sqrt{n}</math>
<math> n = 49</math>
Víme, že krajní bod intervalu leží 0.84 od střední hodnoty, takže stačí pouze odečíst od střední hodnoty vzdálenost a dostaneme krajní bod intervalu.
<math> \bar{x} - 0.84 = 1.16 </math>
výsledný interval je tedy <math>(1.16, +inf)</math>
??? Neměl by být pravostranný interval spíše od <math>(-inf, \bar{x} - \delta)</math> ??? Viz např. http://www.math.muni.cz/~pokora/vyuka/IS_text.pdf
V tom případě by to bylo <math>(-inf, 1.16)</math>
blbost A když už by jsi chtěl dolní tak bude <math>(-inf, 2,84)</math>
Uvažujme náhodný výběr <math>n = 16</math> napozorovaných hodnot z normálního rozdělení. Výběrový průměr a součet kvadrátů napozorovaných hodnot jsme spočetli jako <math>\overline{X} = 11</math> a <math>\normalsize\sum\nolimits_{i=0}^{16}x_i^2 = 1952</math>.
V odpovědích níže nemusíte přesně numericky dopočítat krajní body intervalů, ale musíte dosadit správné numerické hodnoty do správných vzorců.
μ
s věrohodností 99 %.σ²
s věrohodností 99 %.1)
Tady je trochu zrada v tom, že nemáme zadanou směrodatnou odchylku, která je pro výpočet potřeba. Takže si musíme pamatovat další vzorec, který kromě zkoušky z PST uplatníme ještě u státnic.
Směrodatnou odchylku spočítáme <math>s = \sqrt{\frac{1}{n - 1}3)dx + \int_1^2 x\cdot a dx</math>
Vysledek = 1/2 viz mathematica
3. (Spočtěte P(x < 4/3).)
<math>P = \int_0^14)dx + \int_1^{\frac{4}{3}} a dx</math>
Pozn. Pokud vime jak funkce vypada (dokazem to nakreslit), tak si muzeme vybrat jakej obsah pod krivkou budem pocitat (logicky to jednodussi). Takze v tomhle pripade je to urcite P(x < 4/3) = 1 - P(x > 4/3) = 1 - a*(2 - 4/3).
Sdružená hustota pravděpodobnosti náhodných veličin X a Y má tvar
1.
<math> f_x(x)= \int_x^\infty \left(\lambda^{2} e^{-\lambda y}\right)\mbox{d}y = \lambda^{2} \int_x^\infty \left(e^{-\lambda y}\right)\mbox{d}y = \lambda^{2} \left[\frac{e^{-\lambda y}}{(-\lambda y)'}\right]^{\infty}_{x} = \lambda^{2} \left[\frac{e^{-\lambda y}}{-\lambda}\right]^{\infty}_{x} = \lambda^{2} \left(0 + \frac{1}{\lambda e^{\lambda x}}\right) = \lambda e^{-\lambda x}</math>
W.A.: Integrate[lambda^2 * e^(-lambda*y), {y, x, infinity}]
Souhlasím.
2.
<math>f_{y|x}(y,x)=\frac{f_{x,y}(x,y)}{f_{x}(x)} = \frac{\lambda^{2} e^{-\lambda y}}{\lambda e^{-\lambda x}}= \lambda e^{-\lambda y}e^{\lambda x} = \lambda e^{\lambda(x-y)}</math>
<math> \\f(x) = \left\{ \begin{array}{1 1}
a& \quad \mbox{pro 0 \leq x \leq 1}\\ (x-3)*(x-1) + 1 & \quad \mbox{pro 1 \leq x \leq 2}\\ 0& \quad \mbox{jinak}\\ \end{array} \right. \
</math>
Výletní loď má kapacitu 40 pasažérů. Hmotnost lidí má střední hodnotu <math>\mu = 80 kg </math>a směrodatnou odchylku <math>\sigma = 20 kg</math>.
1. Určete střední hodnotu a rozptyl celkové hmotnosti pasažérů při naplnění kapacity lodi.
<math>EX = n\cdot \mu = 40 \cdot 80 = 3 200
varX = n \cdot \sigma^2 = 40 \cdot 20^2 = 16 000 </math>
podle mě by to mělo být spíš takhle:
X - hmotnost jednoho pasažéra
<math>EX = 80 </math>
<math>
sqrt(var X) = 20
var X = 20^2 = 400
</math>
Y - součet hmotností pasažérů
<math>
Y=40X
EY = E(40 X) = 40*EX = 40*80 = 3200</math> (linearita střední hodnoty)
<math> var Y = var(40 Y)=40^2 var X = 1600*400 = 64000</math> (protože var (a X + b) = a^2 var(X))
2. Na jakou hmotnost je potřeba loď zkonstruovat, aby se na 99 % při plném obsazení nepotopila? Použijte CLV!
<math> \frac{n - 3200}{sqrt (16000)} = 2.33 </math> ( 2.33 je z tabulky normalniho rozdeleni pro 0.99)
n = 3495 kg
pokud je rozptyl 64000, tak by to bylo
<math> \frac{n - 3200}{sqrt (64000)} = 2.33 </math> ( 2.33 je z tabulky normalniho rozdeleni pro 0.99)
<math> n = 2.33sqrt(64000) + 3200 = 3789 </math>
<math>f_{X}(x) = \int_x^\infty (f_{X,Y} (x,y))dy</math>
<math>f_{Y|X} (x|y) = \frac{f_{X,Y} (x,y)}{f_{Y}(y)}</math> Pozn. Za tohle bych ruku do ohne opravdu nedal.
Uvažujeme náhodnou veličinu X mající normální rozdělení s rozptylem sigma^2 = 6. Chceme odhadnout její střední hodnotu mí s pomocí oboustranného 99% konfidenčního intervalu délky 2,524
1.
Prosím potvrdit.
<math>k = \frac{1-0,99}{2}</math>
<math>2,254 = 2*Z_{k}\frac{sqrt{6}}{sqrt{n}}</math>
V tabulce normálního rozdělení hledáme hodnotu pro <math>0,5 - k</math> tedy pro <math>0,495 ⇒ Z_k=2,58</math>
… upravíme …
<math>n=31,4=\approx31</math>
alternativa: mě z toho vzorce teda vyšlo n=25 a vyšlo to hodně přesně, takže by to mohlo být správně. Nesplet ses někde v tom výpočtu?
2.
Prosím potvrdit. / Souhlasím s výpočtem, jedná se o poměrně častý příklad, objevující se i v předchozích zadáních
<math>\delta=T_{tab}(n-1;\frac{1-p}{2})*\frac{sqrt{s}}{sqrt{n}}</math>
Z předchozího bodu víme, že <math>n=31</math>
<math>\delta=T_{tab}(31-1;\frac{1-0,90}{2})*\frac{sqrt{6}}{sqrt{31}}</math>
<math>T_{tab}=1,697</math>
… upravíme …
<math>\delta=0,747</math>
Výsledný oboustranný interval: <math>(1,5-0,747;1,5+0,747)</math>
Poznámka: proč používat T-rozdělení když víme rozptyl?. IMO by se měla hodnota hledat v N tabulce
Poznámka 2: Souhlasím s předchozí poznámkou. Při použití správného n=25 z prvního podpříkladu a tabulky normálního rozdělení mi vychází <math>(1.5-1.65\frac{\sqrt{6}}{\sqrt{25}}; 1.5+1.65\frac{\sqrt{6}}{\sqrt{25}}) = (0.692; 2.308)</math>
Loď má kapacitu 50 míst, hmotnost cestujících je proměná s odchylkou 20 a středem v 80KG.
20 je smerodajná odchýlka!! Teda rozptyl je 20^2
V aerodynamickém tunelu byl testován nový typ automobilu na aerodynamický odpor. Při rychlosti x_i km/h byla 5 krát měřena odporová síla y_i v Newtonech. Jelikož očekáváme, že závislost odporové síly na rychlosti je kvadratická, vezměme model <math>y_i = \gamma_0 + \gamma_2x_i^2+\epsilon_i</math> , <math> i = 1,…,n</math>
s normálně rozdělenými chybami <math>\epsilon_i</math>.
Data byla zpracována jako:
<math> \sum_{i=1}^{5}x_i = 300</math>
<math> \sum_{i=1}^{5}x_i^2 = 22 000 </math>
<math> \sum_{i=1}^{5}y_i = 650 </math>
<math> s_x^2 = \frac{1}{4} \sum_{i=1}^{5}(x_i - \overline{x})^2 = 1 000</math>
<math> s_{x^2}^2 = \frac{1}{4} \sum_{i=1}^{5}(x_i^2 - \overline{x^2})^2 = 15 000 000</math>
<math> s_y^2 = \frac{1}{4} \sum_{i=1}^{5}(y_i - \overline{y})^2 = 13 000</math>
<math> S_{X,Y} = \frac{1}{4} \sum_{i=1}^{8}(x_i - \overline{x})(y_i - \overline{y}) = 3 500</math>
<math> S_{X^2,Y} = \frac{1}{4} \sum_{i=1}^{8}(x_i^2 - \overline{x^2})(y_i - \overline{y}) = 450 000</math>
Pri testu Blazek napsal na tabuli, ze vsechny sumy v tomto prikladu jsou pro i od 1 do 5, tedy i ty dve vyse.
<math>\gamma_{2} = \frac{S_{X^2,Y}}{s_{X^2}^2} =\frac{450000}{15000000} = 0.03</math>
<math>\overline{y} = \frac{\sum_{i=1}^{5}y_i}{n} = \frac{650}{5} = 130</math>
<math>\overline{x^2} = \frac{\sum_{i=1}^{5}x_i^2}{n} = \frac{22000}{5} = 4400</math>
<math>\gamma_{0} = \overline{y} - \gamma_{2}*\overline{x^2} = 130 - {0.03 * 4400} = -2</math>
<math>\rho_{X,Y} = \frac{S_{X^2,Y}}{s^2_{X^2} * s^2_{Y}}</math> Je toto spravne? Nemelo by byt: <math>\rho_{X,Y} = \frac{S_{X,Y}}{s^2_{X} * s^2_{Y}}</math>? Já jsem spíše pro <math>\rho_{X,Y} = \frac{S_{X,Y}}{s_{X} * s_{Y}}</math>.
<math>x = 100</math>
<math>y = \gamma_{0} + \gamma_{2}*x^2</math>
Bezpečnostní senzor pravidelně monitoruje počítačovou učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X = W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem sigma^2 = 1,63. V případě pohybu zařízení vrací signál X = W + theta, kde theta >0 je neznámá konstanta. Na základě n = 49 nezávislých pozorování jsme spočetli konfidenční intervaly pro mí = EX takto:
90% interval A: (0,0569; 0,6033) 95% interval B: (0,0026; 0,6576)
Hypotézy, vyvrátit/potvrdit
*nevím skupinu, ani přesná čísla, ale bylo to zhruba takto: (Variace na 7.př z 21.5.2012)
H0: μ=0 , Ha: μ>0 K tomu jsou zadané dva intervaly A(-0,123; 2,123)(90%) a B(-3,123; 5,123)(95%)
a) otestujte hypotezu + zdůvodnit, chyba prvního druhu má být max 5%
μ=0 leží v obou intervalech, takže H0 nelze zamítnout.
b) Který z intervalů jste použili a proč
Ha: μ>0 … takže se to testuje jen jednostranně, pro chybu max 5% lze použít oba intervaly. To bych moc neřekl že se dají využít oba intervaly .. dá se využít jen ten A
Na třech výrobních linkách jsou vyráběny výrobky. První linka zajišťuje 50% produkce a ppst. vzrobení vadného výrobku je 1%, druhá linka zajišťuje 30% produkce a ppst vyrobení vadného výrobku je 2% a třetí linka zajišťuje 20% produkce a ppst vyrobení vadného výrobku je 3,5%. Určete ppst., že náhodně vybraný vadný výrobek pochází z 2. linky.
<math>P(1L)=\frac{5}{10}</math>
<math>P(2L)=\frac{3}{10}</math>
<math>P(3L)=\frac{2}{10}</math>
<math>P(V|1L)=\frac{1}{100}</math>
<math>P(V|2L)=\frac{2}{100}</math>
<math>P(V|3L)=\frac{35}{1000}</math>
<math>P(2L|V)=\frac{P(2L)P(V|2L)}{P(1L)P(V|1L)+P(2L)P(V|2L)+P(3L)P(V|3L)}</math>
<math>P(2L|V)=\frac{\frac{3}{10}.\frac{2}{100}}{\frac{5}{10}.\frac{1}{100}+\frac{3}{10}.\frac{2}{100}+\frac{2}{10}.\frac{35}{1000}} = \frac{6}{18} = \frac{1}{3}</math>
Nechť náhodné veličiny X,Y jsou výsledky dvou nezávislých hodů vyváženou čtyřstěnnou hrací kostkou.
info: jestli je tohle (1.+2.) řešení ne/správné zjistím zítra a případně ho smažu. Pokud už ale někdo ví teď, že je blbe, nechť prosím zasáhne, ať to nemate ostatní. Díky.
Počet možností jak hodit dvěma kostkama je 4*4, viz nasledující tabulka. Ve vnitřku tabulky je napsané Z, tj. minimum z toho hodu. Vim, dost primitivní tabulka, ale je to snad názorné.
X\Y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 1 | 1 | 1 | 1 |
2 | 1 | 2 | 2 | 2 |
3 | 1 | 2 | 3 | 3 |
4 | 1 | 2 | 3 | 4 |
P(X,Y) =?= P(X) * P(Y)
P(X = 1, Y = 1) = 1/16
P(X = 1) = 4/16 = 1/4
P(Y = 1) = 4/16 = 1/4
1/16 == 1/4 * 1/4
P(X = 2, Y = 1) = 1/16
P(X = 2) = 4/16 = 1/4
P(Y = 1) = 4/16 = 1/4
1/16 == 1/4 * 1/4
P(X = 3, Y = 1) = 1/16
P(X = 3) = 4/16 = …
… a takhle porovnat pro všechny možné kombinace
if P(X,Y) == P(X)*P(Y) pro všechny kombinace, then Nezávislé
tak oprava: to, co jsem napsal tady u bodu 3. sice obecně platí, ale v zadání se ptáme jestli jsou X a Z nezávislé. (Z = min(X,Y) - tedy minimum z těch dvou hodů)
Tedy zjišťujeme:
P(X,Z) =?= P(X) * P(Z) ⇒ vyjde, že X a Z nejsou nezávislé VJ's neověřený postup jak spočítat P(X,Z): např. P(X=3,Z=1) ⇔ hledáme, kdy X je pořád rovno 3, a přitom výsledek Z=min(3,Y)=1. Tenhle jev nastává jenom když Y=1, a to může nastat když X=3 jenom jednou. Takže P(X=3,Z=1)=1/16. prosím potvrdit
Nechť X a Y jsou stejně rozdělené nezávislé náhodné veličiny s geometrickým rozdělením s parametrem p∈(0,1)
https://www.facebook.com/groups/141862482499684/permalink/446990938653502
Automat generuje číslice 0 až 9, každou se stejnou pravděpodobností.
Jedná se o binomické rozdělení.
1.)
Střední hodnota pro binomické rozdělení:
<math>EX = n*p = n * \frac{1}{2} = \frac{n}{2}</math>
Rozptyl pro binomické rozdělení:
<math>varX = n*p*(1-p) = n * \frac{1}{2} * \frac{1}{2} = \frac{n}{4}</math>
2.)
Prosím potvrdit.
Vycházel jsem z pst_zkouška_2012-05-21#řešení2.
<math>\alpha = 0,975-0,5 = 0,475</math>
<math>x = 2</math> “Počet sudých čísel”
<math>P(X>n)=1-P(X<n)=1-\frac{x-E(X)}{sqrt{var(X)}}=\alpha</math>
<math>1-\left(\frac{2-\frac{n}{2}}{sqrt{\frac{n}{4}}}\right)=T_{normal}(0,475)</math>
<math>1-\left(\frac{2-\frac{n}{2}}{sqrt{\frac{n}{4}}}\right)=1,96</math> Wolfram
<math>n = 6,43 =\approx 7</math>
Uvažujeme náhodný výběr n = 25 napozorovaných hodnot z normálního rozdělení. Součet napozorovaných hodnot a součet kvadrátů hodnot jsme sopočetli jako <math> \sum_{i=1}^{n}x_i = 250 </math> a <math> \sum_{i=1}^{n}x^2_i = 2509</math> .
1.
<math>\overline{X}=\frac{250}{25}=10</math>
<math>n=25</math>
Nevíme směrodatnou odchylku, tu zjistíme stejně jako zde.
<math>s = \sqrt{\frac{1}{n - 1}5) </math>
<math> -P(X >= x) = - \phi(2)</math>
<math> P(X >= x) = \phi(2) </math>
<math> P(X >= x) = 0.5 + 0.4772 </math>
Rodina má tři malé chlapce, jejichž věk je postupně 3, 21 a 63 měsíců a kteří měří (<math> y_i </math>) 67, 82 a 121 cm. Předpokládejme, že závislost výšky na věku by byla lineární a vezměme model <math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math>, <math> i = 1…n </math> s normálně rozdělenými chybami <math>\epsilon_i</math>. Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>. Z výše uvedených dat jsme získali:
<math> \overline{x} = 30 </math>
<math> \sum_{i=1}^{3}x^2_i = 4446 </math>
<math> \overline{y} = 90 </math>
<math> \sum_{i=1}^{3}y^2_i = 25854 </math>
<math> \sum_{i=1}^{3}x_i y_i = 9747 </math>
(Zadání bylo úplně stejné jako 12.6. - možná tam byla trochu jiná čísla, ale jinak to samé)
pst_zkouška_2012-06-12 - příklad 6
Testování hypotézy
Z n=25 hodnot náhodného výběru z normálního rozdělení jsme spočetli průměr <math> \overline{x} = 2.08 </math> a směrodatnou odchylku <math>s_x = 0,5</math>. Otestujte hypotézu <math>H_0 </math> : μ = 2 versus <math>H_A </math> : μ > 2 tak, aby pravděpodobnost chybného zamítnutí <math>H_0 </math> byla 5%. Vysvětlete detailně své rozhodnoutí.
<WRAP left alert 90%> Původní chybné řešení:
<math>p=90%</math> (Na každé straně potřebujeme 5% - budeme totiž hledat oboustranný interval)
<math>\alpha=\frac{1-p}{2}=\frac{1-0,90}{2}=0,05</math>
<math>\delta=T_{\alpha}^{n-1}*\left(\frac{s}{\sqrt{n}}\right)=T_{0,05}^{24}*\left(\frac{0,5}{5}\right)</math>
Hodnotu T nalezneme v T-Table.
<math>\delta=1,711*0,1=0,1711</math>
<math>\mu=(\overline{x}-\delta; \overline{x}+\delta)=(2,08-0,1711; 2,08+0,1711)=\approx(1,909; 2,251)</math>
Testujeme hypotézu <math>H_0: \mu=2</math>. Leží číslo 2 ve vypočítaném intervalu? ANO, tuto hypotézu tedy nemůžeme zamítnout. </WRAP> <WRAP left download 90%> Oprava:
Měl by se použít jednostranný interval <math>\mu=(\overline{x} -T_{0,05}^{24}*\left(\frac{0,5}{5}\right),+\infty) </math>, což dává <math>(1.9089,+\infty)</math>.
-edit: potvrzuji, že je to správně
Testujeme hypotézu <math>H_0: \mu=2</math>. Leží číslo 2 ve vypočítaném intervalu? ANO, tuto hypotézu tedy nemůžeme zamítnout.
</WRAP>
Poznámka: Nemělo by se počítat s <math>p=95%</math>, když má být 5% pravděpodobnost chybného zamítnutí hypotézy? Odpověď: Jak je výše správně dosazeno - má se použít p=95%, tedy do t Studentova rozdělení dávám hodnotu (1-p), tedy 0,05. Protože hledám (1-p)konfidenční interval.
Testování hypotézy
Z n=25 hodnot náhodného výběru z normálního rozdělení jsme spočetli průměr <math> \overline{x} = 1,94 </math> a směrodatnou odchylku <math>s_x = 0,5</math>. Otestujte hypotézu <math>H_0 </math> : μ = 2 versus <math>H_A </math> : μ < 2 tak, aby pravděpodobnost chybného zamítnutí <math>H_0 </math> byla 10%. Vysvětlete detailně své rozhodnoutí.
jednostranný interval <math>\mu=(-\infty,\overline{x} +T_{0,1}^{24}*\left(\frac{0,5}{5}\right)) </math>, což dává <math>(-\infty,2,0718)</math>
2 leží v intevalu ⇒ h0 NEZAMÍTÁM
Kalkulačky se používat nesmí, 90 minut, tabulky u testu.
Házíme čtyřstěnnou kostkou (1 - 4 tečky). Házíme 2x. Pokud je součet teček větší než 4, již neházíme. Pokud ne, máme jěště jeden hod. Jaká je pravděpodobnost, že součet je alespoň 6?
pravděpodobnost toho, že nám padne alespoň součet 6 ve dvou hodech + pravděpodobnost, že nám padne součet 6, když předtím házíme součty pod 4 = 38/64 = 19/32
pravděpodobnost že hodíme více jak šest v prvních dvou hodech +
pravděpodobnost že hodíme 2 a v třetím 4 +
pravděpodobnost že hodíme 3 a v třetím 3 || 4 +
pravděpodobnost že hodíme 4 a v třetím 2 || 3 || 4
X je náhodná veličina s husotou f(x) = 1 - Cx na intervalu [0,2]
<math>Cov(Y,Z) = 0 - E(Y)E(Z) = -2</math>
S100 je počet hodů panen ve 100 hodech. Máme vyváženou minci, použijte centrální limitní větu. Vypočítejte pravděpodobnosti:
Binomické rozdělení - Bernoulliho schéma
N(EX,VARX)
EX=n*p
VARX=n*p*(1-p)
<math>P(x⇐A)=\Phi (\frac{A - EX}{\sqrt{VARX}})</math>
N(100*<math>\frac{1}{2}</math>,100*<math>\frac{1}{4})</math>
A=45
<math>P(x⇐45)=\Phi (\frac{45 - 50}{\sqrt{25}})=\Phi (-1)=0.5-\Phi (1)</math>
což se rovná 0,1587 → 16%
Moivreova-Laplaceova věta
<math>Zn= (\frac{Sn - n*\mu}{\sigma*\sqrt{n}})</math>
Sn=45
n=100
<math>\mu=\frac{1}{2}</math>
<math>\sigma^2=\frac{1}{4}</math>
SUM (1⇐i⇐45) (100 nad i) * <math>0.5^i</math> * <math>0.5^{100-i}</math> = 18 %
Jedná se o symetrické rozdělení se střední hodnotou 50. V předchozím případě jsme spočítali, že méně než 45 hodů je pouhých 16%, což je ale to samé jako na druhé straně, tedy více jak 55 hodů. Takže dohromady máme na tento interval 68%. Ověřeno i předchozím postupem.
Uvažujme náhodný výběr n=16 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako <math>\overline{x}</math>=10.3 a s=1,2 (Hodnotí se správné dosazení do vzorců).
Studentovo rozdělení
<math>\overline{x} \pm T_{(\frac{\alpha}{2},n-1)} . \frac{s}{\sqrt{n}}</math>
<math>\alpha = 1-0.99 = 0.01</math>
hledáme: <math>T_{(0.005,15)}=2.947</math>
<math>10.3 \pm 2.947 . \frac{1.2}{4} = 10.3 \pm 0.8841</math>
<math>\frac{(n-1).s^2}{\chi_{(\frac{\alpha}{2},n-1)}^2} \le \sigma^2 \le \frac{(n-1).s^2}{\chi_{(1-\frac{\alpha}{2},n-1)}^2}</math>
<math>\frac{(15).1,44}{\chi_{(0.005,15)}^2} \le \sigma^2 \le \frac{(15).1,44}{\chi_{(1-0,005,15)}^2}</math>
<math>\frac{(15).1,44}{32,8} \le \sigma^2 \le \frac{(15).1,44}{4,6}</math>
<math>0.658 \le \sigma^2 \le 4.695</math>
Uvažujme lineární model
<math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math> pro i=1,…,n
s normálně rozdělenými chybami <math>\epsilon_i</math>. Pro n=100 napozorovaných párů hodnot (<math>x_i</math>,<math>y_i</math>) jsme spočetli:
<math> \overline{x}=10 \Rightarrow (s_x)^2=\frac{1}{99} \sum_{n=1}^{100} (x_i-\overline{x})^2=1.2 </math>
<math>\overline{y}=158.3 \Rightarrow (s_y)=\frac{1}{99} \sum_{n=1}^{100} (y_i-\overline{y})=19.6 </math>
<math>S_{x,y}=\frac{1}{99} \sum_{n=1}^{100} (x_i-\overline{x})(y_i-\overline{y})=19.4</math>
Najděte správné odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>.
<math>\beta_1 = \frac{S_{x,y}}{(S_x)^2} = 16,1666</math>
<math>\beta_0 = \overline{y} - \beta_1 \overline{x} = -3,36</math>
Bezpečnostní senzor pravidelně monitoruje PC učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X=W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem <math>\sigma^2</math> 2,3. V případě pohybu zařízení vrací signál X=W+O, kde O>0 je neznámá konstanta. Na základě n=35 nezávislých pozorování jsme spočetli konfidenční intervaly pro <math>\mu</math>=35:
90% interval A (0,405456;5,394544)
95% interval B (-0,07243255;587243255)
Rada: jednostranná altervativa
2. interval A: alfa=0.05 100%-90%=10% /2 → 5%
řešení by Ondra Chochola :)
v zadani bylo, ze to jsou konfidencni inervaly pro u (<math>\mu</math>, str. hodnotu).
Protoze je to jednostranny test, je potreba dostat 95% JEDNOSTRANNY int.
spolehlivost. (ze zadano vyplyva, ze na kazdou stranu intervalu A je 5%,
tj. kdyz vezmu interval (0,405456;infinity) tak mam 95% spolehlivost.
Protoze tam 0 nespadne, tak zamitam <math>H_0</math> (s max chybou 5%).
Odpovida to na 1) i 2)
Zdravi Ondra
pozn.: díííííííííky! Nikdo jsme si s tím nevěděl rady!
zkoušky předměty škola s_řešením
Házíme 2x vyváženou (férovou) čtyřstrannou kostkou. Je-li Xi výsledek i-tého hodu, i = 1,2, určete Podmíněnou pravděpodobnost P(max(x1, x2) = m | min(x1, x2) = n) pro všechna m,n = {1,2,3,4}
n \ m | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 1/7 | 2/7 | 2/7 | 2/7 |
2 | 0 | 1/5 | 2/5 | 2/5 |
3 | 0 | 0 | 1/3 | 2/3 |
4 | 0 | 0 | 0 | 1 |
Vycházíme z tabulky všech možných výsledků pro dva hody.
Např. pro podmínku <math>min(x1, x2) = 2</math> bereme jako množinu všech výsledků jen <math>\{22, 23, 24, 32, 42\}</math>.
11 | 12 | 13 | 14 |
21 | 22 | 23 | 24 |
31 | 32 | 33 | 34 |
41 | 42 | 43 | 44 |
<math>
P(max(x1, x2) = 1 | min(x1, x2) = 2) = 0
P(max(x1, x2) = 2 | min(x1, x2) = 2) = 1/5
P(max(x1, x2) = 3 | min(x1, x2) = 2) = 2/5
P(max(x1, x2) = 4 | min(x1, x2) = 2) = 2/5
</math>
A takto je to správně. Pokud dosadíme do definice podmíněné pravděpodobnosti, tak např.
<math>
P(max(3, 2) | min(3, 2)) = \frac{P(max(3, 2) \cap min(3, 2))}{min(3, 2)}
\frac{\frac{2}{16}}{\frac{5}{16}} = \frac {2}{5}
</math>
Posluchači mají tendenci vynechávat cvičení při hezkém počasí: každý student přijde (nezávisle na ostatních) s prvděpodobností Ph při hezkém počásí a Ps při škaredém počasí. Učitel je rozhodnut, že cvičení zruší, pokud přijde méně než k z n zapsaných studentů
Binomická náhodná veličina
<math>
P(A) = \sum_{k \leq i \leq n} {n \choose i} (p_h)^i(1-p_h)^{n-i}
P(B) = \sum_{k \leq i \leq n} {n \choose i} (p_s)^i (1-p_s)^{n-i}
P(C) = \frac{1}{3}*P(A) + \frac{2}{3}*P(B)
</math>
P že se cvičení bude konat je P že příjde k nebo více studentů. P že příjde k určitých studentů a zbytek nepřijde <math> p_h^k(1-p_h)^{n-k} </math> ale nam je jedno kterých studentů tudíž musime započítat každou jejich kombinaci <math> {n \choose k} p_h^k(1-p_h)^{n-k} </math> nyní máme pravděpodobnost že přijde přesně k nějakých studentů. Teď tento vzorec použijeme na všechny vyhovující počty studntů tj od k včetně do n včetně a máme výsledek.
Náhodná veličina Y má normální rozdělení s rozptylem o^2 = 1.96^-2. Potřebujeme odhadnout její střední hodnotu pomocí 95% konfidenčního intervalu šířky 0.01. Jak veliký výběr budeme potřebovat?
Možný postup, asi ale nejde pořádně dopočítat.
<math>
\bar{x} \pm t_{\frac{\alpha}{2},n-1}\frac{s}{\sqrt{n}}
2t_{0.025,n-1}\frac{1.96^{-1}}{\sqrt{n}} = 0.01
t_{0.025,n-1}\frac{1.96^{-1}}{\sqrt{n}} = 0.005
n = (t_{0.025,n-1}\frac{1.96^{-1}}{0.005})^2
</math>
Jiné řešení:
Jelikož je zadaný rozptyl, používá se normální rozdělení a ne studentovo rozdělení a to <math>z_{\alpha/2}</math>, což si dohledám v tabulce jako 0,475 což je 1,96.
<math>
\bar{x} \pm z_{\frac{\alpha}{2}}\frac{s}{\sqrt{n}}
2z_{0.025}\frac{1.96^{-1}}{\sqrt{n}} = 0.01
z_{0.025}\frac{1.96^{-1}}{\sqrt{n}} = 0.005
1,96*\frac{1.96^{-1}}{\sqrt{n}} = 0.005
\frac{1.96}{1,96 * \sqrt{n}} = 5/1000
\frac{1}{\sqrt{n}} = 5/1000
\sqrt{n} = 200
n = 40 000
</math>
Vodárenská společnost potřebuje odhadnout vztah mezi teplotou během letních dnů a denní spotřebou vody na osobu. Pro den i označme teplotu a spotřebu vody jako (<math>x_i, y_i</math>) v daném pořadí. Uvažujeme lineární model
<math> y_i = \beta_0 + \beta_1 + \eps_i, i = 1 …, n </math>
s normálně rozdělenými chybami <math>\eps</math>. Společnost měřila teploty a spotřebu během 49 dní a spočetla
<math> \overline{x} = 20 </math> <math> s_x = \sqrt{\frac{1}{48} \sum_{i=1}^{49} (x_i - \overline{x})^2} = 4 </math>
<math> \overline{y} = 280 </math> <math> s_y = \sqrt{\frac{1}{48} \sum_{i=1}^{49} (y_i - \overline{y})^2} = 20 </math>
<math> S_{X,Y} = \frac{1}{48} \sum_{i=1}^{49} (x_i - \overline{x})(y_i - \overline{y}) = 12 </math>
Najděte odhady parametrů <math>\beta_0</math> a <math>\beta_1</math>.
<math> \beta_1 = \frac{S_{X,Y}}{s_x^2} = \frac{12}{16} = 3/4 </math>
<math> \beta_0 = \overline{y} - \beta_1\overline{x} = 280 - \frac{3}{4}20 = 265 </math>
Téměř stejné jako u předchozí zkoušky, najít B0 a B1
Řešení podle vzorečků z přednášky 12, slide 5.
Téměř stejné jako u předchozí zkoušky - zdůvodnit výběr intervalu, otestovat hypotézu.
škola zkoušky předměty
Pokud vím, tak byla jen jedna skupina, na písemku bylo 90 minut. Nesměly se používat kalkulačky ani jiné pomůcky (kromě statistických tabulek, které byly před zkouškou rozdány).
15%
Ve tride je 16 studentu; 12 chlapcu a 4 divky
Jaka je pravdepodobnost, ze pri nahodnem rozdeleni na 4 skupiny po ctyrech bude v kazde skupine jedna divka?
Napoveda: pouzijte multiplikativni zakon
<math>\frac{576}{5915} = 0,097379544 = 10%</math> (?)
<math> \frac{ {12\choose{3}} {4\choose{1}} }{ {16\choose{4}} }. \frac{ {9\choose{3}} {3\choose{1}} }{ {12\choose{4}} }. \frac{ {6\choose{3}} {2\choose{1}} }{ {8\choose{4}} }. \frac{ {3\choose{3}} {1\choose{1}} }{ {4\choose{4}} } = 0,140659341 = 14% </math> (?)
dá se interpretovat jako součin pravděpodobností u každé skupiny
Nezapomínejte zdůvodnit postup - Nejdřív si vezmu první čtveřici, a podělím možnosti jak vybrat ze 4 holek právě jednu a ze 12ti kluků právě 3 počtem možností, jak ze 16 lidí vybrat 4. No a stejně pokračuji dalšími čtveřicemi, ale vybírám jen z možností co zbývají - kluků je jen 9 (tři už jsou v první čtveřici…) atd.
Další možností je hrubá síla:
<math>\frac{12! \cdot 4! \cdot 4^4}{16!} = 0,140659341 = 14%</math>
Budova je vybavena automatickym pozarnim systemem, ktery provadi detekci pozaru jednou za vterinu. Pri pozaru spusti poplach s pravdepodobnosti 0,95. Pokud pozar nenastal spusti falesny poplach s pravdepodobnosti 0,01. Pravdepodobnost pozaru je 0,02.
Dekompozice na pravděpodobnosti od 4 nezávislých jevů:
Napřed se ptají, jaká je pravděpodobnost poplachu. Je to jednoduše součet pravděpodobností, kde figuruje poplach:
Normovat nemusíme, součet všech 4 pravděpodobností by ve jmenovateli dával 1.
Potom, jaká je pravděpodobnost požáru při poplachu:
Tady už musíme normovat součtem pravděpodobností, ve kterých figuruje poplach.
edit: přeloženo do lidštiny: Bayesova věta
Čistý Bayes:
Studenti mají tendence vynechávat cvičení při hezkém počasí. Každý student přijde (nezávisle na ostatních) s pravděpodobností <math>p_s</math> při škaredém počasí a <math>p_h</math> když je hezky. Cvičení je zrušeno pokud přijde méně než <math>k</math> z <math>n</math> zapsaných.
Prostě zapamatovat si tyhle vzorečky od Burdy…
… a nebo je jako správný MatFyzák odvodit během písemky. (Jak na odvození? viz test 26. 5. 2011 12:30 - 3.úloha)
U třetí části stačí jen psát P(a) a P(b) a správně je násobit.
Náhodná veličina <math>Y</math> má normální rozdělení s rozptylem <math>\sigma^2 = 3,92^{-2}</math>. Potřebujeme odhadnout její střední hodnotu pomocí 95% konfidenčního intervalu šířky 0,02. Jak velký náhodný výběr budeme potřebovat?
2500
Vodárny chtějí odhad vztahu mezi denní teplotou během léta a spotřebou vody na osobu. Naměřené hodnoty ve tvaru <math>(x_i, y_i)</math> znamenají teplotu a spotřebu pro den <math>i</math>. Máme lineární model <math>y_i = \beta_0 + \beta_1 x_i + \epsilon_i</math> pro <math>i=1..n</math>. Určete odhady <math>\beta_0</math> a <math>\beta_1</math> když znáte:
<math>\overline{x}=21</math>
<math>\overline{y}=245</math>
<math>s_X = 3</math>
<math>s_Y = 25</math>
<math>S_{X,Y} = 12</math>
<math>b_0 = 217</math>, <math>b_1 = \frac{4}{3}</math>
Před bouřkou se obvykle zvýší rozptyl naměřených hodnot síly větru. Pokud se blíží bouřka, rozptyl měření překročí 2,65 m/s. Na základě n=200 nezávislých měření jsme spočetli následující konfidenční intervaly pro <math>\sigma^2 = Var X</math>: 99% interval A:(2.64, 4,43); 98% interval B:(2.7, 4.31)
a) Blíží se bouřka? Otestujte hypotézu <math>H_0:\sigma^2 ⇐ 2.65</math> versus alternativa <math>H_A:\sigma^2 > 2.65</math> (tj. blíží se bouřka) pomocí těchto intervalů, tak aby pravděpodobnost chyby prvního druhu (tedy chybné zamítnutí <math>H_0</math>) byla 1%. Popiště přesně jak a proč jste se rozhodli.
b) Použili jste intervalu A nebo B. Proč?
Na těchto příkladech je nejtěžší to, že jsou tak jednoduché, že se tomu člověk až zdráhá uvěřit. Naměřili jsme nějaké hodnoty, a z nich jsme vypočítali dva rúzné konfidenční intervaly. Interval A je jistější, ale proto je také o něco delší, zatímco interval B sice není tak jistý, ale proto je kratší. U intervalu B je jedno procento šance, že je skutečná hodnota menší než 2.7, a jedno procento, že je větší než 4,43. To by nám ale nevadilo, protože pak by se bouřka blížila stejně. Pro nás je ale důležitá strana druhá. Aby se bouřka blížila, musí být rozptyl větší než 2,65 - my ale víme že je pouze 1% šance (což je ta naše chyba prvního druhu), že je menší než 2,7. Takže můžeme s klidem říci že bouřka se blíží.
edit: nevím, mě to teda vyšlo že cokoliv do 2,65 neleží v (2.7, infinity) a tedy hypotézu zamítám a bouřka by se blížit neměla… Tak si docti zadani. Pokud přesáhne 2.65 tak je bourka a tam je i tenhle interval.
škola písemky zkoušky pahýl
Náhodná veličina X může nabývat hodnot {1,2,3}. P(X=1) = 1/2, P(X=2) = 1/4, P(X=3) = 1/4
Uvažujme náhodný výběr n=16 napozorovaných hodnot z normálního rozdělení. Výběrový průměr a směrodatná odchylka jsme spočetli jako průměr=(už si nepamatuji) a s=2.5 (Hodnotí se správné dosazení do vzorců).
Máme S100 hodů nevyváženou mincí. Pravděpodobnost panny je 0.9. Pracujeme s pravděpodobností, že padne panna.
<math>n=1</math> (počítáme pro jeden hod)
<math>EX = n \cdot p = 1 \cdot 0.9 = 0.9 </math>
<math> var(X)= n \cdot p \cdot (p-1) = 1 \cdot 0.9 \cdot 0.1 = 0,09 </math>
Zhruba 81,8%. řešení: střed Gaussovky je v 90, tudíž si musím problém rozdělit na 2 výpočty. Nejprve od 90 do 96 (nějakých 0.4772) a potom od 90 do 93 (nějakých 0.34) (90 + (90-87) = osově obrácená plocha)- Dohromady po dá těch 0.818 ⇒ 81,8%
Reseni nize je podle me spatne
Edit =
<math> \frac {X - \mu}{\sigma} = z </math>
<math> \frac {87 - 90}{3} = 2 </math>
<math> \frac {96 - 90}{3} = -1 </math>
Po nalezeni intervalu z rozdeleni dostaneme <math> (0.977) - (1 - 0.841) = 0.977-0,159=0,818 </math>
Úsečka délky d je rozdělena ve dvou náhodných bodech (body jsou vybrány s rovnoměrným rozdělením na intervalu [0,d]). Jaká je pravděpodobnost, že ze vzniklých 3 fragmentů je možné sestavit trojúhelník. (Nápověda: Uvažte, že součet každých dvou stran trojúhelníka je větší než třetí strana.)
(copy&paste ze stránek magisterského předmětu MI-SPI)
Jak je naznačeno v nápovědě k příkladu vybereme náhodně čísla B a C, které odpovídají bodům zlomu od počátku tyčky.
Aby bylo možné složit trojúhelník musí platit trojúhelníková nerovnost. Proto nesmí být žádná z částí zlomené tyčky delší než 1/2. Podmínky v nápovědě pak odpovídají délkám částí tyčky.
Pokud platí všechny tři podmínky, tak pravděpodobnost, že vybereme náhodně z rovnoměrného distribučního rozdělení současně (nezávisle na sobě) správné délky B a C je 1/8. Protože lze ale B a C prohodit výsledek je 2*1/8 = 1/4. Nejlepší je si nakreslit obrázek s hodnotami B (osa X) a C(osa Y). Dobře popsané je to v tomto pdfku.
Neviem ci to niekomu pomoze, ale ja som to z tade celkom pochopil http://www.cut-the-knot.org/Curriculum/Probability/TriProbability.shtml
Výsledek
Vysledek by mel být 1/4. Je to dáno tím že body lomu vybíráme najednou (jak je zdůrazněno). Výsledek <math>2 log 2 - 1</math> odpovídá postupnému lámání.
Grafový přístup
Stejný přístup jako při Romeovi a Julii, obsah čtverce je 1, červená oblast je 1/4, pro tyto hodnoty lze sestavit trojuhelník.
Zpráva obsahující 5000 písmen byla vyslána kanálem s pravděpodobnosti chyby rozložené podle Poissonova rozdělení s průměrně jednou chybou na 1000 písmen.
<math>P( X = x ) = \frac{\lambda^x}{x!}e^{-\lambda}</math>
<math>\lambda = \frac{5000}{1000} = 5</math>
<math>P( X = x ) = \frac{5^x}{x!}e^{-5}</math>
<math>P( X = 1 ) = 5e^{-5} = 0,034</math>
<math>P( X >= 1 ) = 1 - P( X = 0 ) = 1 - e^{-5} = 0,993</math>
<math>P( X >= 2 ) = 1 - P( X = 1 ) - P( X = 0 ) = 1 - 5e^{-5} - e^{-5} = 1 - 6e^{-5} = 0,960</math>
Náhodná veličina <math>Y</math> má normální rozdělení s rozptylem <math>\sigma^2 = 2,576^{-2}</math>. Potřebujeme odhadnout její střední hodnotu pomocí 99% konfidenčního intervalu šířky 0,04. Jak velký náhodný výběr budeme potřebovat?
reseni primo od Blazka kdyz jsem u nej byl:
<math>
\alpha = 0,01 (1%)
\frac{\alpha}{2} = 0,005
</math>
intervalovy odhad pri znamem sigma^2: <math>
(\bar{x} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}})
</math>
<math>
2z_{0.005}\frac{2.576^{-1}}{\sqrt{n}} = 0.04
z_{0.005}\frac{2.576^{-1}}{\sqrt{n}} = 0.02
</math>
z tabulek chceme na kazdem konci ukrojit 0.005 tj bereme 0,5 - 0.005 = 0.495 ⇒ 2.57
<math>
2,57*\frac{2.576^{-1}}{\sqrt{n}} = 0.02
\frac{2.57}{2,576 * \sqrt{n}} = 2/100
\frac{1}{\sqrt{n}} = 2/100
\sqrt{n} = 50
n = 2500
</math>
X je náhodná veličina na intervalu [0,2]. Má hustotu:
f(x) = Cx na intervalu [0,1]
f(x) = C(2 - x) na intervalu [1,2]
Nechť X je náhodná veličina, která nabývá hodnot 1, 3, 5 s pravděpodobností P(X=1) = 1/3, P(X=3) = 1/4, P(X=5) = 5/12
Generující fce: <math>M(s) = E(e^{sX}) = \frac{1}{3}e^{s} + \frac{1}{4}e^{3s} + \frac{5}{12}e^{5s}</math>
Momenty: Buď z derivací generující fce nebo normálně: k-tý moment: <math>\mu_k^\prime = \operatorname{E}\left[X^k\right]</math>
Data centrum potřebuje odhadnout vztah mezi počtem serverů a spotřebou elektrické energie na jejich napájení a chlazení. Pro měření <math>i</math> označme počet serverů a spotřebu jako (<math>x_i,y_i</math>) v daném pořadí. Uvažujme lineární model
<math> y_i = \beta_0 + \beta_1 x_i + \epsilon_i </math> pro i=1,…,n
s normálně rozdělenými chybami <math>\epsilon_i</math>. Spotřebu pro 25 konfigurací a spočetla: ( horní mez sumy byla 49, dle mého blbost, dal jsem 25)
<math> \overline{x}=10 \Rightarrow (s_x)= \sqrt{\frac{1}{24}\sum_{i=1}^{25}(x_i - \overline{x})^2} = 2.5</math>
<math>\overline{y}=500 \Rightarrow (s_y)=\sqrt{\frac{1}{24}\sum_{i=1}^{25}(y_i - \overline{y})^2} = 5500</math>
<math>S_{X,Y}=\frac{1}{24} \sum_{i=1}^{25} (x_i-\overline{x})(y_i-\overline{y}) = 12</math>
<math>\beta_1</math> = 1,92
<math>\beta_0</math> = 480,8
škola zkoušky předměty
X\Y | |||
---|---|---|---|
Y | X | 1 | 2 |
2 | 4/9 | 5/9 | |
4 | 7/11 | 4/11 |
X & Y | |||
---|---|---|---|
Y | X | 1 | 2 |
2 | 11/45 | 11/36 | |
4 | 63/220 | 9/55 |
μ
s věrohodností 95 %.σ²
s věrohodností 95 %.yi
v tunách na hektar na použitém množství hnojiva xi
. Pro osm měření nám vyšla data:
<math>
\overline{x} = 440 (x-1)(x-2)& \quad \mbox{pro 0 \le x \le 1}\\ a & \quad \mbox{pro 1 \le x \le 2}\\ 0& \quad \mbox{jinak}\\ \end{array} \right. \</math>
2,33
je z tabulek normálního rozdělení pro <math>0,99-0,5=0,49</math>
Výpočet var(Y)
: přednáška 5, slide 22.