Sandsynligheder og sandsynlighedsfordelinger

Sandsynligheder og sandsynligheds-fordelinger

 

 

 

 

 

Frederik Hovmark Pedersen

 

 

 

 

Indholdsfortegnelse

 

 

 

 

Indledning

I denne emneopgave vil jeg gennemgå emnet sandsynlighedsregning. Jeg vil her komme ind​​ på hvad et sandsynlighedsfelt samt et symmetrisk sandsynlighedsfelt er. Jeg vil se på hvilken formel der gælder for et symmetrisk sandsynlighedsfelt. Jeg vil se hvad en hændelse, en komplementær-hændelse, foreningshændelse og fælleshændelse er. Jeg vil gennemgå regnereglerne for hændelser. Jeg vil beskæftige mig med en betinget sandsynlighed. Med multiplikationsformlen. Jeg vil se på hvornår to hændelser er uafhængige. Jeg vil forklare hvad en stokastisk variabel er. Jeg vil se på diskrete og kontinuerte stokastiske variable. Jeg vil behandle emnet binomialfordeling og se på sandsynlighedsfunktionen i en binomialfordeling. Jeg vil ligeledes forklare hvordan middelværdi, varians og standardafvigelsen beregnes i en binomialfordeling. Og til slut vil jeg se på​​ hvad en normalfordeling er, og hvad dennes parametre kaldes samt har af betydning.

Teori

Sandsynlighedsregning handler om sandsynligheden for at en given ting sker eller ikke sker. Og det er noget der bruges og kan bruges overalt i vores hverdag. Det kan​​ være man vil finde sandsynligheden for at få 13 rigtige i tips. Det kan være pokerspilleren der skal beregne sandsynligheden for at vinde, når han har fået to kort på hånden. Det kan være sandsynligheden for at vinde i lotto. Eller sandsynligheden for at en virksomhed får held med et salgsfremstød.​​ Der findes 3 måder at bestemme sandsynligheder på:

  • Subjektive sandsynligheder:

Her handler det om personlig vurdering af sandsynlighed som fx ved oddset.

 

  • Objektive sandsynligheder:

Her kan sandsynligheden bestemmes ved beregning. Dette sker ved fx kortspil, terningkast osv.​​ 

 

  • Relative frekvenser:

Sandsynligheden bestemmes her fra frekvensen i en stikprøve. Fx en meningsmåling.

 

Udfaldsrum

Når man taler om sandsynlighed er der jo nødt til at være en række udfald.​​ Det enkelte udfald betegnes som ui. Hvis man så tager udgangspunkt i terningkast, så findes der 6 forskellige udfald. Der er sandsynligheden for at få 1(u1​​ = 1), sandsynligheden for at få 2(u2​​ = 2) osv.

Udfaldsrummet, der altid betegnes med stort U, er så​​ alle de mulige udfald. Det vil sige at det ved terningkast bliver U = {u1, u2, u3, u4, u5, u6}, som så svarer til at man kan slå: {1, 2, 3, 4, 5, 6}.​​ 

Sandsynlighedsfelt

Et sandsynlighedsfelt består af udfaldsrum med dertilhørende sandsynligheder. Der​​ gælder to generelle regler for sandsynlighedsfelter:

  • Et sandsynlighedsfelt er karakteriseret ved, at sandsynligheden altid vil være mellem 0 og 1(0​​ ​​ P(u)​​ ​​ 1). Og så vil summen af sandsynlighederne så altid være 1(P(u1) + P(u2) + P(u3)… = 1).

  • Desuden er alle sandsynlighederne altid positive.

Som det ses herover betegnes sandsynlighed med bogstavet P, sandsynlighedsparameteren, som kommer af ordet probability, det engelske ord for sandsynlighed. P(u) betyder dermed sandsynligheden for et givent udfald.

Man​​ kan så ud fra fx eksemplet med terningkast lave et skema med udfald og tilhørende sandsynligheder:

Udfald​​ 

u1​​ = 1

u2​​ = 2

u3​​ = 3

u4​​ = 4

u5​​ = 5

u6​​ = 6

Sandsynlighed

P(u1)​​ =​​ 16

P(u2)​​ =​​ 16

P(u3)​​ =​​ 16

P(u4)​​ =​​ 16

P(u5)​​ =​​ 16

P(u6)​​ =​​ 16

Symmetrisk sandsynlighedsfelt

Der​​ forekommer et symmetrisk sandsynlighedsfelt når alle udfaldene har samme sandsynlighed. Dette er tilfældet ved fx terningkast, møntkast osv. Sandsynligheden for den enkelte hændelse i et symmetrisk sandsynlighedsfelt er:​​ GunstigeudfaldMuligeudfald. Dvs. at hvis man vil regne sandsynligheden ud for at slå 6, så er det gunstige udfald = 6, mens de mulige udfald er 1 til 6

Når man har sandsynlighedsfeltet kan man definere hændelserne, som er en delmængde af udfaldsrummet.​​ 

 

Hændelse

Hændelsen er altså en kombination af flere udfald. Et​​ eksempel på en hændelse kan igen være hvis man kaster med en terning, og kun vil have et antal lige øjne(hændelse = antal lige øjne). De tal man så i dette tilfælde kan bruge(de gunstige udfald), er så 2, 4 og 6.​​ 

P(lige antal) = P(2) + P(4) + P(6) =​​ 16​​ + ​​ 16+ ​​ 16​​ = ​​ 12.​​ Det vil sige at sandsynligheden for at få et lige tal er​​ 12.

Der findes seks forskellige former for hændelser:

  • Den umulige hændelse(P(ø) = 0). Og det ligger jo lidt i ordet, at dette er en hændelse der ikke kan lade sig gøre.

  • Den sikre hændelse(P(U)​​ = 1). Altså en hændelse som er 100% sikker.

  • Den komplementære hændelse.​​ Dette er den modsatte hændelse, hvilket vil sige alle andre hændelser end den/dem man vil have(P() = -P(A)). Hvis hændelsen fx var, at du skulle have et lige antal øjne ved terningkast, så er den komplementære hændelse et ulige antal øjne.

  • Fælleshændelsen. Er sandsynligheden for at både A og B optræder. Dette skrives som P(A∩B). Det kan vises i et Venn-diagram, som ses herunder.

  • Foreningshændelsen. Her er der tale om sandsynligheden​​ for at A eller B optræder. Dette skrives som P(AB).

 

  • Disjunkte hændelser. Her har A og B ingen udfald tilfælles, da de ikke overlapper hinanden. Dette kunne fx være ved terningkast, hvor A er lig en ener og B er lig antal lige øjne.

 

Der gælder naturligvis også nogle regler for hændelser.​​ 

  • Vilkårlige hændelser: P(AB) = P(A) + P(B) - P(A∩B).

  • Disjunkte hændelser: P(AB) = P(A) + P(B).

Når jeg skriver P(A) betyder det sandsynligheden for at få A, mens P(B) betyder sandsynligheden for at få B.​​ 

Et eksempel​​ på brugen af en af reglerne kunne så være ved terningkast med 1 terning. Her er der 6 mulige hændelser. Vi siger så at:

A = {2,4,6} altså et lige tal

B = {4,5,6} altså mindst 4 øjne

Dermed kan vi finde P(A), P(B) og P(A∩B):

P(A) = ​​ Gunstige udfaldMulige udfald​​ = ​​ 36​​ =​​ 12

P(B) =​​ Gunstige udfaldMulige udfald​​ = ​​ 36​​ =​​ 12

P(A∩B)(som er 4 og 6) =​​ 26​​ =​​ 13

Og nu kan jeg så beregne​​ P(AB):

P(AB) = P(A) + P(B) - P(A∩B) =​​ 12​​ + ​​ 12​​ - ​​ 13​​ = ​​ 23 ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​​​ 

De gunstige tal her er så 2, 4, 5 og 6.

Man kan så desuden udregne den modsatte hændelse til P(A), som er P(), samt den modsatte hændelse til​​ P(B), som er P(B ̅). Da vi ved at det hele skal give 1, gøres dette gøres således:

P() = 1 - P(A) = 1 -​​ 12​​ =​​ 12 

P(B ̅) = 1 - P(B) = 1 -​​ 12​​ =​​ 12

 

Betinget sandsynlighed

En betinget sandsynlighed er sandsynligheden for at noget sker, givet at noget andet er sket​​ forinden. Et eksempel kan være at man kaster en terning. A er så lig en sekser, og B er lig et lige antal øjne. Den betingende sandsynlighed kunne så hedde​​ P = (A|B), hvilket betyder sandsynligheden for at få en sekser, givet/betinget af/forudsat at man har fået et lige antal øjne. Sandsynligheden for dette er så​​ 13, da der jo kun er tre mulige udfald(2, 4 og 6)

Der gælder to regler:

P(A|B) =​​ P(AB)P(B) ​​​​ og​​ P(B|A) =​​ P(AB)P(A)

Denne formel kan så også benyttes til at beregne sandsynligheden for at få en sekser givet at man har fået et lige antal øjne.​​ 

​​ P(sekser|lige tal) =​​ P(sandsynligheden for både en sekser og et lige tal)P(sandsynligheden for at få  et lige tal)​​ =​​ 1636​​ =​​ 618​​ =​​ 13

Multiplikationsformlen

Multiplikationsformlen siger, at for to hændelser A og B gælder, at sandsynligheden fr A∩B er givet ved:​​ P(A∩B) = P(A|B) * P(B) eller P(A∩B) = P(B|A) * P(A).

 

Uæfhængige hændelser

Handler om hvorvidt et givent udfald er afhængig af noget. Fx kan antal timer en elev bruger på at læse lektier, være afhængig af elevens køn. Er dette tilfældet siger man at der er stokastisk afhængighed.

Til at finde ud af om der er stokastisk afhængighed/uafhængighed, benyttes formlen​​ P(A∩B) = P(A) * P(B). Altså multiplikationsformlen. Dette betyder at hvis P(A) * P(B) er lig med fælleshændelsen, så er der stokastisk uafhængighed.

Et eksempel kan være at man har undersøger rygere og ikkerygere for om​​ de havde hjerteproblemer. Udfaldet af undersøgelsen ses i skemaet herunder:

 

Rygere

Ikkerygere​​ 

Hjerteproblemer

100(10%)

80(8%)

Ikke hjerteproblemer

200(20%)

620(62%)

 

Det ses tydeligt at der er stokastisk afhængighed, da der er flere rygere med​​ hjerteproblemer end ikkerygere med hjerteproblemer. Men lad os alligvel beregne det.​​ 

P(hjerteproblemer∩ryger) = P(hjerteproblemer) * P(ryger)​​ 

1001000​​ =​​ 1801000​​ *​​ 3001000

0,1 = 0,18 *​​ 3001000​​ ​​ 0,054

Og da 0,1 ikke er lig 0,054 er der stokastisk afhængighed. Hvilket vil sige, at det​​ at man ryger har betydning for hvor stor sandsynlighed der er for at få hjerteproblemer. Altså, rygning giver hjerteproblemer.​​ 

 

Stokastisk variabel

Da det ikke er alle udfaldsrum der består af tal, fx {plat, krone}, er det nødvendigt at kunne beskrive fx​​ disse to udfald med tal. Det er dette man benytter en stokastisk variabel til. Og man kan dermed konkludere, at en stokastisk variabel er kendetegnet ved at udfaldet angives ved tal. En stokastisk variabel beskrives desuden med et stort bogstav, f.eks. X,​​ mens de værdier den så kan antage, beskrives med et småt bogstav, f.eks. x. Tager man så igen udgangspunkt i eksemplet med møntkast, så kan man sige at plat: X = 0. Og krone: X = 1. Dermed bliver udfaldsrummet: U = {0,1}.​​ Og sandsynligheden for at X antager en værdi x betegnes som P(X=x). Dvs. skal man så vise sandsynligheden for at få plat, skrives dette som P(X=0) = 0,5. Mens sandsynligheden for at få krone ligeledes bliver P(X=1) = 0,5.

P(X=x) kaldes også for punktsandsynligheden. For punktsandsynligheder gælder at sandsynlig-heden for et hvilket som helst udfald(i mit eksempel plat og krone), skal ligge mellem 0 og 1(0​​ ​​ P(X=x)​​ ​​ 1). Desuden skal det give 1, når man lægger alle punktsandsynlighederne sammen(∑P(X=x) = 1).

Diskrete og kontinuerte stokastiske variable

Stokastiske variable kan deles op i to kategorier. Diskrete stokastiske variable og kontinuerte stokastiske variable. En diskret stokastisk variabel er når man har et endeligt antal værdier. En diskret variabel kunne være man har et udfaldsrum​​ der antager værdierne​​ {-2, -1, 0, 1, 2}. Ligeledes er eksemplet med møntkast en diskret stokastisk variabel.

Mens kontinuerte stokastiske variable ikke har et endeligt antal værdier. Altså har man i princippet et uendeligt antal værdier. Et eksempel på en​​ kontinuert variabel kunne være, at man har et antal værdier(x), der ligger i intervallet -10 til 20(x​​ ​​ [-10,20).​​ 

Middelværdi, varians og standardafvigelse

Middelværdien, der enten betegnes med det græske bogstav for m som hedder​​ mu(μ), eller med E(x),​​ beregnes således: ∑ x * P(X=x). ∑ betyder summeret.​​ Varianssen der betegnes som​​ σ2​​ eller var(x) beregnes således: ∑ (x - E(x))2​​ * P(X=x).​​ σ​​ er det græske bogstav sigma. Efter at have fundet variansen kan standardafvigelsen så beregnes ved at tage kvadratroden af variansen:​​ σ2​​ =​​ var(x).

Som eksempel vil jeg finde sandsynligheden at få krone i 3 møntkast. De mulige udfald bliver her:

  • PPP

  • PPK

  • PKP

  • PKK

  • KPP

  • KPK

  • KKP

  • KKK

Disse kan så illustreres som det ses herunder.

X

P(X=x)

Middelværdi: x*P(X=x)

Varians: (x-E(X))2​​ *​​ P(X=x)

0

18= 0,125

0*0,125=0

(0 - 1,5)2​​ * 0,125 = 0,2813

1

38=0,375

1*0,375=0,375

(1-1,5)2​​ * 0,375 = 0,0938

2

38=0,375

2*0,375=0,75

(2-1,5)2​​ * 0,375 = 0,0938

3

18= 0,125

3*0,125=0,375

(3-1,5)2​​ * 0,125 = 0,2813

sum

88= 1

E(X) = 0+0,375+0,75+0,375 =​​ 1,5

Var(x) =​​ 0,7502

 

Som det ses i tabellen har jeg, ved hjælp af formlerne ovenfor, beregnet middelværdi og varians:

Middelværdi: E(X) = 1,5

Varians: var(x) = 0,7502

Og efter det kan jeg jo så beregne standardafvigelsen:

Standardafvigelse:​​ var(x)​​ =​​ 0,7502=​​ 0,8661​​ 

Tabellen kan​​ også benyttes til at beregne andre ting. Fx kan jeg ved hjælp af den finde ud af hvad sandsynligheden er for at få mindre end 2 krone(P(X≤2)), sandsynligheden for at få mere end 2 krone(P(X≥2)), og sandsynligheden for at få præcis 2 krone(P(X=2)). Dette gør jeg således.​​ 

P(X≤2) = P(X=0) + P(X=1) + P(X=2) =​​ 18​​ + ​​ 38​​ + ​​ 38​​ =​​ 78​​ = 0,875.

P(X=2) = ​​ 38.​​ Her aflæser jeg blot af tabellen.

P(X≥2) = P(X=2) + P(X=3) =​​ 38 ​​​​ +​​ 18​​ =​​ 48​​ = 0,5.

 

Binomialfordeling

Der er tale om en binomialfordeling når der findes to mulige udfald. Dette​​ kunne fx være succes/fiasko, for/imod, plat eller krone ved møntkast, at dumpe/bestå en køreprøve eller at slå en sekser/ikke sekser ved terningkast osv.

Ud over at der skal være to mulige udfald, findes der også tre andre krav til en binomialfordeling. Forsøget skal gentages et antal gange. Noget der kaldes antalsparameteren og betegnes med bogstavet n. Disse gentagelser skal så være uafhængige af hindanden. Og sandsynligheden for succes skal være den samme hver gang. Sandsynligheden for succes i de enkelte forsøg kaldes for sandsynlighedsparameteren og betegnes med bogstavet p.​​ 

Formlen for sandsynlighedsfunktion ved binomialfordeling

Formlen for sandsynlighedsfunktionen X i ​​ en binomialfordeling hedder P(X=x) = K(n,x) * px*(1-p)n-x. Denne kan vi så benytte til et eksempel, hvor jeg vil beregne sandsynligheden for at et forældrepar med brune øjne(men med genetisk anlæg for blå øjne), får 3 ud af 4 børn med blå øjne, når sandsynligheden for at et af deres børn får blå øjne er 25%.​​ 

Den stokastiske variabel X​​ er lig antal børn med blå øjne. Antalsparameteren n er lig 4, mens sandsynlighedsparameteren p er lig 0,25(25%). Jeg benytter så formlen:

P(X=3) = K(4,3) * 0,253​​ *(1-0,25)4-3​​ =​​ 

=​​ 4!3!*4-1!* 0,253​​ * 0,75​​ 

=​​ 4*3*2*13*2*1*1​​ * 0,0117

= 4 * 0,0117

= 0,0469

I det ovenstående er der​​ et sted hvor der står K(4,3), dette er binomialkoefficienten, som betyder at jeg har 4 muligheder og skal ”trække” 3. binomialkoefficienten skrives som​​ K(n,x) = ​​ n!x! * n -x!. Udråbstegnet betyder fakultet. Og står der fx 4! betyder det 4 fakultet, som, hvilket også ses i opgaven, betyder 4*3*2*1. Tilsvarende ville 15! betyde 15*14*13*…*1.​​ 

 

Altså er sandsynligheden for at de får 3 børn med blå øjne lig 4,69%. Dette kan også beregnes i KehaTool. For at gøre dette går jeg ind i KeHaTools, vælger den der hedder 2. sandsynlighed, og derefter den der hedder 1. Binomialfordeling. Så indtaster jeg blot de oplysninger jeg har, og jeg får nedenstående, hvor jeg, som det ses, også kunne have aflæst hvad sandsynligheden er. 

Computergenereret alternativ tekst: Beregninger ¡ Binomialfordelingen
Antal gentagelser 4
Basis-sandsynlighed ‘b,25
Middelværdi i
Varians 0,75
Spredning 0,866025
Tabel over sandsynligheder
P(Xk) P(X=k) P(Xk)
O 0,31640625 0,316406 1
1 0,73828125 0,421875 0,683594
2 0,94921875 0,210938 0,261719
3 0,99609375 0,046875 0,050781
4 1 0,003906 0,003906

 

Middelværdi, standardafvigelse og varians i binomialfordeling

Middelværdien i binomialfordelingen som betegnes med μ eller E(X) er bestemt ved: n * p. Variansen som betegnes med VAR(X) eller σ2​​ er bestemt ved: n * p * (1-p). Standardafvigelsen som betegnes med STD(X) eller σ er bestemt ved:​​ n*p*(1-p), altså​​ VAR(X).

For at​​ lave et eksempel på dette, siger jeg at jeg har en n der er lig 50(n = 50) og en p er er lig 0,25(p = 0,25).​​ 

Jeg beregner så middelværdien, altså den gennemsnitlige værdi af den stokastiske variabel: E(x) = 50 * 0,25 = 12,5  ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​​​ 

Så beregner​​ jeg variansen: Var(X) = 50 * 0,25 * (1-0,25) = 9,375​​ 

Og jeg kan nu beregne standardafvigelsen: STD(x) =​​ 9,375​​ = 3,0619

Dette kan KeHaTools naturligvis også beregne, gør jeg det, så får jeg et billede der ser således ud, bortset fra at tabellen naturligvis​​ fortsætter til 50.​​ 

 

Normalfordeling

Ved normalfordeling har man en række observationer der fordeler sig symmetrisk omkring en midte, hvor de fleste observationer ligger, således at der dannes en klokkeformet kurve.

Et eksempel på noget der er normalfordelt er højden på værnepligtige. Et andet eksempel er karakterne for studenter, der vi også ofte vil være normalfordelt, da gennemsnittet som oftest vil være 7, og så ellers lige mange der får 10 og 4.

Klokkeformens bredde afhænger af spredningen/standardafvigelsen. Spredningen betegnes med STD(X). Stiger STD(X) vil ”klokken” blive bredere, mens ”klokken” vil blive smallere, hvis STD(X) falder. Dette sker da standardafvigelsen/spredningen er udtryk for usikkerheden omkring middelværdien. Standardafvigelsen betegnes som oftest med det græske bogstav σ(sigma).

En anden vigtig parameter er middelværdien der beregnes med E(X). Middelværdien er det punkt på x-aksen man rammer, når man skærer en lige linje ned gennem midten af ”klokken”. Denne har betydning for hvor på x-aksen ”klokken” befinder sig. Stiger middelværdien rykker ”klokken” til højre, og falder middelværdien rykker ”klokken” til venstre. Middelværdien betegnes med det græske bogstav μ(mu).

Egenskaber ved normalfordeling

Normalfordelingen har nogle forskellige egenskaber. En af dem er, at sandsynligheden for at x ligger​​ mellem middelværdien - standardafvigelsen og middelværdien + standardafvigelsen er 68%(P(E(X)-STD(X) < ​​ X < E(X)+STD(X)) = 68%).

En anden er, at sandsynligheden for at x ligger mellem middelværdien - 2*standardafvigelsen og middelværdien + 2*standardafvigelsen er 95%( P(E(X)-2*STD(X) < X < E(X)+2*STD(X)) = 95%).

 Computergenereret alternativ tekst:

 

Fraktiler i normalfordelingen

α-fraktilen xα​​ i en normalfordeling X er givet ved: P(X≤xα) = α

Computergenereret alternativ tekst:

I eksemplet herover har jeg​​ fundet ud af at sandsynligheden for at x-værdierne er mindre end eller lig med 3 er 0,1590(15,9%). Altså P(X​​ ​​ 3) = 0,1590 eller P(XX0,1590) = 0,1590.

Jeg har så et eksempel på brugen af normalfordelingen, hvor jeg benytter mig af KeHaTools. I mit eksempel antager jeg at vægten på en smørpakke er normalfordelt med en middelværdi på 250 gram, og en standardafvigelse på 10 gram.

Ved at gå ind i KeHaTools, vælge sandsynlighed , derefter normalfordeling, og så indtaste de oplysninger jeg har, får jeg nedenstående.

​​ 

Ud fra oplysningerne i den røde ring jeg har sat ind, kan jeg se, at sandsynligheden for at en pakke smør vejer under 240 gram er lig 15,87%(P(X≤240)=0,01587). Hvis jeg så ændrer på tallet 240, og skriver et andet tal, ville jeg kunne se hvad sandsynligheden var for at en pakke smør vejede over eller under dette.

Ydermere kan jeg ændre på tallene der hvor der står a = 240 og b =240, således at jeg får nedenstående.​​ 

​​ 

 

Her har jeg så ændret på b, således at jeg får sandsynligheden for at en​​ pakke smør vejer mellem 240 gram og 265 gram. Denne er så 77,45%(P(240 ≤ X ≤ 265) = 0,07745).

Til sidst kan jeg så bestemme 10%-fraktilen. Dette gør jeg ved at vælge formler, vælge flere funktioner, vælge NORM.INV, og så indtaste de oplysninger jeg har om​​ middelværdien, standardafvigelsen og det at jeg vil finde 10%-fraktilen.

Gør jeg dette får jeg tallet 237,1895. Hvilket vil sige at P(X ≤ 237,1845) = 0,10. Dette betyder så at 10% af smørbakkerne vejer 237,1845 gram eller derunder.​​ 

Det samme kunne jeg så​​ vælge at gør for 90%-fraktilen med nøjagtigt samme fremgangsmåde.  ​​ ​​ ​​​​ 

 

 

 

Opgaver

Opgave A

I en krukke ligger 20 kugler, hvoraf 12 er røde og 8 er hvide. Vi trækker på tilfældig måde 2 kugler efter hinanden uden at lægge den først udtrukne tilbage.

  • Beskriv​​ de mulige udfald i et trædiagram.

 ​​ ​​ ​​ ​​ ​​ ​​​​ Vi definerer nu følgende hændelser:

 ​​ ​​ ​​ ​​ ​​ ​​​​ R1​​ = Rød kugle i 1. træk
 ​​ ​​ ​​ ​​ ​​ ​​​​ H1​​ = Hvid kugle i 1. træk
 ​​ ​​ ​​ ​​ ​​ ​​​​ R2​​ = Rød kugle i 2. træk
 ​​ ​​ ​​ ​​ ​​ ​​​​ H2​​ = Hvid kugle i 2. træk

  • Bestem P(R1)

Sandsynligheden for at få en rød​​ kugle i 1. træk = P(R1) =​​ 1220​​ = 0,6 =​​ 60%

  • Bestem P(R1∩H2)

Sandsynligheden for både at trække en rød og en hvid = P(R1∩H2) =​​ 1220​​ *​​ 819​​ =​​ 2495​​ = 0,2526 =​​ 25,26%

  • Bestem P(H2|R1)

Sandsynligheden for at få en hvid kugle i 2. ​​ træk, forudsat at man har fået en rød kugle i 1.​​ træk = P(H2|R1) =​​ 819​​ = 0,4211 =​​ 42,11%

  • Hvad er sandsynligheden for at få en rød og en hvid kugle i 2 træk uden tilbagelægning?

Sandsynligheden for at​​ P(R1∩H2)​​ + sandsynligheden for at få​​ P(H1∩R2)

P(R1∩H2) =​​ 1220​​ *​​ 819​​ =​​ 2495

P(H1∩R2) =​​ 820​​ *​​ 1219​​ =​​ 2495

2495​​ +​​ 2495​​ =​​ 4895​​ = 0,5053 =​​ 50,53%

 

Opgave B

Ved en multiple choice test blev der stillet 15 spørgsmål, der hver var forsynet med 3 svarmuligheder, hvoraf kun ét svar var rigtigt. For at bestå testen skulle mindst 6 svar være rigtige.
En person, der ikke kender til det emne, testen omhandler, svarer på tilfældig måde på alle 15 spørgsmål.​​ 

  • Opstil en model (sandsynlighedsfunktion) over sandsynlighedsfordelingen af den stokastiske variabel X, der angiver antal rigtige svar.

Denne laver jeg i KeHaTools, hvor jeg benytter binomialfordelingen som​​ jeg viste i teoridelen.

C:\Users\Thomas\AppData\Local\Microsoft\Windows\INetCache\Content.Word\3.jpg

  • Hvor stor er sandsynligheden for, at personen tilfældigvis består testen ?

Da man skal have 6 rigtige for at bestå, er sandsynligheden for at en person tilfældigvis består testen(dette har jeg aflæst af tabellen): P(X≥6) =​​ 0,381628.​​ 

 

  • Hvor stor er sandsynligheden for at personen tilfældigvis har alle svar rigtige ?

Dette har jeg ligeledes aflæst af tabellen. P(X=15) =​​ 0,00000006969

 

  • Hvor mange svar skal man mindst have rigtige, hvis sandsynligheden for at bestå på tilfældig​​ ​​ måde skal være mindre end 5 %.

Da sandsynligheden for at bestå på tilfældig måde kommer under 5% ved sandsynligheden for at få 9 rigtige, er det denne jeg skal bruge. P(X≥9) =​​ 0,0308.

 

  • Hvad er det forventede antal korrekte svar ?

Det forventede antal svar/middelværdien, er 5 rigtige svar. Denne har KeHaTools beregnet for mig.