Statistik

http://www.forsikringogpension.dk/SiteCollectionImages/Mavebaelte/grafer.jpg

 

Statistik

http://www.forskningenshus.dk/userfiles/Statistik.jpg

 

 

 

 

 

 

 

 

 

Frederik Hovmark Pedersen

Indholdsfortegnelse:

 

Side 3-Indledning

Teori for ugrupperede observationer

Side 4-Teori for ugrupperede​​ observationer​​ 

Teori for​​ grupperede​​ observationer

Side 5-Teori for grupperede observationer​​ 

Side 6-Ugrupperet talmateriale

  • Tabel

  • Søjlediagram

Side 7-Ugrupperet talmateriale​​ 

  • Sumkurve

  • Deskriptorer

Side 8-​​  Ugrupperet talmateriale

  • Deskriptorer

  • Afsluttende konklusion/sammenligning

Side 9-​​  Grupperet talmateriale

  • Tabel

  • Søjlediagram

Side 10-​​  Grupperet talmateriale

  • Sumkurve

  • Deskriptorer

Side 11-​​  Grupperet talmateriale

  • Forsørgerbyrden

  • Afsluttende konklusion/sammenligning

 

Indledning

Jeg vil gennem min emneopgave først komme ind omkring​​ den teori,​​ som jeg efterfølgende vil benytte​​ til​​ at​​ arbejde med det talmateriale,​​ der er udleveret med opgavebeskrivelsen.​​ Den første del af teorien vil omhandle ugrupperede observationer,​​ mens den anden del vil omhandle grupperede observationer.​​ Ligeledes vil jeg så først arbejde med talmaterialet​​ for ugrupperede observationer. Jeg vil​​ her​​ arbejde​​ med topscorerlisterne for superligasæsonerne 2010/2011 og 2011/2012.​​ Og herefter vil jeg så arbejde med talmaterialet for grupperede observationer.​​ Hvor jeg​​ vil​​ benytte​​ en statistik for Thisteds​​ befolkningsantal inddelt i aldersgrupper i 2012,​​ samt​​ for​​ hvordan det forventes at fordele sig i 2040.  ​​​​  ​​​​ 

 

Gennemgang​​ af den teori der vil blive benyttet i opgaven​​ 

  • Ugrupperede observationer

I første del af opgaven vil jeg arbejde med ugrupperede observationer også kaldet diskrete observationer.​​ 

Her vil jeg vil blandt andet benytte en tabel der​​ viser observationer, hyppighed og​​ frekvens samt summeret frekvens.

Observation: det der måles

Hyppighed: det antal gange en bestemt observation fremkommer

Frekvens: hyppighed/antal observationer i alt. Frekvenser kan vises i et​​ histogram(søjlediagram).​​ 

Summeret frekvens/kumuleret frekvens: her lægger man frekvenserne sammen​​ en efter en,​​ det vil sige​​ man opsummerer​​ frekvenserne. De summerede frekvenser kan vises som en sumkurve.

Middelværdi: kaldes også xstreg,​​ er​​ den gennemsnitlige observation. Middelværdien​​ kan beregnes på to måder:

  • Obs.1 * Hypp.1 + Obs.2 * Hypp.2 + osv.antal observationer

  • Obs.1 * Frek.1 + Obs.2 * Frek.2​​ +​​ osv.

Varians: når man så har fundet middelværdien, kan man finde variansen, dette gøres ved hjælp af formlen:

S2​​ =​​ (obs1 - X)^2 * Hyp1 + (obs2 - X)^2 * Hyp2 osv.Antal obs-1

X​​ = x med streg over(xstreg)

Standardafvigelse(spredning):​​ også kaldet spredning, er spredningen af værdierne omkring middelværdien, der er tale om to former for spredning:

  • Lille spredning, hvis observationerne ligger tæt omkring middelværdien

  • Stor spredning, hvis observationerne ligger spredt langt fra middelværdien​​ 

Formel for afvigelsen til venstre for middelværdien (obs1 -​​ X)2

Formel for afvigelsen til højre for middelværdien (obs2 -​​ X)2

Standardafvigelsen findes ved​​ at tage kvadratroden af variansen:

S =​​ S2​​ =​​ varians

Kvartilsættet: består af de observationsværdier der svarer til 25%, 50% og 75%​​ af den samlede observation. De aflæses af de summerede frekvenser.​​ 

  • 0,25 – fraktil – 1. kvartil – nedre kvartil

  • 0,50 – fraktil – 2. kvartil – medianen​​ 

  • 0,75 – fraktil – 3. kvartil – øvre kvartil

I opgaven vil jeg også vise 0,10 fraktil samt 0,90 fraktil, de aflæses på samme måde som kvartilsættet af de summerede frekvenser​​ 

0,10​​ – fraktil: den observationsværdi der svarer til 10% af observationerne

0,90​​ – fraktil: den observationsværdi der svarer til 90% af observationerne

Kvartilafstand: findes ved at tage 0,75 fraktilen - 0,25 fraktilen

 

  • Grupperede observationer

I anden del af opgaven vil jeg så arbejde med grupperede observationer.​​ Ved grupperede observationer arbejder man med mange observationer. Disse inddeles derfor i intervaller.​​ Der findes tre former for intervaller:

  • Lukket interval, fx [2;5],​​ tallene i dette interval går altså fra og med 2 til og med 5.

  • Åbent interval,​​ fx​​ ]2;5[,​​ her​​ er​​ hverken 2 eller​​ 5​​ med, hvilket vil sige at alle tal over 2 til​​ og med​​ 4,999… er med.

  • Halvåben​​ interval, [2;5[​​ her er​​ 2​​ med, mens​​ 5 ikke​​ er​​ med

Jeg vil så igen bruge en tabel der viser observationer, hyppighed, frekvens samt summeret frekvens, disse beregnes som ved ugrupperede observationer.

Typeinterval:​​ ved typeinterval forstås det interval med den største hyppighed, hvilket vil sige det interval der fremkommer flest gange.

Middelværdi:​​ her finder man midtpunkterne for samtlige observationer, og så lyder formlen:

Midtpunkt1 * hypp.1 + midtpunkt2 * hypp.2 + osv.antal observationer​​ 

Varians: når man så har fundet middelværdien, kan man jo finde​​ variansen, dette gøres ved hjælp af formlen:

S2​​ =​​ (midtpunkt1  xstreg)^2 * hypp.1 + (midtpunkt2  xstreg)^2 * hypp.2 + osv. antal observationer - 1

Standardafvigelse(spredning):​​ når variansen så er fundet, kan man til sidst finde standardafvigelsen, spredningen, dette gøres ved at tage kvadratroden af variansen, som ved ugrupperede observationer:

S =​​ S2​​ =​​ varians

Kvartilsættet:​​ findes ved at aflæse sumkurven som ved ugrupperede observationer.

Sumkurve: her benytter man de kumulerede frekvenser samt de højre intervalvendepunkter, som kurven så laves ud fra.​​ 

Højre intervalvendepunkter, har man et interval der hedder​​ ]15;20], vil det højre​​ intervalvendepunkt være 20.

Så vil jeg også udregne forsørgerbyrden, som er størrelsen på den del af befolkningen der er i alderen 0-15 samt 65-95+, og derved skal forsørges.​​ Det gør jeg​​ ved, at tage summen af de frekvenserne for de intervalgrupper der skal forsørges, så får jeg et decimaltal som blot skal ganges med 100.

 

 

 

 

 

 

 

 

 

  • Ugrupperet talmateriale​​ 

Tabel der​​ er udarbejdet efter tal for samtlige af superligaens målscorere i sæsonener 2010/2011 og 2011/2012. Tabellen​​ viser​​ antal observationer,​​ der i dette tilfælde er antal mål en spiller kan have scoret,​​ den viser​​ hyppighed,​​ der i dette tilfælde er antal​​ spillere der har scoret det antal mål som den​​ enkelte observation​​ fortæller,​​ og så viser den også​​ frekvens samt summeret frekvens.

2010/2011

 

 

 

2011/2012

 

 

Obs.

Hypp.

Frek.

Sum. Frek.

Obs.

Hypp.

Frek.

Sum. Frek.

1

59

0,37

0,37

1

54

0,34

0,34

2

26

0,16

0,54

2

36

0,23

0,57

3

19

0,12

0,66

3

16

0,10

0,67

4

20

0,13

0,78

4

11

0,07

0,74

5

8

0,05

0,84

5

12

0,08

0,81

6

8

0,05

0,89

6

4

0,03

0,84

7

7

0,04

0,93

7

8

0,05

0,89

8

3

0,02

0,95

8

8

0,05

0,94

9

2

0,01

0,96

9

4

0,03

0,96

10

0

0,00

0,96

10

2

0,01

0,97

11

0

0,00

0,96

11

1

0,01

0,98

12

3

0,02

0,98

12

0

0,00

0,98

13

0

0,00

0,98

13

1

0,01

0,99

14

1

0,01

0,99

14

1

0,01

0,99

17

1

0,01

0,99

17

0

0,00

0,99

18

0

0,00

0,99

18

1

0,01

1,00

25

1

0,01

1,00

25

0

0,00

1,00

I alt

158

 

1,00

 

159

 

1,00

 

Pindediagram der viser frekvenserne​​ for​​ scorede mål i sæsonerne 2010/2011 og 2011/2012.

 

Sumkurve der viser de summerede frekvenser for scorede mål i sæsonenerne 2010/2011 og 2011/2012.

Deskriptorer for tallene for sæson 2010/2011 ​​ 

Middeltallet = 3,28Det antal mål som spillerne​​ ​​ 2010/2011 listen​​ i gennemsnit har scoret.

Kvartilsættet:​​ 

0,25 fraktil = 1Det​​ antal mål som​​ 25% af spillerne eller​​ derunder har scoret.

0,50 fraktil = 2Det​​ antal mål som​​ 50% af spillerne eller​​ derunder har scoret.

0,75 fraktil = 4Det​​ antal mål som 75% af spillerne eller​​ derunder har scoret.

0,10 og 0,90 fraktil:

0,10 fraktil =​​ 1​​  Det antal mål som 10% af spillerne eller​​ derunder har scoret.

0,90 fraktil =​​ 7Det antal mål som 90% af spillerne eller​​ derunder har scoret.

 

Deskriptorer for tallene for sæson 2011/2012 ​​ 

Middeltallet = 3,36Det antal mål som spillerne på 2011/2012 listen i gennemsnit har scoret.

Kvartilsættet:

0,25 fraktil = 1Det​​ antal mål som​​ 25% af spillerne eller​​ derunder har scoret.

0,50 fraktil = 2Det​​ antal mål som​​ 50% af spillerne eller​​ derunder har scoret.

0,75 fraktil = 5Det​​ antal mål som​​ 75% af spillerne eller​​ derunder har scoret.

0,10 og 0,90 fraktil:

0,10 fraktil =​​ 1Det antal mål som 10% af spillerne eller​​ derunder har scoret.

0,90 fraktil =​​ 8Det antal mål som 90% af spillerne eller​​ derunder har scoret.

 

Sammenligning af de sæsoner

Skal man sammenligne de to sæsoner, kan man se at der samlet set blev scoret 1 mål mere i sæsonen 2011/2012 end der gjorde den forgange sæson 2010/2011. Der blev nemlig scoret 159 mål i alt i 2011/2012 sæsonen, mens der ”kun” blev scoret 158 mål i 2010/2011 sæsonen.​​ Det gennemsnitlige antal mål pr. scorende spiller er derfor også højest i 2011/2012 sæsonen, hvor den er på 3,36 mål pr. spiller i forhold til i 2010/2011 sæsonen hvor den er på 3,28. Altså 0,06 mål mindre pr. scorende spiller.​​ 

Dog scorede topscoreren i 2010/2011 sæsonen 25 mål i alt, hvilket er syv mål mere end topscoreren i 2011/2012 sæsonen, hvor topscoreren kun formåede at score 18 mål i alt.​​ 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • Grupperet talmateriale​​ 

Tabel der viser observationer, hyppigheder, frekvenser og summerede frekvenser for tallene for Thisteds befolkning fordelt på aldersgrupper i 2012 og 2040. Observationerne er her alder i intervaller, mens hyppighed er det antal personer der befinder sig i det enkelte interval.​​  ​​​​ ​​ 

2012

 

 

 

2040

 

 

 

Obs.

Hypp.

Frek.

Sum. Frek.

Obs.

Hypp.

Frek.

Sum. Frek.

[0;5]

2361

0,05

0,05

[0;5]

2233

0,05

0,05

]5;10]

2652

0,06

0,11

]5;10]

2431

0,06

0,11

]10;15]

2809

0,06

0,17

]10;15]

2571

0,06

0,17

]15;20]

3299

0,07

0,25

]15;20]

2566

0,06

0,23

]20;25]

2141

0,05

0,30

]20;25]

1570

0,04

0,26

]25;30]

1860

0,04

0,34

]25;30]

1733

0,04

0,31

]30;35]

2174

0,05

0,39

]30;35]

2152

0,05

0,36

]35;40]

2577

0,06

0,44

]35;40]

2303

0,05

0,41

]40;45]

2939

0,07

0,51

]40;45]

2506

0,06

0,47

]45;50]

3357

0,07

0,58

]45;50]

2629

0,06

0,53

]50;55]

3381

0,08

0,66

]50;55]

2413

0,06

0,58

]55;60]

3327

0,07

0,73

]55;60]

2222

0,05

0,64

]60;65]

3269

0,07

0,80

]60;65]

2576

0,06

0,70

]65;70]

2981

0,07

0,87

]65;70]

2686

0,06

0,76

]70;75]

2048

0,05

0,92

]70;75]

2973

0,07

0,83

]75;80]

1542

0,03

0,95

]75;80]

2717

0,06

0,89

]80;85]

1118

0,02

0,98

]80;85]

2190

0,05

0,94

]85;90]

694

0,02

0,99

]85;90]

1491

0,03

0,98

]90;95]

309

0,01

1,00

]90;95]

745

0,02

0,99

]95;∞]

70

0,00

1,00

]95;∞]

224

0,01

1,00

I alt

44908

 

1,00

I alt

42938

 

1,00

 

Pindediagram der viser fordelingen af befolkningstallet i de​​ forskellige aldersgrupper.​​ 

Sumkurve​​ der viser​​ fordelingen af befolkningens alder som summerede frekvenser.

Deskriptorer for tallene fra 2012

Middeltal =​​ 42,32 Viser den alder som Thisted befolkning i gennemsnit​​ havde i år 2012.

Kvartilsæt:

0,25 fraktil =​​ 20Det vil sige at​​ 25% af Thisteds befolkning er 20 år eller​​ derunder.

0,50​​ fraktil =​​ 45Det vil sige at 50% af Thisteds befolkning er 45 år eller derunder.

0,75​​ fraktil =​​ 60Det vil sige at 75% af Thisteds befolkning er 60 år eller derunder.

 

Deskriptorer for tallene fra 2040

Middeltal =​​ 46,49 Viser den alder som Thisted befolkning i gennemsnit formodes at​​ have i 2040.

Kvartilsæt:

0,25​​ fraktil =​​ 20Det vil sige at 25% af Thisteds befolkning vil være 20 år eller derunder.

0,50 fraktil =​​  50Det vil sige at 50% af Thisteds befolkning vil være 50 år eller derunder.

0,75 fraktil =​​  70Det vil sige at 75% af Thisteds befolkning vil være 70 år eller derunder.

 

 

Forsørgerbyrden i år 2012 og 2040:​​ 

Forsørgerbyrden i​​ 2012 =​​ 37%

Forsørgerbyrden i​​ 2040 = 47%

 

Sammenligning af Thisteds befolkning i år 2012 og 2040.

Helt generelt så formodes det,​​ at der i år 2040 er 1970 personer mindre i Thisted.​​ Og sammenligner man hyppighederne, kan man se at der for det første vil være mindre børn i aldersgruppen 0-15 år. Men det helt store spring kommer i aldersgruppen 15-25 år, hvor der forventes at være 1304 personer mindre. Så det vil altså sige, at især de unge i stor grad flytter væk fra byen, hvilket selvfølgelig er et stort problem.​​ Og desværre er det en tendens der fortsætter helt indtil vi nå aldersgruppen 70 år og op. For fra alderen 70 år og op,​​ forventes det at befolkningen vil stige med​​ hele​​ 4559.​​ Det vil sige,​​ at den del af befolkningen der skal forsørges stiger markant, hvilket er en dårlig udvikling, da det jo sker samtidig med,​​ at den del af befolkningen der skal forsørge dem falder.​​ Udviklingen kan forklares ved,​​ at​​ aldersgrupperne 35-65 vælger at blive boende i Thisted resten af deres liv, og derfor vil der om 32 år være mange ældre.​​ Mens deres børn og børnebørn i stor grad flytter væk fra byen.​​ Og der bliver derfor mindre folk i de aldersgrupper der er på arbejdsmarkedet.​​  ​​ ​​​​ ​​ ​​