Meddelande

Du befinner dig just nu på en äldre version av Pluggakuten, gamla.pluggakuten.se. Nya Pluggakuten lanserades den 6 februari 2017 och du finner forumet på www.pluggakuten.se.

På gamla.pluggakuten.se kan du fortfarande läsa frågorna och svaren som ställts, men du kan inte skapa ett nytt konto eller nya trådar. Nya frågor och nytt konto skapar du på det nya forumet, välkommen dit!

[HSM]Praktisk förklaring av varians och standardavikelse?

PimpNamedSlickBack
Medlem

Offline

Registrerad: 2011-11-01
Inlägg: 633

[HSM]Praktisk förklaring av varians och standardavikelse?

Hej!

Jag är en praktiker och jag är inte direkt lämpad för matte, men jag ger inte upp. Jag undrar om någon kan ge en praktisk förklaring till varians och standardavikelse?

Exempel när det gäller väntevärde:
Antag att man singlar slant 1000 gånger. Slanten är symetrisk och oberoende. Då borde man ligga ganska nära 500/500. Inte 100/900 eller 700/300. Man förväntar sig en jämnvikt = väntevärde.

 
Skaft
Moderator

Offline

Registrerad: 2009-01-02
Inlägg: 3864

Re: [HSM]Praktisk förklaring av varians och standardavikelse?

Jag kan göra ett försök, med den typ av resonemang som gjorde det logiskt för mig. Huruvida det passar in på vad du anser vara en "praktisk" förklaring får du själv avgöra smile

Jämför dessa datamängder:

A: 0, 49, 50, 51, 100
B: 0, 1, 50, 99, 100

Båda har samma median, samma medelvärde, samma typvärde... Många av de vanliga verktyg vi använder för att beskriva datamängder skulle inte "märka" att de är väldigt olika. Skillnaden är i graden av spridning. Värdena i A ligger ju "totalt sett" närmare mitten, och det vill vi ha ett verktyg som beskriver. Ett sätt att mäta spridning är variationsbredd, men även den är samma för de två mängderna. Varians och standardavvikelse är verktyg som snappar upp och mäter dessa spridningsskillnader, och vill du veta mer om själva formlerna kan du läsa vidare i spoilern.

Spoiler (Klicka för att visa):

Vi konstaterade ju att A-värdena ligger närmare mitten. Då borde vi väl kunna mäta skillnaden mellan varje värde och mitten, summera dessa skillnader och ta det som ett mått på spridning? Vi prövar. Mittenvärdet vi mäter mot är alltså 50.

A: LaTeX ekvation
B: LaTeX ekvation

Det gick ju sådär, enligt den mätmetoden har datamängderna samma spridning. Problemet är att några skillnader blir negativa, andra positiva och då tar de ut varandra. Det vill vi inte: Graden av utspridning beror inte på vilket håll om mitten värdena ligger, om du förstår hur jag menar. Mängderna (0,5,9,10) och (0,1,5,10) borde vara "lika utspridda", och då måste vår metod bortse från minustecken som uppstår. Ett sätt att lösa det är att helt enkelt kvadrera varje beräknad skillnad. Då blir alla värden positiva:

A: LaTeX ekvation
B: LaTeX ekvation

Den mer utspridda datamängden ger ett större värde, så den här metoden verkar vara ett hyfsat sätt att beräkna spridning. En brist i metoden är att det är enbart en summa. Det innebär att ju fler värden vi har, desto större kommer summan bli - även om spridningen egentligen inte ökar med de nya värdena. Det blir missvisande. Dessutom kan vi inte rättvist jämföra datamängder med olika antal element på det här sättet. Därför tar vi istället genomsnittet av alla dessa avståndskvadrater:

A: LaTeX ekvation

B: LaTeX ekvation

Bristen är åtgärdad, och detta borde alltså vara ett rätt bra sätt att mäta datamängders spridning. Det vi gjort är att beräkna variansen.

En invändning man kan ha är att eftersom vi kvadrerat på vägen så kommer vi få en märklig enhet. Om de värden vi använt är t.ex. längderna på elever i en klass i cm, kommer variansen vara ett tal med enhet cmLaTeX ekvation. Förvirrande! Tar vi då roten ur svaret får vi samma enhet som värdena själva:

A: LaTeX ekvation

B: LaTeX ekvation

Detta är alltså datamängdernas standardavvikelse.


We don't have bodies, we are bodies.
 
PimpNamedSlickBack
Medlem

Offline

Registrerad: 2011-11-01
Inlägg: 633

Re: [HSM]Praktisk förklaring av varians och standardavikelse?

Hej.

Kan du inte ta ett exempel om att singla slant? smile

 
Russell
Moderator

Offline

Registrerad: 2013-08-22
Inlägg: 2608

Re: [HSM]Praktisk förklaring av varians och standardavikelse?

Utmärkt förklaring, dagen till ära. smile


The road to wisdom?—Well, it's plain and simple to express:
Err and err and err again, but less and less and less.
 
Skaft
Moderator

Offline

Registrerad: 2009-01-02
Inlägg: 3864

Re: [HSM]Praktisk förklaring av varians och standardavikelse?

PimpNamedSlickBack skrev:

Hej.

Kan du inte ta ett exempel om att singla slant? smile

Inte på ett hjälpsamt sätt, varians och standardavvikelse har inte med sannolikhetslära att göra. Men om du vill kan du tänka på värdena jag gav som antal inlägg på Pluggakuten som två användare gör under 5 dagar: Anders skriver 0 inlägg på måndagen, 49 inlägg på tisdagen, osv. Boris skriver 0 inlägg på måndagen, 1 inlägg på tisdagen osv. Deras inlägg mellan måndag och fredag är:

A: 0, 49, 50, 51, 100
B: 0, 1, 50, 99, 100

Vem av de två användarna är mest konsekvent med hur många inlägg som skrivs per dag, och vem är mest "spretig"? Det är det varians och standardavvikelse mäter.

Russell skrev:

Utmärkt förklaring, dagen till ära. smile

Kul att någon gillade den, haha smile Och tack för infon, det hade jag missat!


We don't have bodies, we are bodies.
 


Sidfot

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson

Powered by Mattecentrum
 |  Denna sida använder cookies |  Kontakta oss |  Feedback |