Meddelande
På gamla.pluggakuten.se kan du fortfarande läsa frågorna och svaren som ställts, men du kan inte skapa ett nytt konto eller nya trådar. Nya frågor och nytt konto skapar du på det nya forumet, välkommen dit!
[HSM]Praktisk förklaring av varians och standardavikelse?
- PimpNamedSlickBack
- Medlem
Offline
- Registrerad: 2011-11-01
- Inlägg: 633
[HSM]Praktisk förklaring av varians och standardavikelse?
Hej!
Jag är en praktiker och jag är inte direkt lämpad för matte, men jag ger inte upp. Jag undrar om någon kan ge en praktisk förklaring till varians och standardavikelse?
Exempel när det gäller väntevärde:
Antag att man singlar slant 1000 gånger. Slanten är symetrisk och oberoende. Då borde man ligga ganska nära 500/500. Inte 100/900 eller 700/300. Man förväntar sig en jämnvikt = väntevärde.
- Skaft
- Moderator
Offline
- Registrerad: 2009-01-02
- Inlägg: 3864
Re: [HSM]Praktisk förklaring av varians och standardavikelse?
Jag kan göra ett försök, med den typ av resonemang som gjorde det logiskt för mig. Huruvida det passar in på vad du anser vara en "praktisk" förklaring får du själv avgöra
Jämför dessa datamängder:
A: 0, 49, 50, 51, 100
B: 0, 1, 50, 99, 100
Båda har samma median, samma medelvärde, samma typvärde... Många av de vanliga verktyg vi använder för att beskriva datamängder skulle inte "märka" att de är väldigt olika. Skillnaden är i graden av spridning. Värdena i A ligger ju "totalt sett" närmare mitten, och det vill vi ha ett verktyg som beskriver. Ett sätt att mäta spridning är variationsbredd, men även den är samma för de två mängderna. Varians och standardavvikelse är verktyg som snappar upp och mäter dessa spridningsskillnader, och vill du veta mer om själva formlerna kan du läsa vidare i spoilern.
Spoiler (Klicka för att visa):
Vi konstaterade ju att A-värdena ligger närmare mitten. Då borde vi väl kunna mäta skillnaden mellan varje värde och mitten, summera dessa skillnader och ta det som ett mått på spridning? Vi prövar. Mittenvärdet vi mäter mot är alltså 50.
A:
B:
Det gick ju sådär, enligt den mätmetoden har datamängderna samma spridning. Problemet är att några skillnader blir negativa, andra positiva och då tar de ut varandra. Det vill vi inte: Graden av utspridning beror inte på vilket håll om mitten värdena ligger, om du förstår hur jag menar. Mängderna (0,5,9,10) och (0,1,5,10) borde vara "lika utspridda", och då måste vår metod bortse från minustecken som uppstår. Ett sätt att lösa det är att helt enkelt kvadrera varje beräknad skillnad. Då blir alla värden positiva:
A:
B:
Den mer utspridda datamängden ger ett större värde, så den här metoden verkar vara ett hyfsat sätt att beräkna spridning. En brist i metoden är att det är enbart en summa. Det innebär att ju fler värden vi har, desto större kommer summan bli - även om spridningen egentligen inte ökar med de nya värdena. Det blir missvisande. Dessutom kan vi inte rättvist jämföra datamängder med olika antal element på det här sättet. Därför tar vi istället genomsnittet av alla dessa avståndskvadrater:
A:
B:
Bristen är åtgärdad, och detta borde alltså vara ett rätt bra sätt att mäta datamängders spridning. Det vi gjort är att beräkna variansen.
En invändning man kan ha är att eftersom vi kvadrerat på vägen så kommer vi få en märklig enhet. Om de värden vi använt är t.ex. längderna på elever i en klass i cm, kommer variansen vara ett tal med enhet cm. Förvirrande! Tar vi då roten ur svaret får vi samma enhet som värdena själva:
A:
B:
Detta är alltså datamängdernas standardavvikelse.
We don't have bodies, we are bodies.
- PimpNamedSlickBack
- Medlem
Offline
- Registrerad: 2011-11-01
- Inlägg: 633
Re: [HSM]Praktisk förklaring av varians och standardavikelse?
Hej.
Kan du inte ta ett exempel om att singla slant?
- Russell
- Moderator
Offline
- Registrerad: 2013-08-22
- Inlägg: 2608
Re: [HSM]Praktisk förklaring av varians och standardavikelse?
Utmärkt förklaring, dagen till ära.
The road to wisdom?—Well, it's plain and simple to express:
Err and err and err again, but less and less and less.
- Skaft
- Moderator
Offline
- Registrerad: 2009-01-02
- Inlägg: 3864
Re: [HSM]Praktisk förklaring av varians och standardavikelse?
PimpNamedSlickBack skrev:
Hej.
Kan du inte ta ett exempel om att singla slant?
Inte på ett hjälpsamt sätt, varians och standardavvikelse har inte med sannolikhetslära att göra. Men om du vill kan du tänka på värdena jag gav som antal inlägg på Pluggakuten som två användare gör under 5 dagar: Anders skriver 0 inlägg på måndagen, 49 inlägg på tisdagen, osv. Boris skriver 0 inlägg på måndagen, 1 inlägg på tisdagen osv. Deras inlägg mellan måndag och fredag är:
A: 0, 49, 50, 51, 100
B: 0, 1, 50, 99, 100
Vem av de två användarna är mest konsekvent med hur många inlägg som skrivs per dag, och vem är mest "spretig"? Det är det varians och standardavvikelse mäter.
Russell skrev:
Utmärkt förklaring, dagen till ära.
Kul att någon gillade den, haha Och tack för infon, det hade jag missat!
We don't have bodies, we are bodies.