Statistik - lådagram

Frågan gäller uppgift b)

Jag trodde att 1050 var den enda uteliggare, men 11 är också.

Hur blir det så?

Lådans längd * 1,5 = 405

Vilken blev medianen? Vilken blev övre kvartilen? Vilken blev nedre kvartilen?

Skall man gå på Wikipedias definition (som stämmer med beskrivningen i bilden) så borde det bara vara 1050 som är en utliggare (utan "e" i mitten").

Ok. Tack smaragdalena. . Men då avslutar jag frågan.

Om inte någon annan har något att tillägga🙂

M4t3m4t1k skrev:

Frågan gäller uppgift b)

Jag trodde att 1050 var den enda uteliggare, men 11 är också.

Hur blir det så?

Lådans längd * 1,5 = 405

Du bör be din lärare att hoppa över denna typ av uppgift. Det står klart och tydligt i kommentarsmaterialet från skolverket att man inte ska räkna för hand på dessa saker. Citat:

Skolverket: Ämnesplanen föreskriver inte att eleverna ska kunna göra beräkningar på dessa
läges- eller spridningsmått för hand. Detta motiveras med att måtten i regel endast
är meningsfulla när mätvärdena är så många att manuella beräkningar är orimliga.

Dessutom finns det åtminstone 5 olika sätt att beräkna första och tredje kvartilen på varav de sätt som förespråkas i de flesta läroböcker är bland de sämre metoderna. Den mest korrekta som gör att det blir den mest naturliga övergången till det kontinuerliga fallet är om vi låter materialet ha n stycken data och sorterar de i en lista i växande ordning enligt

[11 158 250 350 390 405 423 450 510 530 580 590 600 620 705 820 1050]

vårt n blir då 17. Avståndet mellan den första datapunkten och den sista datapunkten är naturligtvis n-1=17-1=16. Avståndet mellan varje indelning blir därmed (n-1)/4. Om vi indexerar från 1 till och med n fås därmed de fem lägesmåtten av 1+k*(n-1)/4 där k är den k:te kvartilen. Med lite aritmetik får vi därmed fram att indexen hittas enligt

Minsta värde: 1

Första kvartil: (n+3)/4

Andra kvartil: (n+1)/2

Tredje kvartil: (3n+1)/4

Största värde: n

I fallet få n har resten 1 vid division med 4 (som i vårt fall) blir alla index heltal och vi behöver faktiskt inte interpolera alls.

Vi får alltså:

Första kvartil (17+3)/4 = 5 => 390 (femte värdet)

Andra kvartil (median) (17+1)/2 = 9 => 510 (nionde värdet)

Tredje kvartil (3•17+1)/4 = 13 => 600 (trettonde värdet)

Kvartilavståndet blir därmed 600-390=210.

Uteliggare är därmed värden under 390-210•1.5=75 eller över 600+210•1.5=915.

Därmed blir både 11 och 1050 uteliggare.

Det är denna metod som bland annat Python och R använder sig. R vid både summary och quantile-funktionerna.

Observera att detta inte är någon av de fyra metoderna som omtalas i Wikipedia. Som vanligt är Wikipediaartiklarna som handlar om matematisk statistik slarvigt gjorda (särskilt de engelska). Metod 4 som tillkom för inte så många år sedan är verkligen inte bra då den behandlar datapunkterna som fysiska enheter och dessutom förmodar extremvärderna ska vara områden utanför datamängden, vilket gör det problematiskt i många avseenden. Därför lutar det starkt mot att om vi någonsin kommer få standardiserade kvartiler så kommer det bli metoden jag beskrev i exemplet. Men under tiden bör man inte slösa tid på att kräva att elever i Matematik 2 ska manuellt beräkna första och tredje kvartil...

Svara

Visa senaste svar