Hypotesprövning med Chitvåtest



Hej!
Jag har några frågor gällande lösningen.
1) Hur kommer de på att man ska skatta p för att den är okänd?
2) innan de ställer upp ML-funktionen så påstår de att x1 , x2 är oberoende observationer och alla är likafördelade bin(n,p) . Hur vet de att s.v X1, X2,...,X_100 är oberoende och likafördelade?
3) jag hänger inte med på hur de får fram det där förväntade antal E_i. Är det inte vanliga väntevärde k*P(X=k)? Varför multiplicerar varje k=100 för att få fram Ei?
4) I uppgiften så har vi Bin(3,p) men i ML skattning så använder man n=100 i nämnare istället för n=3 vilket jag inte förstår skillnaden mellan n=100 ur data och n=3 i Bin(3,p).
Någon?
1) Ett chi squared test undersöker hur väl en viss data passar vad vi skulle förväntat oss om datan kom från någon viss fördelning.
Q = (uppmätt data - förväntad data)^2 / förväntad data
I uppgiften vill vi se om datan kommer från en Bin(3,p) fördelning. Men vi får ingen info om vad p är. Om p är litet, t.ex. 0.1, då förväntar vi oss att få många 0:or och någon enstaka 1:a. Men om p är stort, t.ex. 0.9, då förväntar vi oss istället många 2:or och 3:or.
Vad vi förväntar oss beror alltså på vad p är. För att ens kunna bestämma den förväntade data och genomföra testet behöver vi därför skatta ett värde på p.
Notera att detta innebär att vi använt upp en frihetsgrad (degree of freedom) när vi läser av tabellen för chi^2.
2) Formellt sett vet vi aldrig det om inte uppgiften explicit talar om det. Men det är ett väldigt vanligt antagande som görs, och i det här fallet skulle vi inte ha en chans att göra en ML-skattning av p utan det antagandet (eftersom likelihood-funktionen inte skulle bli en produkt av sannolikheterna). Man kan därför se det som underförstått i uppgifter som denna.
3) kP(X=k) används i väntevärdet för en enda observation. Det som räknas i uppgiften är förväntade antalet förekomster av ett visst utfall. Jämför med följande: Du har ett mynt och kastar det 100 gånger. Väntevärdet för varje kast är 0.5, om vi tänker klave = 0 och krona = 1. Detta eftersom E(X) = 0*P(X=0)+1*P(X=1)=1*0.5=0.5. Men antalet klave du förväntas få sammantaget över de 100 försöken är 100 * 0.5 = 50. Du blandar ihop hur man beräknar väntevärdet och förväntat antal förekomster vid upprepade försök.
4) Det här är bara lite notation overload... 3:an i Bin(3,p) står för antalet försök som görs inuti ett experiment. Till exempel skulle ett experiment kunna vara att kasta ett mynt 3 gånger och se hur många klave du får.
Talet 100 är antalet sådana experiment du utför.
Gustor skrev:1) Ett chi squared test undersöker hur väl en viss data passar vad vi skulle förväntat oss om datan kom från någon viss fördelning.
Q = (uppmätt data - förväntad data)^2 / förväntad data
I uppgiften vill vi se om datan kommer från en Bin(3,p) fördelning. Men vi får ingen info om vad p är. Om p är litet, t.ex. 0.1, då förväntar vi oss att få många 0:or och någon enstaka 1:a. Men om p är stort, t.ex. 0.9, då förväntar vi oss istället många 2:or och 3:or.
Vad vi förväntar oss beror alltså på vad p är. För att ens kunna bestämma den förväntade data och genomföra testet behöver vi därför skatta ett värde på p.
Notera att detta innebär att vi använt upp en frihetsgrad (degree of freedom) när vi läser av tabellen för chi^2.
2) Formellt sett vet vi aldrig det om inte uppgiften explicit talar om det. Men det är ett väldigt vanligt antagande som görs, och i det här fallet skulle vi inte ha en chans att göra en ML-skattning av p utan det antagandet (eftersom likelihood-funktionen inte skulle bli en produkt av sannolikheterna). Man kan därför se det som underförstått i uppgifter som denna.
3) kP(X=k) används i väntevärdet för en enda observation. Det som räknas i uppgiften är förväntade antalet förekomster av ett visst utfall. Jämför med följande: Du har ett mynt och kastar det 100 gånger. Väntevärdet för varje kast är 0.5, om vi tänker klave = 0 och krona = 1. Detta eftersom E(X) = 0*P(X=0)+1*P(X=1)=1*0.5=0.5. Men antalet klave du förväntas få sammantaget över de 100 försöken är 100 * 0.5 = 50. Du blandar ihop hur man beräknar väntevärdet och förväntat antal förekomster vid upprepade försök.
4) Det här är bara lite notation overload... 3:an i Bin(3,p) står för antalet försök som görs inuti ett experiment. Till exempel skulle ett experiment kunna vara att kasta ett mynt 3 gånger och se hur många klave du får.
Talet 100 är antalet sådana experiment du utför.
3) finns det någon allmän formel för att räkna ut förväntat antal förekomster? Jag blandat ihop pga det står med notationen för väntevärde.
Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Sannolikheten för varje enskilt försök att ge utfallet är . Om du gör detta gånger så kan du förvänta dig att se st utfall .
Gustor skrev:Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur?
Gustor skrev:Sannolikheten för varje enskilt försök att ge utfallet är . Om du gör detta gånger så kan du förvänta dig att se st utfall .
P(X=k) är sannolikheten att s.v X antar värdet k och nP(X=k) är antal förväntad antal gånger något händer i n försök?
destiny99 skrev:Gustor skrev:Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur?
Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna .
Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?
Gustor skrev:destiny99 skrev:Gustor skrev:Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur?
Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna .
Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?
Jaha ok. Det blir väl 100*0.5 =50 st klave om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?
destiny99 skrev:Gustor skrev:destiny99 skrev:Gustor skrev:Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur?
Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna .
Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?
Jaha ok. Det blir väl 100*0.5 =50 st klave om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?
Ja. Du multiplicerar alltså antalet försök med sannolikheten att få en klave .
Gustor skrev:destiny99 skrev:Gustor skrev:destiny99 skrev:Gustor skrev:Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av i försök är , eller vad menar du? Förstod du mitt exempel jag gav?
Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur?
Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna .
Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?
Jaha ok. Det blir väl 100*0.5 =50 st klave om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?
Ja. Du multiplicerar alltså antalet försök med sannolikheten att få en klave .
Ok så förväntad antal förekomster beräknas som Ei=n*P(X=k) tekniskt sätt?
Ja. Det följer från sambandet om man låter vara indikatorvariablerna som är lika med 1 om , annars lika med . Då är nämligen .
Gustor skrev:Ja. Det följer från sambandet om man låter vara indikatorvariablerna som är lika med 1 om , annars lika med . Då är nämligen .
Vad menas med indikatorvariablerna? Du missade förresten att multiplicera med n dvs E(Yi)=n*P(X=k)?
bump
Sorry, var iväg en sväng.
Det jag sade tidigare om att det är en typ av väntevärde är det jag försökte förtydliga med indikatorvariablerna.
Tänk dig att du har st (t.ex. kan ) likafördelade, oberoende sl.var. . Låt säga att utfallen är antingen eller . Exempelvis kan stå för krona och för klave.
Om vi vill beräkna t.ex. hur många som förväntas förekomma i försök, så tar vi sannolikheten för att gånger , dvs. . Men varför blir det just så?
Ett sätt att se situationen är att vi inför en hjälpvariabel sådan att
, och
.
Variabeln indikerar om variabeln får utfallet genom att anta värdet , och i annat fall är . Detta betyder att varje gång en av variablerna får det utfall vi söker, så räknar det som 1, och alla andra utfall räknas som 0 (i just detta fall finns bara ett annat utfall ).
Med andra ord är det förväntade antalet vi får i ett försök lika med . Vi har konstruerat precis så att , och kallas för indikatorvariabeln av utfallet/händelsen .
Antalet vi får på försök blir då samma som
.