15 svar
236 visningar
destiny99 12231
Postad: 20 maj 13:39 Redigerad: 20 maj 14:08

Hypotesprövning med Chitvåtest

Hej! 

 

Jag har några frågor gällande lösningen.

1)  Hur kommer de på att man ska skatta p för att den är okänd? 

2) innan de ställer upp ML-funktionen så påstår de att x1 , x2 är oberoende observationer och alla är  likafördelade bin(n,p) . Hur vet de att s.v X1, X2,...,X_100 är oberoende och likafördelade?

3) jag hänger inte med på hur de får fram det där förväntade antal E_i. Är det inte vanliga väntevärde k*P(X=k)? Varför multiplicerar varje k=100 för att få fram Ei?

4) I uppgiften så har vi Bin(3,p) men i ML skattning så använder man n=100 i nämnare istället för n=3  vilket jag inte förstår skillnaden mellan n=100 ur data och n=3 i Bin(3,p). 

destiny99 12231
Postad: 21 maj 09:19

Någon?

Gustor 875
Postad: 21 maj 18:11 Redigerad: 21 maj 18:14

1) Ett chi squared test undersöker hur väl en viss data passar vad vi skulle förväntat oss om datan kom från någon viss fördelning.

Q = (uppmätt data - förväntad data)^2 / förväntad data

I uppgiften vill vi se om datan kommer från en Bin(3,p) fördelning. Men vi får ingen info om vad p är. Om p är litet, t.ex. 0.1, då förväntar vi oss att få många 0:or och någon enstaka 1:a. Men om p är stort, t.ex. 0.9, då förväntar vi oss istället många 2:or och 3:or.

Vad vi förväntar oss beror alltså på vad p är. För att ens kunna bestämma den förväntade data och genomföra testet behöver vi därför skatta ett värde på p.

Notera att detta innebär att vi använt upp en frihetsgrad (degree of freedom) när vi läser av tabellen för chi^2.

2) Formellt sett vet vi aldrig det om inte uppgiften explicit talar om det. Men det är ett väldigt vanligt antagande som görs, och i det här fallet skulle vi inte ha en chans att göra en ML-skattning av p utan det antagandet (eftersom likelihood-funktionen inte skulle bli en produkt av sannolikheterna). Man kan därför se det som underförstått i uppgifter som denna.

3) kP(X=k) används i väntevärdet för en enda observation. Det som räknas i uppgiften är förväntade antalet förekomster av ett visst utfall. Jämför med följande: Du har ett mynt och kastar det 100 gånger. Väntevärdet för varje kast är 0.5, om vi tänker klave = 0 och krona = 1. Detta eftersom E(X) = 0*P(X=0)+1*P(X=1)=1*0.5=0.5. Men antalet klave du förväntas få sammantaget över de 100 försöken är 100 * 0.5 = 50. Du blandar ihop hur man beräknar väntevärdet och förväntat antal förekomster vid upprepade försök.

4) Det här är bara lite notation overload... 3:an i Bin(3,p) står för antalet försök som görs inuti ett experiment. Till exempel skulle ett experiment kunna vara att kasta ett mynt 3 gånger och se hur många klave du får. 

Talet 100 är antalet sådana experiment du utför.

destiny99 12231
Postad: 21 maj 20:22
Gustor skrev:

1) Ett chi squared test undersöker hur väl en viss data passar vad vi skulle förväntat oss om datan kom från någon viss fördelning.

Q = (uppmätt data - förväntad data)^2 / förväntad data

I uppgiften vill vi se om datan kommer från en Bin(3,p) fördelning. Men vi får ingen info om vad p är. Om p är litet, t.ex. 0.1, då förväntar vi oss att få många 0:or och någon enstaka 1:a. Men om p är stort, t.ex. 0.9, då förväntar vi oss istället många 2:or och 3:or.

Vad vi förväntar oss beror alltså på vad p är. För att ens kunna bestämma den förväntade data och genomföra testet behöver vi därför skatta ett värde på p.

Notera att detta innebär att vi använt upp en frihetsgrad (degree of freedom) när vi läser av tabellen för chi^2.

2) Formellt sett vet vi aldrig det om inte uppgiften explicit talar om det. Men det är ett väldigt vanligt antagande som görs, och i det här fallet skulle vi inte ha en chans att göra en ML-skattning av p utan det antagandet (eftersom likelihood-funktionen inte skulle bli en produkt av sannolikheterna). Man kan därför se det som underförstått i uppgifter som denna.

3) kP(X=k) används i väntevärdet för en enda observation. Det som räknas i uppgiften är förväntade antalet förekomster av ett visst utfall. Jämför med följande: Du har ett mynt och kastar det 100 gånger. Väntevärdet för varje kast är 0.5, om vi tänker klave = 0 och krona = 1. Detta eftersom E(X) = 0*P(X=0)+1*P(X=1)=1*0.5=0.5. Men antalet klave du förväntas få sammantaget över de 100 försöken är 100 * 0.5 = 50. Du blandar ihop hur man beräknar väntevärdet och förväntat antal förekomster vid upprepade försök.

4) Det här är bara lite notation overload... 3:an i Bin(3,p) står för antalet försök som görs inuti ett experiment. Till exempel skulle ett experiment kunna vara att kasta ett mynt 3 gånger och se hur många klave du får. 

Talet 100 är antalet sådana experiment du utför.

3) finns det någon allmän formel för att räkna ut förväntat antal förekomster? Jag blandat ihop pga det står med notationen för väntevärde. 

Gustor 875
Postad: 21 maj 21:24 Redigerad: 21 maj 21:48

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Gustor 875
Postad: 21 maj 21:37

Sannolikheten för varje enskilt försök att ge utfallet kk är P(X=k)P(X=k). Om du gör detta nn gånger så kan du förvänta dig att se nP(X=k)nP(X=k) st utfall kk.

destiny99 12231
Postad: 21 maj 22:27
Gustor skrev:

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur? 

destiny99 12231
Postad: 21 maj 22:34
Gustor skrev:

Sannolikheten för varje enskilt försök att ge utfallet kk är P(X=k)P(X=k). Om du gör detta nn gånger så kan du förvänta dig att se nP(X=k)nP(X=k) st utfall kk.

P(X=k) är sannolikheten att s.v X antar värdet k och nP(X=k) är antal förväntad antal gånger något händer i n försök?

Gustor 875
Postad: 21 maj 23:45
destiny99 skrev:
Gustor skrev:

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur? 

Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna XiX_i.

Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?

destiny99 12231
Postad: 22 maj 07:33
Gustor skrev:
destiny99 skrev:
Gustor skrev:

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur? 

Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna XiX_i.

Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?

Jaha ok. Det blir väl 100*0.5 =50 st klave  om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?

Gustor 875
Postad: 22 maj 12:09
destiny99 skrev:
Gustor skrev:
destiny99 skrev:
Gustor skrev:

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur? 

Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna XiX_i.

Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?

Jaha ok. Det blir väl 100*0.5 =50 st klave  om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?

Ja. Du multiplicerar alltså antalet försök n=100n=100 med sannolikheten att få en klave P(X=klave)=0.5P(X=\text{klave})=0.5.

destiny99 12231
Postad: 27 jun 12:59
Gustor skrev:
destiny99 skrev:
Gustor skrev:
destiny99 skrev:
Gustor skrev:

Well, ja, förväntade antalet förekomster är ett typ av väntevärde. Förväntade antalet förekomster av kk i nn försök är nP(X=k)nP(X=k), eller vad menar du? Förstod du mitt exempel jag gav?

Jag försöker bara förstå hur man ska beräkna förväntad antal Ei här så därför undrar jag hur man borde göra så att jag kan göra det själv i framtiden. Det verkar inte vara samma sak som väntevärde eller hur? 

Det är ett typ av väntevärde, men inte väntevärde för någon av slumpvariablerna XiX_i.

Säg att du kastar ett mynt. Du får klave med sannolikhet 0.5. Hur skulle du räkna ut hur många klave du förväntas få om du kastade 100 gånger?

Jaha ok. Det blir väl 100*0.5 =50 st klave  om jag kastar 100 gånger med samma sannolikhet varje gång. Stämmer min förklaring i #8?

Ja. Du multiplicerar alltså antalet försök n=100n=100 med sannolikheten att få en klave P(X=klave)=0.5P(X=\text{klave})=0.5.

Ok så förväntad antal förekomster beräknas som Ei=n*P(X=k)  tekniskt sätt?

Gustor 875
Postad: 27 jun 14:02

Ja. Det följer från sambandet E(Yi)=E(Yi)E(\sum Y_i) = \sum E(Y_i) om man låter YiY_i vara indikatorvariablerna som är lika med 1 om X=kX=k, annars lika med 00. Då är nämligen E(Yi)=P(Xi=k)E(Y_i)=P(X_i=k).

destiny99 12231
Postad: 27 jun 16:20
Gustor skrev:

Ja. Det följer från sambandet E(Yi)=E(Yi)E(\sum Y_i) = \sum E(Y_i) om man låter YiY_i vara indikatorvariablerna som är lika med 1 om X=kX=k, annars lika med 00. Då är nämligen E(Yi)=P(Xi=k)E(Y_i)=P(X_i=k).

Vad menas med indikatorvariablerna? Du missade förresten att multiplicera med n dvs E(Yi)=n*P(X=k)?

destiny99 12231
Postad: 28 jun 18:15

bump

Gustor 875
Postad: 2 jul 15:11 Redigerad: 2 jul 15:38

Sorry, var iväg en sväng.

Det jag sade tidigare om att det är en typ av väntevärde är det jag försökte förtydliga med indikatorvariablerna.

Tänk dig att du har kk st (t.ex. kan k=100k=100) likafördelade, oberoende sl.var. XiX_i. Låt säga att utfallen är antingen Xi=aX_i=a eller Xi=bX_i=b. Exempelvis kan aa stå för krona och bb för klave.

Om vi vill beräkna t.ex. hur många aa som förväntas förekomma i kk försök, så tar vi sannolikheten för att Xi=aX_i=a gånger kk, dvs. kP(Xi=a)kP(X_i=a). Men varför blir det just så?

Ett sätt att se situationen är att vi inför en hjälpvariabel YY sådan att

Y=1  om  Xi=aY=1\quad\text{om}\quad X_i=a, och

Y=0  om  XiaY=0\quad\text{om}\quad X_i\neq a.

Variabeln YY indikerar om variabeln XiX_i får utfallet aa genom att anta värdet 11, och i annat fall är Y=0Y=0. Detta betyder att varje gång en av variablerna XiX_i får det utfall vi söker, så räknar YY det som 1, och alla andra utfall räknas som 0 (i just detta fall finns bara ett annat utfall bb).

Med andra ord är det förväntade antalet aa vi får i ett försök lika med E(Y)=P(Xi=a)E(Y)= P(X_i=a). Vi har konstruerat YY precis så att E(Y)=P(Xi=a)E(Y)=P(X_i=a), och YY kallas för indikatorvariabeln av utfallet/händelsen aa.

Antalet aa vi får på kk försök blir då samma som

E(Y+Y++Y)=E(kY)=kP(Xi=a)E(Y+Y+\dots +Y) = E(kY) = kP(X_i=a).

Svara
Close