Hoppande partikel: Skillnad mellan intuition och algebra
Hej!
Jag jobbade med följande uppgift:
En partikel startar i punkten 0. Den hoppar först ett steg åt höger eller vänster (dvs till med lika sannolikhet). Därnäst från sin nya position ånyo ett steg, åt höger eller vänster med lika sannolikhet och oberoende av första hoppet. Låt X och Y vara partikelns läge efter 1:a respektive 2:a hoppet. Beräkna: a) simultana sannolikhetsfunktionen för X och Y. b) Korrekationskoefficenten för X och Y
(Gunnar Blom m. f.l, Sannolikhetsteori och statistikteori med tillämpningar uppgift 5.19)
Min lösningsgång är i princip identisk med lösningsförslaget, så jag lägger in en skärmdump på den istället för mina plottriga anteckningar:
Den är b) som jag funderar på. Vi får att . Jag får samma algebraiskt, jag fattar lösningsgången, men jag stannade upp när jag löste uppgiften själv och fick att . Som jag har förstått det kan tolkas som att "om X ökar i värde, så ökar Y i värde". Men låt säga att , dvs . Nu inför andra hoppet kan den hoppa till och med lika stor sannolikhet. Alltså är det lika stor sannolikhet att ökar i värde om ökar i värde som att minskar i värde om ökar i värde. Och därav borde rent inutitivt (enligt min egna intuition iallafall). Eller har jag missuppfattat hur korrelation funkar?
Nja, det ska inte vara , utan . Är kovariansen positiv så korrelerar de positiva värdena för med de positiva värdena för och på samma sätt för de negativa värdena. Är kovariansen negativ gäller det omvända (positiva värden hos korrelerar med negativa värden hos och vice versa).
Detta handlar alltså inte om ökning eller minskning, utan en positiv korrelation betyder snarare att om vi utför ett experiment många gånger så kommer värdena för och tendera att falla över eller under sina väntevärden samtidigt.
Säg att ett experiment ger något utfall över väntevärdet, . Om detta ökar sannolikheten för att ge ett utfall över sitt väntevärde, ja då finns en positiv korrelation mellan och .
Så exempelvis om så är antingen 0 eller 2 med samma sannolikhet, vilket vi kan skriva . På samma sätt är . Däremot är . Så det verkar rimligt att kovariansen är positiv.
Gustor skrev:Nja, det ska inte vara , utan . Är kovariansen positiv så korrelerar de positiva värdena för med de positiva värdena för och på samma sätt för de negativa värdena. Är kovariansen negativ gäller det omvända (positiva värden hos korrelerar med negativa värden hos och vice versa).
Detta handlar alltså inte om ökning eller minskning, utan en positiv korrelation betyder snarare att om vi utför ett experiment många gånger så kommer värdena för och tendera att falla över eller under sina väntevärden samtidigt.
Säg att ett experiment ger något utfall över väntevärdet, . Om detta ökar sannolikheten för att ge ett utfall över sitt väntevärde, ja då finns en positiv korrelation mellan och .
Så exempelvis om så är antingen 0 eller 2 med samma sannolikhet, vilket vi kan skriva . På samma sätt är . Däremot är . Så det verkar rimligt att kovariansen är positiv.
Tack för svaret! var ett skrivfel från min sida, ber om ursäkt. Betingade väntevärden ingår inte i min kurs, men jag tror att jag hade missförstått hur kovariansen kan tolkas. Har jag förstått det rätt nu? Givet mitt tidigare exempel: partikeln hoppar från till . Då kan partikeln antingen hoppa tillbaka till eller till . Vi kommer alltså få att antar ett värde mellan 0 och 2. Eftersom , och , så antar värden som är lika med eller större än sitt väntevärde när gör detsamma (eftersom ).
Då kommer en följdfråga: Hur är det med korrelationskoefficienten . Här gäller det väl att om en ökning i X leder till en minskning i Y och att om en ökning i X leder till en ökning i Y? Dvs. för är ökningar och minskningar en relevant tolkning. Eller jag missförstått?
Ja, i princip. Det som avgör om det finns en korrelation är om det förväntade värdet på förändras givet att vi vet något om . Alltså att om (partikeln hoppar till 1) så gör denna information att vårt nya förväntade värde på blir 1. Har vi inte denna information så är .
När vi skriver så betyder detta "det förväntade värdet (väntevärdet) av givet att vi vet att , dvs. partikeln har hoppat till 1, är lika med 1".
När vi skriver betyder det "det förväntade värdet av utan någon ytterligare information om vilket värde antar är noll".
Du kan tänka på korrelationskoefficienten som en slags normaliserad kovarians.
Korrelationskoefficienten är ett alltid ett tal mellan och , medan kovariansen kan vara lite vad som helst beroende på vilka värden som och antar. Om t.ex. kovariansen för och är, säg, , så kan vi inte dra slutsatsen att detta är ett starkare eller svagare samband än för variablerna och som har kovariansen . Det beror helt enkelt på vad variablerna antar för värden.
Kovariansen har även en enhet som man får genom att multiplicera enheten för med enheten för .
I korrelationskoefficienten delar man med standardavvikelserna för och och erhåller därmed ett reellt tal utan enhet, som kan vara fördelaktigt.
Korrelationskoefficienten är precis som kovariansen ett mått på i vilken utsträckning två variabler är linjärt relaterade. Det finns alltså två skillnader: korrelationskoefficienten har ingen enhet (den är dimensionslös), och den är alltid ett tal mellan och . Om den är (eller ) så ligger alla värdena exakt på en rät linje i en vanlig -plot. Det finns alltså ett "perfekt" linjärt förhållande mellan variablerna.
En fördel med att använda korrelationskoefficienten är att om och så är korrelationen mellan och i någon mening starkare än det för och .
Här är en användbar bild med några -plottar och deras korrelationskoefficient:
Från: https://en.wikipedia.org/wiki/Correlation.
Notera att i den horisontella linjen i mitten så är variansen för noll, så korrelationskoefficienten är inte definierad där. Notera också att det finns tydliga samband i den nedre raden, men dessa är av icke-linjära karaktärer, och fångas inte av korrelationskoefficienten.
Det gäller förstås även att kovariansen är positiv när korrelationskoefficienten är positiv, och vice versa.