Regresjon, statistisk regresjon
- Regresjon
- Regresjon er å finne en funksjon som passer til et datasett. Altså, en funksjon som går gjennom, eller er nærmest mulig flest mulig punkter i datasettet.
- Kan ofte forklare en tilsynelatende endring fra test 1 til test 2. Sett at en person skårer svært dårlig på første test, sjansen for at en person skårer like dårlig ved neste test er statistisk liten. Personen vil ganske sikkert prestere noe mindre ekstremt, dvs. noe i retning av en gjennomssnittskåre (derfor kalles dette fenomenet for regresjon mot gjennomsnittet).
- Brukes for å estimere nye verdier.
- b1=r*(Sy/Sx)
- r=korrelasjonskoeffisient
- b0=(gsn(y))-b1 * (gjsn(x))
- b0=(gsn(y))-(r*(Sy/Sx)) * (gjsn(x))
- y^ = b0+b1x
- y^=regresjonslinjens stigningstall/formel, feks "-18+0,01x"
- feks x=inntekt, y=sparing
- sparing=b0+b1*inntekt
- sparing=(gsn(sparing))-(r*(S(sparing)/S(inntekt))) * (gjsn(inntekt))+(r*(S(sparing)/S(inntekt)))*inntekt
- sparing=b0+b1*inntekt
- På kalkulator:
- Legg inn dataer:
- X-verdi
- Input
- Y-verdi
- E+
- osv
- stddev, standardavvik
- rød
- 8 (Sx, Sy)
- =standardavvik av x
- rød
- swap
- =standardavvik av y
- b1=m-tast (swap?)
- b0=b-tast (swap?)
- Legg inn dataer:
- I JMP:
- Fit Y by X
- Fit Line
- Regresjonslinje=Linear Fit
- Forklaringskraft:
- R^2=r^2
- R^2=korrelasjon^2=forklart andel.
- Regresjonsanalyse
Basert på at sammenhengen mellom en avhengig variabel Y og et sett uavhengige variabler (X), kan framstilles i form av en lineær funksjon.
- Regresjonskoffisienten (b1)
Viser endringen i Y når X endres med en måleenhet, kontrollert for de andre variablene i modellen. Koeffisient fra regresjonslikning som viser forventet forskjell i verdi på den avhengige variabelen når en uavhengig variabel øker med én skalaenhet.
- Regresjonskonstanten (b0)
Predikert verdi av Y når x-variablene i en regresjonsmodell settes til null. - regresjonsvekt
Forskjellige typer regresjon
- Bivariat regresjon (enkel regresjon)
Regresjon med bare en y- og en x-variabel. - Cox-regresjon
En form for regresjonsanalyse for forløpsdata der det tas hensyn til sensurering, det vil si at alle episoder ikke er avsluttet (f.eks. at ikke alle er døde ved prosjektets avslutning). - ikke-lineær regresjon
- lineær regresjon, linear regression
- Logistisk regresjon
Regresjon basert på en logit-transformasjon av Y. Koeffisientene kan ikke estimeres med minste kvadraters metode.- Pseudo R2 (logistisk regresjon)
(–2LL0 – –2LLM) / –2LL0.
- Pseudo R2 (logistisk regresjon)
- minste kvadraters regresjon
minste kvadraters regresjonslinje - Multippel regresjon
Regresjon med en y- og minst to x-variabler. - Multivariat regresjon
- Residualer (restledd)
I en regresjonslikning er residualene forskjellen mellom observerte og predikerte verdier av Y, eller mer presist for bivariat regresjon: ei = Yi – (b0 + b1 Xi).
Estimert regresjonsligning
Estimate | Std.error | t value | Pr | |
---|---|---|---|---|
Intercept, b0 | 441,86 | 31,74 | 13,92 | 0 |
Utdanningsår, b1 | 24,49 | 5,06 | 4,84 | 0 |
Estmert regresjonslinje | 441,86+24,49x |
Oppgv 25.5 | ||||
---|---|---|---|---|
Utvalg | 27 | |||
Estimate | Standardfeil | t-verdi | Pr | |
Intercept, b0 | 498,058 | 38,212 | 13,034 | 0 |
Timer selvstudium, b1 | 1,528 | 2,159 | 0,708 | 0,486 |
b0=intercept estimate | ||||
b1=timer estimate | ||||
A) Estimert regresjonsligning: | Y^=498,058+1,528x | |||
B) Krysningspunkt: Interceptestimat er den forventede karakteren for dem som leser 0 | ||||
C) 95% konfidensintervall b0 | ||||
Frihetsgrader | 25 | n-2 fordi det er gruppesammenligning | ||
z-verdi, testobservator, t* | 2,06 | Kritisk verdi t=2,06 | ||
standardfeil b0 | 38,212 | |||
b0 | 498,058 | |||
testobs * standardfeil | 78,71672 | |||
konfidens b0 min | 419,3413 | |||
konfidens b0 max | 576,7747 |
Undertemaer:
Relatert label A:
Filter by label
There are no items with the selected labels at this time.
Relatert label B:
Filter by label
There are no items with the selected labels at this time.
test footer