Sannsynlighet |
---|
|
|
|
| Utfallsrom kan være enten diskret eller kontinuerlig, hva betyr dette? |
|
|
|
|
| Hva er subjektiv, frekvensbasert og uniform sannynlighet? |
|
|
|
|
| Skriv formlene for frekvensbasert og uniform sannsynlighet. |
|
|
|
|
| Når skal man bruke henholdsvis subjektiv, frekvensbasert og uniform sannsynlighet? |
|
|
|
|
| Hva sier De Store Talls Lov, og når har dette praktisk betydning? |
|
|
|
|
| Hva er snitt og komplement i mengdelære, og når bruker man disse? |
|
|
|
|
| Hva er betinget sannsynlighet, når bruker man dette, og hvordan regner man med det? |
|
Usortert, fra eksamensoppgaver |
---|
1 |
|
|
| Vis hvordan man regner variasjonsbredde, varians og standardavvik. | - Variasjonsbredde= Størst-lavest.
- Varians:
- Metode 1:
- Varians1=(Dataverdi1-gjsn)^2
- Varians2=(Dataverdi2-gjsn)^2
- Varians=varians1+varians2/(n-1)
- Metode 2:
- Standardavvik:
- Standardavvik=rot(varians)
|
2 |
|
|
| Hva skiller kategoriske, kvantitative, diskret og kontinuerlige variabler fra hverandre? | - Kategoriske variabler:
- Ofte ikke-nummerisk
- Ingen verdier er bedre eller dårligere enn andre
- Finnes ikke nullpunkt
- Kan ikke regne gjennomsnitt fra det
- Kvantitative variabler:
- Nummerisk.
- Kan være enten diskrete eller kontinuerlige.
- Diskret variabler:
- Nummerisk.
- Kun heltall, desimaler gir ingen mening.
- Kontinuerlige variabler:
- Nummerisk.
- Alle verdier og desimaler innen en gitt skala er mulig.
|
3 |
|
|
| Når og hvorfor bruker man histogrammer, stamme-og-bladdiagrammer, boksplott, stolpediagram, paretodiagram og spredningsdiagram\scatterplot? | - Boksplot:
- Når:
- Fordi:
- Boksplot visualiserer avstandene mellom 5 sentralmål: Median, øvre kvartil, nedre kvartil, øverste verdi og nederste verdi.
- Stolpediagram:
- Når:
- Fordi:
- Visualiserer forskjellen i antall målinger for hver verdi.
- Histogram:
- Når:
- Fordi:
- Histogrammets tettliggende visualisering sparer plass når mange verdier skal sammenlignes.
- Stamme-og-bladdiagram:
- Når:
- Fordi:
- I motsetning til histogrammet viser dette de eksakte verdiene som går inn under hver verdi.
- Paretodiagram:
- Når:
- Fordi:
- Gir bedre visualisering av spredning i antall målinger.
- Kan være mer nyttig å se rangering av målefrekvenser, enn målinger for hver verdi. Spesielt nyttig ved rangering av "best"\"mest populær"\"vanligst".
- Spesielt nyttig dersom er det mange ulike verdier som skal vises, siden listen da går nedover istedenfor mot høyre.
- Spredningsdiagram\scatter plot:
- Når:
- Fordi:
- Spredningsdiagram gir visuelle indikasjoner på korrelasjoner, og om de isåfall er positive eller negative.
- Kan brukes til å vurdere korrelasjon mellom flere ulike variabler.
|
4 |
|
|
| Når og hvorfor regner man konfidensintervaller? | - Når:
- Fordi:
- Konfidensintervall gir et anslag med sannsynlighet, for hvilken verdi en måling kan antas å resultere i.
- Konfidensintervall kan vise om det er mulig og\eller sannsynlig at en verdi vil gi et visst resultat.
- Med konfidensintervall kan man beregne sannsynlige og mindre sannsynlige utfall, for å vurdere worst case scenario - eller best case.
|
5 |
|
|
| Definer nullhypotese og alternativhypotese, hvordan vet man hva som skal være hvilken? | - Nullhypotese:
- Kjennetegn: Inneholder alltid et likhetstegn.
- Når: Når man tester for at det ikke er noen forskjell.
- Alternativhypotese:
- Kjennetegn: Inneholder aldri likhetstegn.
- Når: Når man tester for at det vil være en forskjell.
|
6 |
|
|
| Hva er en testobservator, når bruker man det og hvordan beregner man det? | - Hva:
- Et beregnet tall som brukes for å se om undersøkelsesdata passer med en hypotese, ved å sjekke om det beregnede tallet matcher med hypotesens forventning.
- Vi har ulike typer testobservatorer som beregnes ulikt, fordi vi ikke alltid har tilgang på de samme sentralmålene om undersøkelsesdataene.
- Typer:
- Z-test: Forteller hvor (u)vanlig en gitt verdi er for en variabel.
- T-test: Viser hvorvidt to gruppers data er signifikant ulike hverandre.
- Chi-test: Indikerer hvorvidt to kvalitative variabler korrelerer.
- Når:
- Z:
- Når vi vil vite om en gitt verdi er normal for en bestemt variabel.
- Når vi vet standardavviket.
- Når utvalgsstørrelse er over 30.
- Dataene er normalfordelte.
- Dataene er tilfeldig valgt fra populasjonen.
- Utvalgsgruppene er omtrent like store.
- T:
- Når vi vil vite om to uavhengige datagrupper er signifikant ulike hverandre.
- Når vi skal sammenligne to grupper.
- Når vi mangler standardavviket.
- Når utvalget er mindre enn 30.
- Independent samples T-test: Sjekker likheten mellom to grupper.
- Paired samples T-test (ikke pensum): Sjekker forandringer i en gruppe.
- One-sampled T-test: Tester ett datasett mot en forventning.
- Chi:
- Når vi vil vite om en dikotom variabel korrelerer med en annen.
- Når man vet utvalgsstørrelsen.
- Hver verdi i forventede dataer må være minst 5.
- Hvordan:
- Z:
- Metode 1:
- Standardavviket forteller hvor langt unna median man befinner seg. 2 stddev er 95% av populasjonen.
Testobservator kan anslås grovt utifra hvor mange standardavvik unna median den befinner seg.
- Metode 2:
- T:
- (Finn hvordan t-test skal regnes i ulike tilfeller)
- Chi:
- Sett opp observert-tabell
- Sett opp ekspected-tabell:
- Expected=(kolonnesum*Radsum)/totalsum
- Sett opp forskjelstabell:
- ((Observed-Expected)^2)/Expected
- Finn Q-kvantil\testobservator:
- Q-kvantil=x^2=sum(((Observed-Expected)^2)/Expected)
- Finn Alfakvantil\kritisk verdi.
- Vurder hypotese:
- Testobservator Q-kvantil X^2 < Kritisk verdi alfa-kvantil X^2a=beholde H0
- Testobservator Q-kvantil x^2 > Kritisk verdi alfa-kvantil X^2a =kast H0
|
7 |
|
|
| Hva er feilmargin, når bruker man det, og hvordan beregner man det? | - Hva:
- En margin for hvilket tallområde man forventer at en verdi vil befinne seg i.
- Består av kritisk verdi, standardavvik og utvalgsstørrelse.
- Når:
- Brukes til estimater, inkludert konfidensintervaller i hypotesetesting: H0 forkastes når p-verdi er lavere enn alfa.
- Hvordan:
- (Finn hvordan feilmargin skal regnes i hvilke tilfeller)
|
8 |
|
|
| Hva er en p-verdi, når bruker man det og hvordan beregner man det? | - Hva:
- Sannsynligheten for Type 1-feil: En falsk bekreftelse av alternativhypotesen\at man feilaktig forkaster nullhypotesen.
- AKA Signifikanssannsynlighet, tilsvarer alfa.
- Forkast nullhypotesen dersom p-verdien er mindre enn (eller lik) signifikansnivået.
- Når:
- Brukes i hypotesetesting...
- for å vurdere sannsynligheten for å gjøre Type 1-feil.
- for å regne ut testobservator?
- Hvordan:
- P-verdi=arealet til høyre for testobservator Z.
Dersom H1 er 2-sidig, er p-verdien arealet i 2 haler (halver p-verdien for hver hale). Dersom H1 er 1-sidig, er p-verdien arealet i 1 hale.
- (gjelder samme metode for t-test og chi?)
|
9 |
|
|
| Hva er en z-verdi, når bruker man det og hvordan beregner man det? | - Hva:
- Når:
- Ved testing av om en gitt verdi er innenfor et datasett.
- Hvordan:
- (Finn ut når Z regnes ut på hvilken måte)
|
10 |
|
|
| Hva menes med forventede verdier, når bruker man det, og hvordan beregner man det? | - Hva:
- Forventede verdier i en chi-test.
- Når:
- Ved beregning av chi-test
- Hvordan:
- Forventet verdi = (total radsum)*(total kolonnesum)/totalsum.
|
11 |
|
|
| Hva er kritisk verdi, når bruker vi det, og hvordan beregnes det? | - Hva:
- Kritisk verdi er verdien som forventes i det tilfelle hypotesen er sann.
- Når:
- Brukes til å regne feilmarginer til estimater.
- Brukes til å beregne testobservatorer.
- Hvordan:
- Kritisk verdi Z:
- Slå opp signifkansnivå i tabell i bunn. Ignorer tosidig\ensidig i dette steget.
- Fordel alfa dersom testen er tosidig.
- Slå opp alfa i tabell i bunn, venstre oppslag for kritisk verdi Z med alfa.
- Kritisk verdi T:
- Kalkulatorknapper:
- Tast antall df/frihetsgrader
- Tast blå knapp
- Tast M+(INV)
- Tast blå knapp
- Tast 2 (df,t→P)
- Tast inn venstrehalesannsynlighet
- =
- Kritisk verdi chi:
- Beregn frihetsgrader
- Frihetsgrader df=(kolonneantall-1)(radantall-1)
- Finn alfa fra konfidens.
- Slå opp i tabellen litt lenger ned.
- H0 forkastes når testobservator er høyere enn kritisk verdi.
|
12 |
|
|
| Hva er en binomisk forsøksrekke, og når og hvordan regner man med det? | - Hva:
- Et utvalg med dikotom variabel, hvor man prøver å finne ut sannsynligheten for et gitt resultat.
- Når:
- Når man lurer på sannsynligheten for et bestemt resultat, bestående av et gitt antall true\false.
- Variabelen må være dikotom.
- Man må vite utvalgsstørrelsen.
- Trekningene må være uavhengige.
- Sannsynligheten må være lik for hvert eneste tilfelle.
- Hvordan:
- P=nCx*(p^x)*(q^(n-x))
- P=nCx*(P^x)*((1-P)^(n-x))
- P=nCx*(sannsynlighet suksess^antall suksess)*(sannsynlighet fiasko^antall fiasko)
- P=sannsynlighet
- n=utvalgsstørrelse, antall tilfeller målt
- x=antall true\suksess
|
13 |
|
|
| Hva kaller man uvanlig i sannsynlighetsberegning? | - Når tilfellet er utenfor 95% av normalfordelingen, tilsvarende 2 standardavvik.
|
14 |
|
|
| Hvordan vet man om et utvalg er representativt for en populasjon? | - Fordelingen av ulike variabler må være lik i utvalget som i populasjonen.
- Dette sikres gjennom tilfeldige utvalg (ikke bekvemmelighetsutvalg).
|
15 |
|
|
| Hvordan vet man om noe er observator, eller heller en parameter? | - Observator er det man observerer i et utvalg, mens parameter er virkeligheten som man ikke ser.
|
16 |
|
|
| Hvilke utvalgstyper\metoder regner vi med? | - Utvalgsmetoder:
- Frivillig deltagelse:
- Bekvemmelighetsutvalg:
- Klyngeutvalg:
- Feks alle elever fra en skole\klasse\fylke.
- Tilfeldig utvalg:
- Systematisk utvalg:
- Stratifisert utvalg:
- Andel av utvalget som matcher egenskaper skal matche populasjonen det skal representere.
- Utvalgstyper:
- Tilfeldige:
- Ikke-tilfeldige:
- Frivillig deltagelse.
- Bekvemmelighet.
- Relaterte:
- Observasjoner som hører logisk sammen, f.eks. før- og etter-utvalg.
- Urelaterte:
- Observasjoner uten noen logisk sammenheng.
|
17 |
|
|
| Hva er klyngeutvalg, og hvilke fordeler og ulemper har det? | - Hva: Man velger alle individer innen en bestemt undergruppe.
- Fordeler: Man får med alle individer med ulike demografiske variabler innen de valgte undergruppene.
- Ulemper: Grupperinger er aldri tilfeldige, de vil alltid ha noe til felles, som kan påvirke forsøksresultater.
|
18 |
|
|
| Hva er intervallmålenivå, og når og hvordan bruker vi det? | - Hva: En kvantitativ variabel med forhåndsbestemte tallverdier. AKA kontinuerlige verdier.
- Når: Brukes når man skal måle noe som naturlig eller logisk finnes bare i bestemte tallverdier. F.eks. skostørrelser, aldersgrupper, årstall, måneder.
- Hvordan:
- Passende tester:
- Passende diagrammer:
- Boksplot
- Spredningsdiagram
- Stolpediagram
- Histogram.
- Paretodiagram.
|
19 |
|
|
| Hva er ordinalt målenivå, og når og hvordan bruker vi det? | - Hva: Kvalitativ variabel hvor verdiene har en naturlig rekkefølge\sortering, men de er ikke-nummeriske og\eller kan ikke regnes sentralmål på. Med sin naturlige rekkefølge kan de dog gjerne konverteres til tall.
- Når: Brukes ved måling av variabler som allerede finnes i ordinal type, f.eks. skolekarakterer, brukeranmeldelser.
- Hvordan:
- Passende tester:
- Passende diagrammer:
- Histogram
- Paretodiagram
- Stolpediagram
|
20 |
|
|
| Hva er nominelt målenivå, og når og hvordan bruker vi det? | - Hva: En kvalitativ, ikke-nummerisk variabel, som ikke har noen naturlig\logisk rekkefølge\sortering.
- Når: Brukes ved måling av egenskaper som ikke lar seg definere med tall. F.eks. kjønn, bosted,
- Hvordan:
- Passende tester:
- Passende diagrammer:
- Histogram
- Paretodiagram
- Stolpediagram
|
21 |
|
|
| Hva er forholdstall i målenivå, og når og hvordan bruker vi det? | - Hva: Kvantitativ variabel med naturlig nullpunkt, som man kan regne sentralmål på.
- Når: F.eks. alder, høyde, inntekt.
- Hvordan:
- Passende tester:
- Passende diagrammer:
- Boksplot
- Spredningsdiagram
- Stamme-og-blad-diagram
|
22 |
|
|
| Hva er forskjellen på relaterte og uavhengige utvalg, og hvilken betydning har denne forskjellen? | - Relaterte:
- Utvalg som har en naturlig sammenheng, feks før- og etter-målinger.
- Urelaterte:
- Utvalg som ikke har noen slik naturlig sammenheng.
|
23 |
|
|
| Hva menes med differanse og parvis differanse, og når har dette betydning? | - Hypotesetesting:
- Differanse og parvis differanse handler om verdiforskjellen mellom to verdier som er relaterte. F.eks. forskjellen mellom før-verdien og etter-verdien utgjør en differanse\parvis differanse.
|
24 |
|
|
| Hva er stokastiske forsøk, og når og hvordan regner man med dem? | - Hva:
- Stokastiske variabler varierer i verdi, og kan derfor ikke forutsees, bare loggføres.
- Stokastiske forsøk innebærer...
- Kjente mulige utfallsverdier
- Uforutsigbare utfall
- Kan kun få èn mulig verdi per utfall
- Når:
- Typisk for lotto, myntkast, vær, og andre former for tilfeldige trekninger (med og uten tilbakelegging).
- Hvordan:
- Beregninger med sannsynlighetsfordelinger.
- Beregning av korrelasjoner gjennom simultan sannsynlighetsfordeling.
- De Store Talls Lov: Man forventer at små utvalg vil ha noe avvik fra forventningene, men over tid (ved store tall) vil statistikken gradvis nærmere seg forventningen.
- P=Antall gunstige/Antall mulige
- Multiplikasjonsregelen: P(A+B)=P(A)*P(A|B)
- Ved uavhengighet: P(A+B)=P(A)*P(B)
- (andre regler)
|
25 |
|
|
| Hvordan ser en sannsynlighetsfordeling ut, og når og hvordan bruker vi slike fordelinger? | - Utseende:
- Som en frekvenstabell, med variabelverdi i første kolonne og sannsynlighet for verdien i andre kolonne. Variabelverdiene er kvantitative. Summen av sannsynlighetskolonnen blir 1.
- Når:
- Brukes ved stokastiske variabler.
- Kan brukes til å regne sentralmål, inkludert gjennomsnitt, varians og standardavvik.
- Hvordan:
- Fordelingen settes opp ved at de mulige utfallene listes i første kolonne.
- For hver verdi i første kolonne, fylles raden i andre kolonne med sannsynligheten for å få dette utfallet.
- Gjennomsnittet finner man ved å gange utfallsverdien med sannsynligheten i hver rad, og summere opp for alle rader.
- Variansen finner man ved å først bruke den vanlige formelen ((x-gjsn)^2) og deretter gange tallet med sannsynligheten P.
- Standardavviket finner man på den vanlige måten, rot(varians).
|
26 |
|
|
| Hva er en simultan sannsynlighetsfordeling, og når og hvordan regner vi med dette? | - Hva:
- En simultan sannsynlighetsfordeling er en funksjonsformel for to stokastiske variabler.
- Når:
- Ved beregning av om stokastiske variabler korrelerer.
- Hvordan:
|
27 |
|
|
| Når og hvordan regner vi ut kombinasjoner? | |
28 |
|
|
| Når og hvordan regner vi ut varians? | - Når:
- Ved beregning av standardavvik.
- Ved korrelasjonsregning.
- Ved Z-test hypotesetesting.
- Hvordan:
- (Sum((Aktuell verdi - gjennomsnitt)^2))/(n-1)
- Regne standardavvik og varians med eksamenskalkulator:
- Tast inn utvalgsverdi 1:
- Trykk "sigma" (Gresk sum-tegn)
- Tast inn verdi 2
- Trykk "sigma" (Gresk sum-tegn)
- Trykk rød for å få snitt
- Trykk rød+8 for å få opp standardverdi
- Trykk rød+pluss for å få varians
|
29 |
|
|
| Når og hvordan regner vi ut kovarians? | - (Er dette pensum?)
- Når:
- Hvordan:
|
30 |
|
|
| Når og hvordan regner vi ut korrelasjon? | - Når:
- Hvordan:
- Korrelasjon:
- Korrelasjonsformel:
- Teste korrelasjon:
|
31 |
|
|
| Når og hvordan regner vi ut standardavvik? | - Når:
- Ved bruk av Z-test (er verdien sannsynlig for datasettet?)
- Ved beregning av punktestimat og standardfeil, for konfidensintervall i hypotesetesting.
- Hvordan:
- standardavvik=rot(varians)
- Standardavvik=standardfeil*rot(n)
- Regne standardavvik med eksamenskalkulator:
- Tast inn utvalgsverdi 1:
- Trykk "sigma" (Gresk sum-tegn)
- Tast inn verdi 2
- Trykk "sigma" (Gresk sum-tegn)
- Trykk rød for å få snitt
- Trykk rød+8 for å få opp standardverdi(standardavvik?)
|
32 |
|
|
| Hva er disjunkte hendelser, og når og hvordan regner man med slike? | - Hva: Disjunkte hendelser er hendelser som ikke skjer samtidig, altså gjensidig eksluderende.
- Når: Ved beregning av antall eller sannsynlighet i utvalg som oppfyller èn av flere interessante verdier i en kvalitativ variabel. Kan brukes til stokastisk beregning.
- Hvordan: Sannsynlighet for disjunkte hendelser: P(A eller B) =PA+PB
|
33 |
|
|
| Forklar uavhengige hendelser, og når og hvordan regner man med slike? | - Hva: Når utfallet i to ulike hendelser ikke har noen som helst sammenheng. F.eks. hendelsen regn imorgen og hendelsen å dø av påkjørsel en gang i løpet av livet.
- Når:
- Ved stokastiske variabler og forsøk, som per definisjon går på uavhengige hendelser.
- Binomiske forsøk krever uavhengige hendelser.
- Ved bruk av T-test, som per definisjon sjekker korrelasjon mellom hendelser som først antas uavhengige.
- Hvordan:
- Sannsynlighetsregning: P(A og B) med uavhengige hendelser = PA*PB (andel med B inni andel med A)
- Stokastisk: Se stokastisk.
- Binomisk: Se binomisk.
- T-test: Se T-test.
|
34 |
|
|
| Hva er klassisk sannsynlighet, hva betyr det å regne med dette? | - Klassisk sannsynlighet:
- Innebærer at alle utfall er like sannsynlige.
- Innebærer kjent utvalgsstørrelse.
- P(A) = antall utfall som resulterer i A/totalt antall utfall.
|
35 |
|
|
| Hvordan definerer man et utfallsrom, og når bør man gjøre dette? | - Hvordan:
- Utfallsrommet er alle de hendelser som er interessante for forsøket.
- Utfallsrom=antall muligheter per tilfelle * antall tilfeller.
- n=antall tilfeller
- x=antall muligheter per tilfelle.
- Uten tilbakelegging:
- Permutasjon, n-fakultet.
- På kalkulator: nPx.
- Med tilbakelegging (ubetinget sannsynlighet?):
- Når:
- Viktig ved det meste av sannsynlighetsberegning for å vite hvor mange tilfeller man skal regne med.
- Særlig klassisk sannsynlighet.
|
36 |
|
|
| Hva er en regresjonslinje, og når og hvordan regner man med slike? | - Hva:
- Analyse av kvantitative variabler, der man undersøker en uavhengig vaiabels innvirkning på en avhengig variabel.
- En graflinje definert ved en formel, som best mulig skal passe med utfallsverdiene i utvalget.
- Regresjonslinjen vil indikere eventuell sammenheng mellom variabel X og Y.
- Når:
- Ved prediksjon\prognoser.
- Hvordan:
|
37 |
|
|
| Hva er lineær regresjonsmodell, og når og hvordan regner man med slike? | - Hva:
- En regresjonslinje for variabler som forventes å ha lineær sammenheng.
- Når:
- Ved prediksjon\prognoser som inneholder feilmarginer og variabler med lineær sammenheng. F.eks. spillsimulasjoner som WoW-abilities.
- Hvordan:
- Bruk frihetsgrader=n-2.
- Regnes med testobservator T, siden regresjonslinjen er lineær og ikke normalfordelt.
- y=b0+b1*x
- Finn i tabell i oppgaven:
- b0=intercept Estimate
- b1=variabel estimate
|
38 | Inferens og hypotese | Inferens | Sentralgrenseteoremet | Hva er sentralgrenseteoremet, og når og hvordan har dette praktisk betydning? | - Hva:
- Statistikk → Inferens og hypotese → Inferens → Sentralgrenseteoremet.
- En lov som sier at en fordeling av et uendelig utvalg med uavhengige, stokastiske variabler vil få en normalfordeling.
- Litt som De Store Talls lov, bare at sentralgrenseteoremet i tillegg sier at fordelingen vil være normalfordelt - DSTL sier bare at tendensen vil nærme seg den forhåndsberegnede sannsynligheten\andelen, uten å nevne normalfordeling.
- Når:
- Hvordan:
- Sentralgrenseteoremet sier at når vi har uavhengige, stokastiske variabler så skal vi forvente at et stort utvalg vil få en normalfordeling.
|
39 | Inferens og hypotese |
|
| Når forkaster vi henholdsvis nullhypotesen og alternativhypotesen? | - Nullhypotesen:
- Forkastes når signifikant resultat tilsier en forskjell ulik 0.
- Når p-verdien (sannsynlighet for å feilaktig forkaste H0) er lavere enn alfa (godtatt sannsynlighet for å feilaktige forkaste H0).
- Alternativhypotesen:
- Forkastes når signifikant resultat sier at forskjell kan være 0.
- Forkastes når vi ikke forkaster H0 - når p-verdien er lavere enn alfa.
|
40 |
|
|
| Hva er et feilledd, og når og hvordan beregner vi dette? | - Hva:
- Aka residual, rest, ε.
- Representerer avviket mellom regresjonslinje\forventning og virkelighet\målt verdi.
- Når:
- Hvordan:
- y=y^^+e
- Virkelig y-data=estimert y + feilledd
|
41 |
|
|
| Hva er eksogenitet, hvilke forutsetninger krever det, og når har dette praktisk betydning? | ?? |
42 |
|
|
| Hva er R^2, og når og hvordan beregner vi dette? | - Hva:
- R^2 er korrelasjon, Pearsons R
- Når:
- Hvordan:
- Manuelt:
- Korrelasjon=(Sum((x-xgjsn)*(y-ygjsn)))/((n-1)*Sx*Sy)
- Sum((x-xgjsn)*(y-ygjsn))
- For hvert datapar x og y.
- x=x-verdi.
- y=y-verdi
- Sx=standardavvik for x
- Sy=standardavvik for y
- n=antall datapar
- Korrelasjon på kalkulator:
- x-verdi
- Hvit "input"
- y-verdi
- Sigma
- gjsn:
- Trykk Rød shift
- Trykk 4
- Trykk Rød shift
- Trykk K\swap
- Resultatet er korrelasjon, R2
|
43 |
|
|
| Hva er Type 1-feil, og hvilken praktisk betydning har dette? | - Hva:
- Type 1-feil er når man forkaster en nullhypotese som man burde beholdt.
- Betydning:
- Betyr at man i hypotesetestingen beholder en alternativhypotese som faktisk er gal.
- F.eks. hvis man forkaster nullhypotesen når p-verdien er mindre enn alfa.
|
44 |
|
|
| Hva er Type 2-feil, og hvilken praktisk betydning har dette? | - Hva: Type 2-feil er når man forkaster en alternativhypotese som man burde beholdt.
- Betydning:
- Betyr at man i hypotesetestingen beholder nullhypotesen når den faktisk er gal.
- F.eks. at man beholder nullhypotesen når p-verdien er større enn alfa.
|
45 |
|
|
| Hva er persentiler, og når og hvordan regner vi med dem? | - Hva: En persentil er den delen av populasjonsfordelingen som er maksimalt like stor som det angitte persentil-tallet.
- Når:
- Hvordan:
- (finn ut hva det brukes til)
|
46 |
|
|
| Hva er forskjellen på tosidig og ensidig hypotesetest, og når og hvordan beregnes de? | - Forskjell:
- Når:
- Ensidig:
- Når alternativhypotesen er > eller < (ikke begge deler).
- Chi-kvadrat-tester.
- Tosidig:
- Når alternativhypotesen er !=
- Ved konfidensintervaller (Z-test).
- Hvordan:
- Ensidig:
- Tosidig:
- Gjør Z-test\T-test.
- Halver alfa.
- Halver p-verdien.
|
47 |
|
|
| Hva er forutsetningene for en valid hypotesetest? | - Z-test: (krav?)
- T-test: (krav?)
- Chi-kvadrat-test:
- Tilfeldige utvalg.
- Hver forventet verdi skal være minst 5.
|
48 |
|
|
| Hva er Q-kvantil, og når og hvordan beregner vi det? | - Hva: Test-observator for chi-kvadrattest.
- Når: Ved chi-kvadrat-test.
- Hvordan:
- sum(((Observed-Expected)^2)/Expected)
- Hvor observed=observert verdi i den enkelte rute.
- Expected=beregnet forventning i tilsvarende rute
|
49 |
|
|
| Hva er alfa-kvantil, og når og hvordan beregner vi det? | - Hva: Alfaverdi for å vurdere signifikant forskjell mellom test og hypotese.
- Når: Ved chi-kvadrattest.
- Hvordan:
- Beregn df
- Finn signifikansnivå
- Finn frem alfa i tabell, via df og signifikansnivå.
|
50 |
|
|
| Når og hvordan beregner vi en chi-kvadrattest? | - Når:
- Når man vil se etter korrelasjon mellom kvalitative variabler.
- Hvordan:
- Man må ha en tabell over forventede verdier til å starte med.
- Beregn forventede verdier i scenario uten korrelasjon.
- Expected=(kolonnesum*Radsum)/totalsum
- Expected=den enkelte rute i tabellen.
- Kolonnesum=Sum for aktuell rutes kolonne.
- Undersøk forskjell mellom observerte(O) verdier og forventede (E).
- Forskjell=((Observed-Expected)^2)/Expected
- Forskjell=Forskjell mellom observed og expected i den aktuelle ruten.
|
51 |
|
|
| Hvordan defineres forkastningsområdet, og hvilken betydning har dette? | - Definering:
- Defineres av alfa.
Dersom alfa halveres pga tosidig test, så er altså forkastningsområdet halvert. - Alternativhypotese+signifikansnivå→ kritisk verdi → forkastningsområde.
- Betydning:
- Essensielt for hypotesetesting. Forkastningsområdet sammen med testobservatoren avgjør om man forkaster nullhypotesen eller alternativhypotesen.
- Når testobservator ligger ute i forkastningsområdet, forkastes H0.
|
52 |
|
|
| Hvordan bestemmer man antall frihetsgrader å bruke i ulike tester? | - Ved gruppesammenligning (T-test), bruk minste gruppes populasjon til df.
- Min(utvalg1-1),(utvalg2-1)).
- Linjeær regresjon=n-2
- Chi-kvadrattest: Frihetsgrader df=(kolonneantall-1)(radantall-1)
|
53 |
|
|
| Hva skiller eksperimentelle fra observasjonelle studier? | |
54 |
|
|
| Hva er kumulative frekvenstabeller, og hva brukes de til? | - Hva:
- Kumulativ frekvens er antall svaralternativer som er mindre eller lik aktuell verdi. Hvert nivå inneholder forrige nivå.
Høyeste nivå vil derfor inneholde 100% av verdiene.
- Bruk: (finn bruken)
|
55 |
|
|
| Hva er relative frekvenstabeller, og hva brukes de til? | - Hva: (finn ut)
- Bruk: (finn ut)
|
56 |
|
|
| Hva er et relativ frekvens-histogram, og hva brukes det til? | - Hva: (finn ut)
- Bruk: (finn ut)
|
57 |
|
|
| Hva er en binominalfordeling, og når og hvordan brukes det? | - Hva: (finn ut)
- Når: (finn ut)
- Hvordan: (finn ut)
|
58 |
|
|
| Hva er binominalformelen, og når og hvordan brukes den? | - Hva: (finn ut)
- Når: (finn ut)
- Hvordan:
- P=nCx*(p^x)*(q^(n-x))
- P=nCx*(P^x)*((1-P)^(n-x))
- P=nCx*(sannsynlighet suksess^antall suksess)*(sannsynlighet fiasko^antall fiasko)
- P=sannsynlighet
- n=utvalgsstørrelse, antall tilfeller målt
- x=antall true\suksess
|
59 |
|
|
| Forklar egenskapene i en kontinuerlig uniform tetthetskurve, og hva en slik brukes til. | - Egenskaper: (finn ut)
- Bruk: (finn ut)
|
60 |
|
|
| Hvordan vet man om Z er standard normalfordelt? | - Hva: (finn ut)
- Hvordan: (finn ut)
|
61 |
|
|
| Hva betyr μ og hva brukes det til? | - Hva: "My"
- Bruk: Brukes om gjennomsnittsverdier i hypotesedefinisjoner.
|
62 |
|
|
| Hva betyr σ og hva brukes det til? | - Hva: Standardavvik.
- Bruk: Se standardavvik.
|
63 |
|
|
| Hva er α og hva brukes den til? | - Hva: Alfa, forkastningsområdet i hypotesetesting.
- Bruk: Brukes i hypotesetesting for å vurdere når nullhypotesen skal forkastes.
|