Eksamenstrening MET3431 - Egne oppgaver

Sannsynlighet




Utfallsrom kan være enten diskret eller kontinuerlig, hva betyr dette?




Hva er subjektiv, frekvensbasert og uniform sannynlighet?




Skriv formlene for frekvensbasert og uniform sannsynlighet.




Når skal man bruke henholdsvis subjektiv, frekvensbasert og uniform sannsynlighet?




Hva sier De Store Talls Lov, og når har dette praktisk betydning?




Hva er snitt og komplement i mengdelære, og når bruker man disse?




Hva er betinget sannsynlighet, når bruker man dette, og hvordan regner man med det?
Usortert, fra eksamensoppgaver
1


Vis hvordan man regner variasjonsbredde, varians og standardavvik.
  • Variasjonsbredde= Størst-lavest.
  • Varians:
    • Metode 1:
      • Varians1=(Dataverdi1-gjsn)^2
      • Varians2=(Dataverdi2-gjsn)^2
      • Varians=varians1+varians2/(n-1)
    • Metode 2:
      • Varians=standardavvik^2
  • Standardavvik:
    • Standardavvik=rot(varians)
2


Hva skiller kategoriske, kvantitative, diskret og kontinuerlige variabler fra hverandre?
  • Kategoriske variabler:
    • Ofte ikke-nummerisk
    • Ingen verdier er bedre eller dårligere enn andre
    • Finnes ikke nullpunkt
    • Kan ikke regne gjennomsnitt fra det
  • Kvantitative variabler:
    • Nummerisk.
    • Kan være enten diskrete eller kontinuerlige.
    • Diskret variabler:
      • Nummerisk.
      • Kun heltall, desimaler gir ingen mening.
    • Kontinuerlige variabler:
      • Nummerisk.
      • Alle verdier og desimaler innen en gitt skala er mulig.
3


Når og hvorfor bruker man histogrammer, stamme-og-bladdiagrammer, boksplott, stolpediagram, paretodiagram og spredningsdiagram\scatterplot?
  • Boksplot:
    • Når:
      • Kvantitative data.
    • Fordi:
      • Boksplot visualiserer avstandene mellom 5 sentralmål: Median, øvre kvartil, nedre kvartil, øverste verdi og nederste verdi.
  • Stolpediagram:
    • Når:
      • Kvalitative data.
    • Fordi:
      • Visualiserer forskjellen i antall målinger for hver verdi.
  • Histogram:
    • Når:
      • Kvalitative data.
    • Fordi:
      • Histogrammets tettliggende visualisering sparer plass når mange verdier skal sammenlignes.
  • Stamme-og-bladdiagram:
    • Når:
      • Kvantitative data:
    • Fordi:
      • I motsetning til histogrammet viser dette de eksakte verdiene som går inn under hver verdi.
  • Paretodiagram:
    • Når:
      • Kvalitative data.
    • Fordi:
      • Gir bedre visualisering av spredning i antall målinger.
      • Kan være mer nyttig å se rangering av målefrekvenser, enn målinger for hver verdi. Spesielt nyttig ved rangering av "best"\"mest populær"\"vanligst".
      • Spesielt nyttig dersom er det mange ulike verdier som skal vises, siden listen da går nedover istedenfor mot høyre.
  • Spredningsdiagram\scatter plot:
    • Når:
      • Kvantitative data.
    • Fordi:
      • Spredningsdiagram gir visuelle indikasjoner på korrelasjoner, og om de isåfall er positive eller negative.
      • Kan brukes til å vurdere korrelasjon mellom flere ulike variabler.
4


Når og hvorfor regner man konfidensintervaller?
  • Når:
    • Ved hypotesetesting
  • Fordi:
    • Konfidensintervall gir et anslag med sannsynlighet, for hvilken verdi en måling kan antas å resultere i.
    • Konfidensintervall kan vise om det er mulig og\eller sannsynlig at en verdi vil gi et visst resultat.
    • Med konfidensintervall kan man beregne sannsynlige og mindre sannsynlige utfall, for å vurdere worst case scenario - eller best case.
5


Definer nullhypotese og alternativhypotese, hvordan vet man hva som skal være hvilken?
  • Nullhypotese:
    • Kjennetegn: Inneholder alltid et likhetstegn.
    • Når: Når man tester for at det ikke er noen forskjell.
  • Alternativhypotese:
    • Kjennetegn: Inneholder aldri likhetstegn.
    • Når: Når man tester for at det vil være en forskjell.
6


Hva er en testobservator, når bruker man det og hvordan beregner man det?
  • Hva:
    • Et beregnet tall som brukes for å se om undersøkelsesdata passer med en hypotese, ved å sjekke om det beregnede tallet matcher med hypotesens forventning.
    • Vi har ulike typer testobservatorer som beregnes ulikt, fordi vi ikke alltid har tilgang på de samme sentralmålene om undersøkelsesdataene.
    • Typer:
      • Z-test: Forteller hvor (u)vanlig en gitt verdi er for en variabel.
      • T-test: Viser hvorvidt to gruppers data er signifikant ulike hverandre.
      • Chi-test: Indikerer hvorvidt to kvalitative variabler korrelerer.
  • Når:
    • Z:
      • Når vi vil vite om en gitt verdi er normal for en bestemt variabel.
      • Når vi vet standardavviket.
      • Når utvalgsstørrelse er over 30.
      • Dataene er normalfordelte.
      • Dataene er tilfeldig valgt fra populasjonen.
      • Utvalgsgruppene er omtrent like store.
    • T:
      • Når vi vil vite om to uavhengige datagrupper er signifikant ulike hverandre.
      • Når vi skal sammenligne to grupper.
      • Når vi mangler standardavviket.
      • Når utvalget er mindre enn 30.
      • Independent samples T-test: Sjekker likheten mellom to grupper.
      • Paired samples T-test (ikke pensum): Sjekker forandringer i en gruppe.
      • One-sampled T-test: Tester ett datasett mot en forventning.
    • Chi:
      • Når vi vil vite om en dikotom variabel korrelerer med en annen.
      • Når man vet utvalgsstørrelsen.
      • Hver verdi i forventede dataer må være minst 5.
  • Hvordan:
    • Z:
      • Metode 1:
        • Standardavviket forteller hvor langt unna median man befinner seg. 2 stddev er 95% av populasjonen.
          Testobservator kan anslås grovt utifra hvor mange standardavvik unna median den befinner seg.
      • Metode 2:
    • T:
      • (Finn hvordan t-test skal regnes i ulike tilfeller)
    • Chi:
        • Sett opp observert-tabell
        • Sett opp ekspected-tabell:
          • Expected=(kolonnesum*Radsum)/totalsum
        • Sett opp forskjelstabell:
          • ((Observed-Expected)^2)/Expected
        • Finn Q-kvantil\testobservator:
          • Q-kvantil=x^2=sum(((Observed-Expected)^2)/Expected)
        • Finn Alfakvantil\kritisk verdi.
        • Vurder hypotese:
          • Testobservator Q-kvantil X^2 < Kritisk verdi alfa-kvantil X^2a=beholde H0
          • Testobservator Q-kvantil x^2 > Kritisk verdi alfa-kvantil X^2a =kast H0
7


Hva er feilmargin, når bruker man det, og hvordan beregner man det?
  • Hva:
    • En margin for hvilket tallområde man forventer at en verdi vil befinne seg i.
    • Består av kritisk verdi, standardavvik og utvalgsstørrelse.
  • Når:
    • Brukes til estimater, inkludert konfidensintervaller i hypotesetesting: H0 forkastes når p-verdi er lavere enn alfa.
  • Hvordan:
    • (Finn hvordan feilmargin skal regnes i hvilke tilfeller)
8


Hva er en p-verdi, når bruker man det og hvordan beregner man det?
  • Hva:
    • Sannsynligheten for Type 1-feil: En falsk bekreftelse av alternativhypotesen\at man feilaktig forkaster nullhypotesen.
    • AKA Signifikanssannsynlighet, tilsvarer alfa.
    • Forkast nullhypotesen dersom p-verdien er mindre enn (eller lik) signifikansnivået.
  • Når:
    • Brukes i hypotesetesting...
      • for å vurdere sannsynligheten for å gjøre Type 1-feil.
      • for å regne ut testobservator?
  • Hvordan:
    • P-verdi=arealet til høyre for testobservator Z.
      • Dersom H1 er 2-sidig, er p-verdien arealet i 2 haler (halver p-verdien for hver hale).

      • Dersom H1 er 1-sidig, er p-verdien arealet i 1 hale.

    • (gjelder samme metode for t-test og chi?)
9


Hva er en z-verdi, når bruker man det og hvordan beregner man det?
  • Hva:
    • Testobservator Z
  • Når:
    • Ved testing av om en gitt verdi er innenfor et datasett.
  • Hvordan:
    • (Finn ut når Z regnes ut på hvilken måte)
10


Hva menes med forventede verdier, når bruker man det, og hvordan beregner man det?
  • Hva:
    • Forventede verdier i en chi-test.
  • Når:
    • Ved beregning av chi-test
  • Hvordan:
    • Forventet verdi = (total radsum)*(total kolonnesum)/totalsum.
11


Hva er kritisk verdi, når bruker vi det, og hvordan beregnes det?
  • Hva:
    • Kritisk verdi er verdien som forventes i det tilfelle hypotesen er sann.
  • Når:
    • Brukes til å regne feilmarginer til estimater.
    • Brukes til å beregne testobservatorer.
  • Hvordan:
    • Kritisk verdi Z:
      • Slå opp signifkansnivå i tabell i bunn. Ignorer tosidig\ensidig i dette steget.
      • Fordel alfa dersom testen er tosidig.
      • Slå opp alfa i tabell i bunn, venstre oppslag for kritisk verdi Z med alfa.
    • Kritisk verdi T:
      • Kalkulatorknapper:
        • Tast antall df/frihetsgrader
        • Tast blå knapp
        • Tast M+(INV)
        • Tast blå knapp
        • Tast 2 (df,t→P)
        • Tast inn venstrehalesannsynlighet
        • =
    • Kritisk verdi chi:
      • Beregn frihetsgrader
        • Frihetsgrader df=(kolonneantall-1)(radantall-1)
      • Finn alfa fra konfidens.
        • Finn signifikansnivå
      • Slå opp i tabellen litt lenger ned.
    • H0 forkastes når testobservator er høyere enn kritisk verdi.
12


Hva er en binomisk forsøksrekke, og når og hvordan regner man med det?
  • Hva:
    • Et utvalg med dikotom variabel, hvor man prøver å finne ut sannsynligheten for et gitt resultat.
  • Når:
    • Når man lurer på sannsynligheten for et bestemt resultat, bestående av et gitt antall true\false.
    • Variabelen må være dikotom.
    • Man må vite utvalgsstørrelsen.
    • Trekningene må være uavhengige.
    • Sannsynligheten må være lik for hvert eneste tilfelle.
  • Hvordan:
    • P=nCx*(p^x)*(q^(n-x))
      • P=nCx*(P^x)*((1-P)^(n-x))
      • P=nCx*(sannsynlighet suksess^antall suksess)*(sannsynlighet fiasko^antall fiasko)
      • P=sannsynlighet
      • n=utvalgsstørrelse, antall tilfeller målt
      • x=antall true\suksess
13


Hva kaller man uvanlig i sannsynlighetsberegning?
  • Når tilfellet er utenfor 95% av normalfordelingen, tilsvarende 2 standardavvik.
14


Hvordan vet man om et utvalg er representativt for en populasjon?
  • Fordelingen av ulike variabler må være lik i utvalget som i populasjonen.
    • Dette sikres gjennom tilfeldige utvalg (ikke bekvemmelighetsutvalg).
15


Hvordan vet man om noe er observator, eller heller en parameter?
  • Observator er det man observerer i et utvalg, mens parameter er virkeligheten som man ikke ser.
16


Hvilke utvalgstyper\metoder regner vi med?
  • Utvalgsmetoder:
    • Frivillig deltagelse:
    • Bekvemmelighetsutvalg:
    • Klyngeutvalg:
      • Feks alle elever fra en skole\klasse\fylke.
    • Tilfeldig utvalg:
    • Systematisk utvalg:
      • Hver x. deltager
    • Stratifisert utvalg:
      • Andel av utvalget som matcher egenskaper skal matche populasjonen det skal representere.
  • Utvalgstyper:
    • Tilfeldige:
    • Ikke-tilfeldige:
      • Frivillig deltagelse.
      • Bekvemmelighet.
    • Relaterte:
      • Observasjoner som hører logisk sammen, f.eks. før- og etter-utvalg.
    • Urelaterte:
      • Observasjoner uten noen logisk sammenheng.
17


Hva er klyngeutvalg, og hvilke fordeler og ulemper har det?
  • Hva: Man velger alle individer innen en bestemt undergruppe.
  • Fordeler: Man får med alle individer med ulike demografiske variabler innen de valgte undergruppene.
  • Ulemper: Grupperinger er aldri tilfeldige, de vil alltid ha noe til felles, som kan påvirke forsøksresultater.
18


Hva er intervallmålenivå, og når og hvordan bruker vi det?
  • Hva: En kvantitativ variabel med forhåndsbestemte tallverdier. AKA kontinuerlige verdier.
  • Når: Brukes når man skal måle noe som naturlig eller logisk finnes bare i bestemte tallverdier. F.eks. skostørrelser, aldersgrupper, årstall, måneder.
  • Hvordan:
    • Passende tester:
    • Passende diagrammer:
      • Boksplot
      • Spredningsdiagram
      • Stolpediagram
      • Histogram.
      • Paretodiagram.
19


Hva er ordinalt målenivå, og når og hvordan bruker vi det?
  • Hva: Kvalitativ variabel hvor verdiene har en naturlig rekkefølge\sortering, men de er ikke-nummeriske og\eller kan ikke regnes sentralmål på. Med sin naturlige rekkefølge kan de dog gjerne konverteres til tall.
  • Når: Brukes ved måling av variabler som allerede finnes i ordinal type, f.eks. skolekarakterer, brukeranmeldelser.
  • Hvordan:
    • Passende tester:
    • Passende diagrammer:
      • Histogram
      • Paretodiagram
      • Stolpediagram
20


Hva er nominelt målenivå, og når og hvordan bruker vi det?
  • Hva: En kvalitativ, ikke-nummerisk variabel, som ikke har noen naturlig\logisk rekkefølge\sortering.
  • Når: Brukes ved måling av egenskaper som ikke lar seg definere med tall. F.eks. kjønn, bosted,
  • Hvordan:
    • Passende tester:
    • Passende diagrammer:
      • Histogram
      • Paretodiagram
      • Stolpediagram
21


Hva er forholdstall i målenivå, og når og hvordan bruker vi det?
  • Hva: Kvantitativ variabel med naturlig nullpunkt, som man kan regne sentralmål på.
  • Når: F.eks. alder, høyde, inntekt.
  • Hvordan:
    • Passende tester:
      • Pearsons R-korrelasjon.
    • Passende diagrammer:
      • Boksplot
      • Spredningsdiagram
      • Stamme-og-blad-diagram
22


Hva er forskjellen på relaterte og uavhengige utvalg, og hvilken betydning har denne forskjellen?
  • Relaterte:
    • Utvalg som har en naturlig sammenheng, feks før- og etter-målinger.
  • Urelaterte:
    • Utvalg som ikke har noen slik naturlig sammenheng.
23


Hva menes med differanse og parvis differanse, og når har dette betydning?
  • Hypotesetesting:
    • Differanse og parvis differanse handler om verdiforskjellen mellom to verdier som er relaterte. F.eks. forskjellen mellom før-verdien og etter-verdien utgjør en differanse\parvis differanse.
24


Hva er stokastiske forsøk, og når og hvordan regner man med dem?
  • Hva:
    • Stokastiske variabler varierer i verdi, og kan derfor ikke forutsees, bare loggføres.
    • Stokastiske forsøk innebærer...
      • Kjente mulige utfallsverdier
      • Uforutsigbare utfall
      • Kan kun få èn mulig verdi per utfall
  • Når:
    • Typisk for lotto, myntkast, vær, og andre former for tilfeldige trekninger (med og uten tilbakelegging).
  • Hvordan:
    • Beregninger med sannsynlighetsfordelinger.
    • Beregning av korrelasjoner gjennom simultan sannsynlighetsfordeling.
    • De Store Talls Lov: Man forventer at små utvalg vil ha noe avvik fra forventningene, men over tid (ved store tall) vil statistikken gradvis nærmere seg forventningen.
    • P=Antall gunstige/Antall mulige
    • Multiplikasjonsregelen: P(A+B)=P(A)*P(A|B)
      • Ved uavhengighet: P(A+B)=P(A)*P(B)
    • (andre regler)
25


Hvordan ser en sannsynlighetsfordeling ut, og når og hvordan bruker vi slike fordelinger?
  • Utseende:
    • Som en frekvenstabell, med variabelverdi i første kolonne og sannsynlighet for verdien i andre kolonne. Variabelverdiene er kvantitative. Summen av sannsynlighetskolonnen blir 1.
  • Når:
    • Brukes ved stokastiske variabler.
    • Kan brukes til å regne sentralmål, inkludert gjennomsnitt, varians og standardavvik.
  • Hvordan:
    • Fordelingen settes opp ved at de mulige utfallene listes i første kolonne.
    • For hver verdi i første kolonne, fylles raden i andre kolonne med sannsynligheten for å få dette utfallet.
    • Gjennomsnittet finner man ved å gange utfallsverdien med sannsynligheten i hver rad, og summere opp for alle rader.
    • Variansen finner man ved å først bruke den vanlige formelen ((x-gjsn)^2) og deretter gange tallet med sannsynligheten P.
    • Standardavviket finner man på den vanlige måten, rot(varians).
26


Hva er en simultan sannsynlighetsfordeling, og når og hvordan regner vi med dette?
27


Når og hvordan regner vi ut kombinasjoner?
  • Når:
    • Binomiske forsøk.
  • Hvordan:
    • nCx
    • (skriv ned regnemåte)
28


Når og hvordan regner vi ut varians?
  • Når:
    • Ved beregning av standardavvik.
      • Ved korrelasjonsregning.
      • Ved Z-test hypotesetesting.
  • Hvordan:
    • (Sum((Aktuell verdi - gjennomsnitt)^2))/(n-1)
    • Regne standardavvik og varians med eksamenskalkulator:
      • Tast inn utvalgsverdi 1:
      • Trykk "sigma" (Gresk sum-tegn)
      • Tast inn verdi 2
      • Trykk "sigma" (Gresk sum-tegn)
      • Trykk rød for å få snitt
      • Trykk rød+8 for å få opp standardverdi
      • Trykk rød+pluss for å få varians
29


Når og hvordan regner vi ut kovarians?
30


Når og hvordan regner vi ut korrelasjon?
  • Når:
  • Hvordan:
    • Korrelasjon:
      • Finne Korrelasjon på kalkulator:

        • x-verdi
        • Hvit "input"
        • y-verdi
        • Sigma
        • Gjenta for hvert verdipar.
        • Trykk Rød shift
        • Trykk 4
        • Trykk Rød shift
        • Trykk K\swap
        • Resultatet er korrelasjon, R2
    • Korrelasjonsformel:
      • Regne korrelasjonsformel på kalkulator:

        • b=ysnitt - b1 * xsnitt
          • b1, inntekt estimate=m
            • Tast inn all verdiparene som ved korrelasjon
            • Trykk rød
            • Trykk 5
            • Trykk rød
            • Trykk swap
            • Resultatet er m
          • b0, intercept estimate=b
            • Fortsett fra b1=m
            • Trykk rød
            • Trykk 6
            • Trykk rød
            • Trykk swap
            • Resultatet er b
    • Teste korrelasjon:
31


Når og hvordan regner vi ut standardavvik?
  • Når:
    • Ved bruk av Z-test (er verdien sannsynlig for datasettet?)
    • Ved beregning av punktestimat og standardfeil, for konfidensintervall i hypotesetesting.
  • Hvordan:
    • standardavvik=rot(varians)
    • Standardavvik=standardfeil*rot(n)
    • Regne standardavvik med eksamenskalkulator:
      • Tast inn utvalgsverdi 1:
      • Trykk "sigma" (Gresk sum-tegn)
      • Tast inn verdi 2
      • Trykk "sigma" (Gresk sum-tegn)
      • Trykk rød for å få snitt
      • Trykk rød+8 for å få opp standardverdi(standardavvik?)
32


Hva er disjunkte hendelser, og når og hvordan regner man med slike?
  • Hva: Disjunkte hendelser er hendelser som ikke skjer samtidig, altså gjensidig eksluderende.
  • Når: Ved beregning av antall eller sannsynlighet i utvalg som oppfyller èn av flere interessante verdier i en kvalitativ variabel. Kan brukes til stokastisk beregning.
  • Hvordan: Sannsynlighet for disjunkte hendelser: P(A eller B) =PA+PB
33


Forklar uavhengige hendelser, og når og hvordan regner man med slike?
  • Hva: Når utfallet i to ulike hendelser ikke har noen som helst sammenheng. F.eks. hendelsen regn imorgen og hendelsen å dø av påkjørsel en gang i løpet av livet.
  • Når:
    • Ved stokastiske variabler og forsøk, som per definisjon går på uavhengige hendelser.
    • Binomiske forsøk krever uavhengige hendelser.
    • Ved bruk av T-test, som per definisjon sjekker korrelasjon mellom hendelser som først antas uavhengige.
  • Hvordan:
    • Sannsynlighetsregning: P(A og B) med uavhengige hendelser = PA*PB (andel med B inni andel med A)
    • Stokastisk: Se stokastisk.
    • Binomisk: Se binomisk.
    • T-test: Se T-test.
34


Hva er klassisk sannsynlighet, hva betyr det å regne med dette?
  • Klassisk sannsynlighet:
    • Innebærer at alle utfall er like sannsynlige.
    • Innebærer kjent utvalgsstørrelse.
    • P(A) = antall utfall som resulterer i A/totalt antall utfall.
35


Hvordan definerer man et utfallsrom, og når bør man gjøre dette?
  • Hvordan:
    • Utfallsrommet er alle de hendelser som er interessante for forsøket.
    • Utfallsrom=antall muligheter per tilfelle * antall tilfeller.
    • n=antall tilfeller
    • x=antall muligheter per tilfelle.
    • Uten tilbakelegging:
      • Permutasjon, n-fakultet.
      • På kalkulator: nPx.
    • Med tilbakelegging (ubetinget sannsynlighet?):
      • x^n
  • Når:
    • Viktig ved det meste av sannsynlighetsberegning for å vite hvor mange tilfeller man skal regne med.
      • Særlig klassisk sannsynlighet.
36


Hva er en regresjonslinje, og når og hvordan regner man med slike?
  • Hva:
    • Analyse av kvantitative variabler, der man undersøker en uavhengig vaiabels innvirkning på en avhengig variabel.
    • En graflinje definert ved en formel, som best mulig skal passe med utfallsverdiene i utvalget.
    • Regresjonslinjen vil indikere eventuell sammenheng mellom variabel X og Y.
  • Når:
    • Ved prediksjon\prognoser.
  • Hvordan:
37


Hva er lineær regresjonsmodell, og når og hvordan regner man med slike?
  • Hva:
    • En regresjonslinje for variabler som forventes å ha lineær sammenheng.
  • Når:
    • Ved prediksjon\prognoser som inneholder feilmarginer og variabler med lineær sammenheng. F.eks. spillsimulasjoner som WoW-abilities.
  • Hvordan:
    • Bruk frihetsgrader=n-2.
    • Regnes med testobservator T, siden regresjonslinjen er lineær og ikke normalfordelt.
    • y=b0+b1*x
    • Finn i tabell i oppgaven:
      • b0=intercept Estimate 
      • b1=variabel estimate
38Inferens og hypoteseInferensSentralgrenseteoremetHva er sentralgrenseteoremet, og når og hvordan har dette praktisk betydning?
  • Hva:
    • Statistikk → Inferens og hypotese → Inferens → Sentralgrenseteoremet.
    • En lov som sier at en fordeling av et uendelig utvalg med uavhengige, stokastiske variabler vil få en normalfordeling.
    • Litt som De Store Talls lov, bare at sentralgrenseteoremet i tillegg sier at fordelingen vil være normalfordelt - DSTL sier bare at tendensen vil nærme seg den forhåndsberegnede sannsynligheten\andelen, uten å nevne normalfordeling.
  • Når:
  • Hvordan:
    • Sentralgrenseteoremet sier at når vi har uavhengige, stokastiske variabler så skal vi forvente at et stort utvalg vil få en normalfordeling.
39Inferens og hypotese

Når forkaster vi henholdsvis nullhypotesen og alternativhypotesen?
  • Nullhypotesen:
    • Forkastes når signifikant resultat tilsier en forskjell ulik 0.
    • Når p-verdien (sannsynlighet for å feilaktig forkaste H0) er lavere enn alfa (godtatt sannsynlighet for å feilaktige forkaste H0).
  • Alternativhypotesen:
    • Forkastes når signifikant resultat sier at forskjell kan være 0.
    • Forkastes når vi ikke forkaster H0 - når p-verdien er lavere enn alfa.
40


Hva er et feilledd, og når og hvordan beregner vi dette?
  • Hva:
    • Aka residual, rest, ε.
    • Representerer avviket mellom regresjonslinje\forventning og virkelighet\målt verdi.
  • Når:
  • Hvordan:
    • y=y^^+e
      • Virkelig y-data=estimert y + feilledd
41


Hva er eksogenitet, hvilke forutsetninger krever det, og når har dette praktisk betydning???
42


Hva er R^2, og når og hvordan beregner vi dette?
  • Hva:
    • R^2 er korrelasjon, Pearsons R
  • Når:
  • Hvordan:
    • Manuelt:
      • Korrelasjon=(Sum((x-xgjsn)*(y-ygjsn)))/((n-1)*Sx*Sy)
        • Sum((x-xgjsn)*(y-ygjsn))
          • For hvert datapar x og y.
          • x=x-verdi.
          • y=y-verdi
        • Sx=standardavvik for x
        • Sy=standardavvik for y
        • n=antall datapar
    • Korrelasjon på kalkulator:
      • x-verdi
      • Hvit "input"
      • y-verdi
      • Sigma
      • gjsn:
        • Trykk Rød shift
        • Trykk 4
        • Trykk Rød shift
        • Trykk K\swap
        • Resultatet er korrelasjon, R2
43


Hva er Type 1-feil, og hvilken praktisk betydning har dette?
  • Hva:
    • Type 1-feil er når man forkaster en nullhypotese som man burde beholdt.
  • Betydning:
    • Betyr at man i hypotesetestingen beholder en alternativhypotese som faktisk er gal.
    • F.eks. hvis man forkaster nullhypotesen når p-verdien er mindre enn alfa.
44


Hva er Type 2-feil, og hvilken praktisk betydning har dette?
  • Hva: Type 2-feil er når man forkaster en alternativhypotese som man burde beholdt.
  • Betydning:
    • Betyr at man i hypotesetestingen beholder nullhypotesen når den faktisk er gal.
    • F.eks. at man beholder nullhypotesen når p-verdien er større enn alfa.
45


Hva er persentiler, og når og hvordan regner vi med dem?
  • Hva: En persentil er den delen av populasjonsfordelingen som er maksimalt like stor som det angitte persentil-tallet.
  • Når:
  • Hvordan:
    • (finn ut hva det brukes til)
46


Hva er forskjellen på tosidig og ensidig hypotesetest, og når og hvordan beregnes de?
  • Forskjell:
  • Når:
    • Ensidig:
      • Når alternativhypotesen er > eller < (ikke begge deler).
      • Chi-kvadrat-tester.
    • Tosidig:
      • Når alternativhypotesen er !=
      • Ved konfidensintervaller (Z-test).
  • Hvordan:
    • Ensidig:
    • Tosidig:
      • Gjør Z-test\T-test.
      • Halver alfa.
      • Halver p-verdien.
47


Hva er forutsetningene for en valid hypotesetest?
  • Z-test: (krav?)
  • T-test: (krav?)
  • Chi-kvadrat-test:
    • Tilfeldige utvalg.
    • Hver forventet verdi skal være minst 5.
48


Hva er Q-kvantil, og når og hvordan beregner vi det?
  • Hva: Test-observator for chi-kvadrattest.
  • Når: Ved chi-kvadrat-test.
  • Hvordan:
    • sum(((Observed-Expected)^2)/Expected)
      • Hvor observed=observert verdi i den enkelte rute.
      • Expected=beregnet forventning i tilsvarende rute
49


Hva er alfa-kvantil, og når og hvordan beregner vi det?
  • Hva: Alfaverdi for å vurdere signifikant forskjell mellom test og hypotese.
  • Når: Ved chi-kvadrattest.
  • Hvordan:
    • Beregn df
    • Finn signifikansnivå
    • Finn frem alfa i tabell, via df og signifikansnivå.
50


Når og hvordan beregner vi en chi-kvadrattest?
  • Når:
    • Når man vil se etter korrelasjon mellom kvalitative variabler.
  • Hvordan:
    • Man må ha en tabell over forventede verdier til å starte med.
    • Beregn forventede verdier i scenario uten korrelasjon.
      • Expected=(kolonnesum*Radsum)/totalsum
        • Expected=den enkelte rute i tabellen.
        • Kolonnesum=Sum for aktuell rutes kolonne.
    • Undersøk forskjell mellom observerte(O) verdier og forventede (E).
      • Forskjell=((Observed-Expected)^2)/Expected
        • Forskjell=Forskjell mellom observed og expected i den aktuelle ruten.
51


Hvordan defineres forkastningsområdet, og hvilken betydning har dette?
  • Definering:
    • Defineres av alfa.
      Dersom alfa halveres pga tosidig test, så er altså forkastningsområdet halvert.
    • Alternativhypotese+signifikansnivå→ kritisk verdi → forkastningsområde.
  • Betydning:
    • Essensielt for hypotesetesting. Forkastningsområdet sammen med testobservatoren avgjør om man forkaster nullhypotesen eller alternativhypotesen.
      • Når testobservator ligger ute i forkastningsområdet, forkastes H0.
52


Hvordan bestemmer man antall frihetsgrader å bruke i ulike tester?
  • Ved gruppesammenligning (T-test), bruk minste gruppes populasjon til df.
    • Min(utvalg1-1),(utvalg2-1)).
  • Linjeær regresjon=n-2
  • Chi-kvadrattest: Frihetsgrader df=(kolonneantall-1)(radantall-1)
53


Hva skiller eksperimentelle fra observasjonelle studier?
  • (finn forskjell)
54


Hva er kumulative frekvenstabeller, og hva brukes de til?
  • Hva:
    • Kumulativ frekvens er antall svaralternativer som er mindre eller lik aktuell verdi. Hvert nivå inneholder forrige nivå.
      Høyeste nivå vil derfor inneholde 100% av verdiene.
  • Bruk: (finn bruken)
55


Hva er relative frekvenstabeller, og hva brukes de til?
  • Hva: (finn ut)
  • Bruk: (finn ut)
56


Hva er et relativ frekvens-histogram, og hva brukes det til?
  • Hva: (finn ut)
  • Bruk: (finn ut)
57


Hva er en binominalfordeling, og når og hvordan brukes det?

  • Hva: (finn ut)
  • Når: (finn ut)
  • Hvordan: (finn ut)
58


Hva er binominalformelen, og når og hvordan brukes den?
  • Hva: (finn ut)
  • Når: (finn ut)
  • Hvordan:
    • P=nCx*(p^x)*(q^(n-x))
      • P=nCx*(P^x)*((1-P)^(n-x))
      • P=nCx*(sannsynlighet suksess^antall suksess)*(sannsynlighet fiasko^antall fiasko)
      • P=sannsynlighet
      • n=utvalgsstørrelse, antall tilfeller målt
      • x=antall true\suksess
59


Forklar egenskapene i en kontinuerlig uniform tetthetskurve, og hva en slik brukes til.
  • Egenskaper: (finn ut)
  • Bruk: (finn ut)
60


Hvordan vet man om Z er standard normalfordelt?
  • Hva: (finn ut)
  • Hvordan: (finn ut)
61


Hva betyr μ og hva brukes det til?
  • Hva: "My"
  • Bruk: Brukes om gjennomsnittsverdier i hypotesedefinisjoner.
62


Hva betyr σ og hva brukes det til?
  • Hva: Standardavvik.
  • Bruk: Se standardavvik.
63


Hva er α og hva brukes den til?
  • Hva: Alfa, forkastningsområdet i hypotesetesting.
  • Bruk: Brukes i hypotesetesting for å vurdere når nullhypotesen skal forkastes.


Undertemaer:

Label:

Filter by label

There are no items with the selected labels at this time.

Relatert label A:

Filter by label

There are no items with the selected labels at this time.

Relatert label B:

Filter by label

There are no items with the selected labels at this time.

test footer