Reliabilitet

 

 

FagfeltStatistikk
Definisjonreliabilitet: At målingen er til å stole på
Synonymerpålitelighetnøyaktighet

 

Påliteligheten av resultatene i en test eller undersøkelse som gjennomføres flere ganger og av ulike forskere.

- Reliabilitet (pålitelighet) vil si at metodene skal kunne etterprøves av andre og da gi samme, eller ikke mer enn sannsynlig avvikende, resultat. 
- Reliabiliteten er høy hvis de tilfeldige feilene er små og har altså å gjøre med hvor nøyaktig det måles det som faktisk måles. 
- Reliabilitet er den nøyaktighet måleinstrumentet har. Metermåleren er kanskje gradert i centimeter. Den vil da ikke være nøyaktig på millimeteren. Intelligenstesten kan også være mer eller mindre nøyaktig, det vil si at man må regne med målefeil. Observatøren av aggresjon kan være usikker på hva som skal regnes som et slag, eller kanskje ikke rekker å notere alle slagene. 
Reliabiliteten kan som oftest beregnes og angir hvor mye målefeil man må regne med. 
- Reliabilitet betyr “pålitelighet”. Dersom man tester samme person med samme test flere ganger og får stor grad av sammenfallende resultat, har testen høy reliabilitet. Dersom resultatene varierer fra gang til gang er reliabiliteten lav. 
Undersøkelser så langt har vist at de fleste tester har høy reliabilitet. At en test er reliabel er imidlertid kun en nødvendig, men ikke tilstrekkelig betingelse for at testen kan anses som tilfredsstillende
I hvilken grad vi kan stole på meningsmålinger er forenklet sagt basert på to faktorer; reliabilitet og validitet – eller hvor godt det vi måler er basert på statistisk teori og om de svarene vi får er et uttrykk for det vi søker å måle. 
Andre forhold som gir dårlig reliabilitet kan være uheldig skalering (upassende- eller skjev skalabruk som svaralternativer), svarandel, tid og tidspunkt for undersøkelsen.

Reliabilitet er en nødvendig, men ikke tilstrekkelig forutsetning for validitet.


Enhver test må dokumentere tilfredsstillende reliabilitet, som enkelt formulert betyr at testen må gi tilnærmet det samme resultat ved gjentatte målinger. 
Anastasi & Urbina (1997) beskriver reliabilitet som en testskåres nøyaktighetkonsistens og stabilitet på tvers av situasjoner. 
En testskåre vil vanligvis likevel i noen grad avvike fra en persons ”sanne” skåre, og dette avviket omtales som testens målefeil. En reliabel test har liten målefeil og vil derfor gi nær identiske skårer innen en og samme testing og ved testing på ulike tidspunkter. 
En tests reliabilitet er følgelig viktig å kjenne til og må tas hensyn til, særlig om man sammenligner en persons testresultat på ulike tidspunkter, noe som ofte er tilfelle i kliniskvirksomhet.

De vanligste former for reliabilitet er test-retest reliabilitetsplit-half reliabilitet og interrater reliabilitet (PrinceStewartFord og Hotopf, 2004). 
Test-retest reliabilitet refererer til korrelasjonen mellom resultatet etter to administrasjoner av samme test. 
Split-half reliabilitet dreier seg om korrelasjonen mellom to likeverdige deler av samme test eller deltest. 
Inter-rater reliabilitet dreier seg om korrelasjon mellom flere testlederes bedømmelse av prestasjon på samme test.

Reliabilitet påvirkes sterkt av antall testledd, ved at få testledd vil medføre lav reliabilitet (Bjørndal og Hofoss, 2006).

Ved måling av antatt stabile kognitive egenskaper som f. eks. intelligens og hukommelse, er det spesielt viktig at test-retestreliabilitet er høy, mens det ved måling av tilstander som depresjon/angst er spesielt viktig at intern konsistens og/eller parallell-test reliabilitet er høy (Rosenberg HansenIvanouwKarpatschof og Lykke Mortensen, 2004) . 
Det ligger i sakens natur at reliabiliteten vanligvis vil være høy i tester som har klare og presise regler for administrasjon og skåring av responser. Motsatt vil det være slik at jo mer rom det er for ulik instruksjon og vurdering av responser, jo lavere vil reliabiliteten vanligvis være. Det er ingen absolutte krav til hvor høye reliabilitetsverdier en test skal vise, men for tester som skal brukes i diagnostisk øyemed, er kravene høyere enn for tester som benyttes forscreening-formål.

Ifølge MitrushinaBooneRazani og D’Elia (2005) har de fleste nevropsykologiske tester reliabilitetsverdier i området 0,80-0,95, som tilsvarer moderat til høy reliabilitet, mens det for screening-tester vanligvis vil aksepteres verdier i området 0,60-0,80. Verdier under 0,60 vil imidlertid vanligvis bli oppfattet som uakseptable.


Reliabilitet 
“Because human behavior is never static, no study can be replicated exactly, regardless of the methods and design employed” 
split-half reliabilitet: Denne metoden gjør at man deler inn testen i to like deler og split-half korrelasjonen vil da være korrelasjonen mellom en persons samlede skårer på henholdsvis 1. og 2. halvdel på testen. Testen kan også deles i to på andre måter, for eksempel ved å ta annethvert spørsmål i hver del. 
test-retest reliabilitet: En måte man kan gå fram på for å godtgjøre at testen har reliabilitet, er å gjennomføre teten to ganger. Hvis man gjør dette for en rekke personer, oppnås en rekke parvise skårer. Høy korrelasjon mellom disse skårene indikerer god reliabilitet. 
Indre Reliabilitet: Den indre reliabilitet eller påliteligheten i en undersøkelse går på om gjentatte målinger med samme måleinstrument vil gi samme resultat. 
Ytre Reliabilitet: Ytre reliabilitet viser i hvilken grad ulike forskere vil oppdage samme fenomen i den samme og i lignende situasjoner. 
Bedømmerreliabilitet: I hvilken grad ulike observatører er enige i skårene på en bestemt test eller av observert atferd.


Styrking av reliabilitet: 
Vi må kjenne til: 
- Hvem forskeren er 
- Hvilke informanter som inngår 
- Hvilken sosial setting som foreligger 
- Hvilke analytiske begreper er brukt 
- Hvilke metoder for innsamling og analyse av data er benyttet

Linker hit:





 

Undertemaer:

Mentions:

Indirekte relaterte sider:

Filter by label

There are no items with the selected labels at this time.

 

test footer