Samenvatting Statistiek 2
INLEIDING ...................................................................................................................................................... 3
WAAROM STATISTIEK IN DE PSYCHOLOGIE? ................................................................................................................... 3
INDUCTIEVE STATISTIEK ............................................................................................................................................. 3
MISBRUIK VAN STATISTIEK ......................................................................................................................................... 5
INTERNE VALIDITEIT .................................................................................................................................................. 5
EXTERNE VALIDITEIT ................................................................................................................................................. 6
SAMENVATTING ...................................................................................................................................................... 6
DE BASIS: KENNIS VOOR STATISTIEK 2? ........................................................................................................................ 6
HOOFDSTUK 1: STATISTIEK 1 IN VOGELVLUCHT .............................................................................................. 7
VARIABELEN OPERATIONALISEREN EN METEN ................................................................................................................ 7
STEEKPROEVEN ....................................................................................................................................................... 7
FREQUENTIEVERDELINGEN ......................................................................................................................................... 8
CENTRUMMATEN .................................................................................................................................................... 8
SPREIDINGSMATEN .................................................................................................................................................. 8
DE NORMALE VERDELING .......................................................................................................................................... 9
TRANSFORMATIES VAN VERDELINGEN .......................................................................................................................... 9
KRUISTABELLEN ....................................................................................................................................................... 9
CORRELATIE ........................................................................................................................................................... 9
LINEAIRE REGRESSIE ................................................................................................................................................. 9
HOOFDSTUK 2: KANSENVERDELING EN KANSENBEREKENING ....................................................................... 11
VOOR STATISTIEK 2 ................................................................................................................................................ 11
VANDAAG ............................................................................................................................................................ 11
OPFRISSING: NORMALE VERDELING EN KANSEN BEREKENEN ............................................................................................ 15
HOOFDSTUK 3: BETROUWBAARHEIDSINTERVALLEN EN HYPOTHESETOETSING ............................................. 19
PREVIOUSLY ON STATISTIEK 2 .................................................................................................................................. 19
BETROUWBAARHEIDSINTERVALLEN ........................................................................................................................... 19
HYPOTHESETOETSING ............................................................................................................................................. 21
SAMENGEVAT ....................................................................................................................................................... 23
PREVIOUSLY ON STATISTIEK 2 .................................................................................................................................. 23
VERVOLG – HYPOTHESETOETSING ............................................................................................................................. 24
SAMENVATTING .................................................................................................................................................... 30
HOOFDSTUK 4: TOETSEN VOOR ÉÉN POPULATIE .......................................................................................... 31
WAT VOORAFGING… .............................................................................................................................................. 31
T-TOETS, X2-TOETS ................................................................................................................................................ 31
HOOFDSTUK 5: TOETSEN VAN TWEE POPULATIES ........................................................................................ 37
T-TOETS VOOR 2 GEMIDDELDEN, WILCOXON RANK SUM TOETS ...................................................................................... 37
HOOFDSTUK 6: TOETSEN VOOR 2 POPULATIES – AFHANKELIJKE STEEKPROEVEN .......................................... 45
T-TOETS VOOR AFHANKELIJKE STEEKPROEVEN .............................................................................................................. 45
– WILCOXON SIGNED RANK TOETS ............................................................................................................................ 45
HOOFDSTUK 7: VARIANTIEANALYSE ............................................................................................................. 51
VARIANTIEANALYSE: ONE WAY ANOVA & KRUSKAL-WALLIS ......................................................................................... 51
VARIANTIEANALYSE: TWO WAY ANOVA .................................................................................................................... 54
AANVULLING TER ILLUSTRATIE: VERSCHILLENDE SCENARIO’S BIJ TWO-WAY ANOVA ............................................................ 62
HOOFDSTUK 8: VARIANTIEANALYSE MET HERHAALDE METINGEN ............................................................... 63
HERHAALDE METINGEN ANOVA .............................................................................................................................. 63
FRIEDMAN’S ANOVA .............................................................................................................................................. 66
HOOFDSTUK 9: TOETSEN VOOR HET VERBAND TUSSEN VARIABELEN MET GELIJK MEETNIVEAU ................... 69
PEARSON CORRELATIE ............................................................................................................................................ 69
SPEARMAN CORRELATIE .......................................................................................................................................... 72
X2-TOETS ............................................................................................................................................................. 72
HOOFDSTUK 10: REGRESSIEANALYSE ............................................................................................................ 74
REGRESSIEANALYSE ................................................................................................................................................ 74
Inleiding
Waarom statistiek in de psychologie?
- Verwerking van onderzoeksdata
- Betere interpretatie van psychologische literatuur
- Kritischer interpretatie onderzoeksrapportering in algemene media
è Basis aan statistische kennis en ervaring om te snelle en te simpele conclusies te
vermijden!
Inductieve statistiek
Kan muziek invloed hebben op de depressieve gevoelens van mensen?
Kan een verschillende genre van muziek invloed hebben op de depressieve gevoelens van mensen?
Twee verschillende genres kunnen die een invloed hebben op de depressieve gevoelens van
individuen?
Onderzoek: een groep de ene genre laten luisteren, andere groep het andere genre en dan een
vragenlijst laten invullen over depressieve gevoelens
Popfunk
102
120
105
Melorock
99
92
97
1ste score: Is het verschil groot genoeg om te zeggen dat de manipulatie echte een effect heeft
gehad?
2de score: groot verschil
3de score: verschil, maar niet enorm veel
è Dit is het kernprobleem van de inductieve statistiek
ð Hoe kunnen we het verschil maken dat er iets significant verschil is?
ð Hoe kunnen we de onderzoeksgegevens dan veralgemenen naar de
algemene populatie?
è Statistiek biedt regels om te beslissen over deze vragen:
hypothesetoetsing & significantie
De empirische cyclus
Melorock =
Theorie
popfunk
Inductieve
Melorock meer
Hypothese
analyse
depressie dan popfunk
Is 102 significant
groter dan 99?
Beschrijvende
Dataverzameling
analyse
Neem vragenlijst af na
Popfunk =
luisteren naar ofwel melorock
102
of popfunk
Melorock =
99
Hypothesetoetsing
Statistische significantie nagaan dmv kansberekening:
Kansen zijn van cruciaal belang om hypothesetoesting toe te passen
Is het geobserveerde verschil groot genoeg om significant te zijn?
Hoe spelen kansen hierin een rol?
Redenering van de hypothesetoesting:
ervan uitgaan dat er in werkelijkheid geen verschil is
Populatie A = Populatie B
kansen berekenen dat we in dat geval die observaties
doen
Steekproef A > Steekproef B
grote kans: wellicht geen
kleine kans: mogelijk een
"echt" verschil
"echt" verschil
Kansberekening
Nieuwe vragen:
→ Hoe moeten we die kans berekenen?
• Op basis van kansverdelingen (bv. standaardnormale verdeling)
• Met behulp van verschillende toetsen
→ Wat is dan een “grote” en een “kleine” kans?
• 5% of 0.05 meest courant
Gevolgen van de hypothesetoetsing
Zijn we er dan zeker van (zekerheid van de kans/conclusie)?
•
Nooit 100% zeker van conclusie
•
Onzekerheid is geen probleem, als we maar de mate van onzekerheid
kennen!
bv: “We concluderen met 95% zekerheid dat popfunk zorgt voor een betere
gemoedstoestand dan melancholische rock”
è Naar mate dat er meer en meer studies naar hetzelfde onderwerp wordt gedaan,
dan wordt de zekerheid van het onderwerp groter en groter (want één studie kan
nooit iets bewijzen).
Toetsen
Toetsingssituaties zijn heel uiteenlopend:
- verschil in depressie bij verschillende muziek?
- verschil in depressie vóór en na beluisteren van muziek?
- verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
- 500 deelnemers of slechts 20?
- …
è Deze verschillende gegevens zorgen ervoor dat we uiteenlopende
toetsen kunnen kiezen aan de hand van de situatie en de experimentele
opzet.
Misbruik van statistiek
→ Onduidelijke steekproef
“95% van de Belgen is tevreden over Activia”
ð Van waar komen deze getallen? Wie heb je ondervraagd? Wat is de steekproef?
→ Gebrek aan context
“Duracell-batterijen gaan tot 5 maal langer mee”
ð Met wat heb je vergeleken (beste/slechtste concurrent)?
→ Interne validiteit
Laat het onderzoeksopzet toe om causale conclusies te trekken?
Interne validiteit
Ongeoorloofde causale conclusie
Interne validiteit = mate waarin we met een onderzoeksontwerp causale
conclusies kunnen trekken over effect van OV op AV 3 voorwaarden:
1. Geen andere verklaringen voor gevonden verband
2. Oorzaak moet in tijd voorafgaan aan gevolg
3. Effect van OV op AV in voorspelde richting
bv: Kunnen kinderen beter lezen als ze door hun ouders vaak worden voorgelezen?
test bij 20 kinderen die vaak worden voorgelezen en 20 kinderen die nooit worden
voorgelezen
eerste groep scoort 7, tweede groep scoort 6
significant verschil, maar ook intern valide?
Voorwaarde 1: Geen andere verklaringen voor gevonden verband?
Ouders die beter/vaker voorlezen vs. ouders die minder goed/vaak voorlezen
Intelligentie van ouders, krijgen vaak ook intelligentere kinderen waardoor ze beter lezen
en niet omdat ze meer voorlezen dat de kinderen beter kunnen lezen
Voorwaarde 2: gaat de oorzaak vooraf aan het gevolg?
Meer voorlezen à beter lezen
Beter lezen à meer voorlezen
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
•
randomiseren
•
voormeting
•
nameting
•
controleren voor storende variabelen
•
…
= methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen
is onvoldoende!
è Correlatie wil niet altijd zeggen dat er causaliteit is.
Externe validiteit
Ongeoorloofde generalisatie
Externe validiteit = mate waarin resultaten van het onderzoek kunnen
gegeneraliseerd worden over:
1. situaties (lijkt de onderzoekssituatie genoeg op de “dagelijkse” situatie?)
2. methoden (wordt hetzelfde resultaat gevonden met een andere
methode?)
3. tijd (zelfde resultaten in een andere periode?)
4. populaties (zelfde resultaten in andere populatie?)
Samenvatting
Toetsende statistiek volgt op beschrijvende statistiek in de empirische cyclus. Bedoeling
is om op basis van verzamelde data een onderbouwde beslissing te nemen over
verband/verschil.
Dat we over deze beslissing nooit 100% zeker zijn is niet erg, zo lang we maar de mate
van onzekerheid kennen.
Om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig.
Op basis daarvan kunnen we significantie berekenen.
Statistiek is geen wetenschap op zich. Statistische conclusies zijn pas waardevol als ook
aan de randvoorwaarden voldaan is en statistiek niet misbruikt wordt.
De basis: Kennis voor Statistiek 2?
Opdracht
Een psychologisch consulent wil nagaan wat het effect is van drie soorten opvoedingsstijlen van de
moeder op het welbevinden van Vlaamse kleuters. Daarenboven is zijn vraag of dit effect anders is
voor jongens en meisjes.
Om de opvoedingsstijl van de moeder te bepalen geeft de psycholoog een vragenlijst (5 vragen)
mee naar huis met kleuters die de moeders moeten invullen. Op basis van de antwoorden
categoriseert hij de moeders als autoritair, autoritatief, of permissief. Het welbevinden van de
kleuters wordt in de klas met een item uit een zelfbelevingsschaal gemeten (score van 1 =
helemaal niet van toepassing, 2 = niet echt van toepassing, 3 = beetje van toepassing, 4 = heel
erg van toepassing).
Om tot een steekproef van 300 kleuters te komen vertrekt hij van alle kleuterscholen in
Vlaanderen. Hij trekt op aselecte manier 10 scholen. In elke school selecteert hij op aselecte
manier 30 kleuters. Aan deze 300 kleuters wordt de vragenlijst voor de moeder meegegeven en
wordt in de klas de zelfbelevingsschaal afgenomen.
Wat zijn de onafhankelijke en afhankelijke variabelen in dit onderzoek?
OV: opvoedingsstijl
AF: welbevinden
Wat zijn de meetniveaus van alle variabelen?
Opvoedingsstijl, geslacht: nominaal
Welbevinden: ordinaal (vanaf meerdere likertschalen (items) is het interval)
Welke soort steekproef wordt er getrokken?
Clustersteekproef
à Voordeel: snel, efficiënt en toch aselect en redelijk representatief
Welke techniek zou je gebruiken om de samenhang tussen de variabelen Opvoedingsstijl
en Welbevinden te berekenen?
Kruistabel, want verband tussen nominaal en ordinaal
à Kijken wat de meetniveaus zijn om zo een samenhangstechniek/toets te kunnen
kiezen