College 38 – WSR-t – Non-parametrisch toetsen Parametrische oetsen: er moest altijd voldaan worden aan assumpties: toetsingsgrootheid, varianties
gelijk, etc. Dan kon je kleine correcties uitvoeren en kon het nog steeds. Soms kan je niet corrigeren.
Hiervoor zijn non-parametrische toetsen.
Er zijn er vier, dus niet voor allemaal is een non-parametrisch alternatief.
Power bij non-parametrische statistiek is minder sterk, goede reden om parametrische statistiek te
gebruiken als dat kan.
Ook is het minder overzichtelijk wat de signaal-ruis verhouding is.
Scores bij non-parametrische toetsing rangschikken van klein naar groot.
Als er twee (of meer) dezelfde zijn, geef je deze een rangorde, tel je de rangordes van de gelijke
getallen bij elkaar op en deel je dit door het aantal gelijke getallen. Procedure van non-parametrische toets:
1. Assumption: independent random samples
2. Hypothesis:
a. H0: equal population distributions (=equal mean ranking)
b. HA: unequal mean ranking (two sided)
c. HA: higher mean ranking for one group
3. Test statistic is difference between mean or sum of ranking
4. Standardise test statistic
5. Calculate P-value one or two sided
6. Conclude to reject H0 if p < a
Z-waarden berekenen
Er wordt niet zozeer gekeken naar het verschil tussen de ene groep en de andere groep, maar eerder
naar het verschil met het gemiddelde.
4 non-parametrische toetsen
1. Wilcoxon rank-sum test
Non-parametrisch alternatief voor independent samples t-test / independent ANOVA met
maar 2 categorieen).
Is er verschil tussen groepen? – maar dan obv rangordening. W = min (rank-sum 1, rank-sum 2)
Gemiddelde W (Wilcoxon toetsingsgrootheid) = (n1 * (n1 + n2 + 1)/2
Standaard error W = sqrt((n1 * n2 (n1 + n2 + 1))/12)
Standaardiseren: Z = (W – W.mean) / W.se
Visualize.norm(z, section=”lower”) voor eenzijdig toetsen
Visualize.norm(c(z, -z), section=”tails”) voor tweezijdig toetsen Obv de gevonden z-waarde kan je de effect size berekenen: r = z / sqrt(N)
Mann-Whitney test doet ongeveer hetzelfde, maar dan ingewikkelder.
2. Wilcoxon signed-rank test
Non-parametrisch alternatief voor de paired-samples t-test. T-waarde berekenen
Verschilscore berekenen (maar omdat je de rangorde wil weten, ben je niet geinteresseerd in
de richting van het verschil, dus bereken je de absolute difference).
Dan ga je de rangorde opstellen, maar je wil alleen in de rangorde als er een verschil is tussen
de twee metingen. Als het verschil 0 is, dan neem je die niet mee.
Oke en dan ga je deze dus weer ranken en dan moet je dus de rangordes van de getallen die
hetzelfde zijn optellen en delen door het aantal gelijke getallen. Dan wil je een onderscheid
maken tussen de getallen die positief waren en die negatief waren, dus dan maak je twee
nieuwe rijen met de positieve rankings en de negatieve rankings.
Dan ga je de som van de positieve rankings berekenen (T+). Dit geeft aan hoeveel positiever
de ene groep scoort ten opzichte van de ander.
t_pos = sum(data$rank_pos)
Vervolgens bereken je de N, zonder de 0 (geen verschil) mee te nemen.
N = sum(abs(data$sign))
Gemiddelde van N berekenen
T_mean = (n*(n+1))/4
Standaard error van N berekenen
SE_t = sqrt((n*(n+1)*(2*n+1)) / 24
Omscoren naar Z-score
Z = (T_pos – T_mean)/SE_t
Visualize
Effect size berekenen (omvang van het gevonden effect)
R = z/sqrt(N)
3. Kruskal-Wallis test
Non-parametrische alternatief voor een independent one-way anova met meer dan 2
niveaus van onafhankelijke variabele. (Rangordening en verschillende groepen, bv. 3) Toetsingsgrootheid bij deze toets heet H.
H is de optelsom van de gekwadrateerde rangen gedeeld door N. Dit doen we min 3 (is een
constante) vermenigvuldigd met N + 1. In essentie staat hier (terugdenkend aan
chikwadraad) de gevonden proportie afzet tegen de verwachte proportie. Ri ( de rang) is wat
je gevonden hebt. 3(N + 1) is de verwachting.
R.i = aggregate (ranks ~ factor, data = data, sum) $ ranks
(optelsom van alle rangnummers binnen 1 groep)
H = (12/(N*(N+1)) ) * sum(R.i^2/n.i) – 3* (N+1)
Df = k-1
Visualize.chisq (H, df, section=”upper”)
(upper, omdat het alleen maar positief kan zijn, omdat het een chikwadraat verdeling is)
4. Friedman’s ANOVA
Repeated one-way paired ANOVA. Meerdere metingen tussen een persoon (voor, tussen,
na).
Niet rangordenen over groepen, maar rangordenen binnen een persoon. Dus bv. voormeting
24, tussenmeting 25, nameting 22. Nameting=1, voormeting=2, tussenmeting=3.
Waarom delen we R niet door N -> omdat het binnen 1 persoon is, dus aantal personen niet
relevant daarvoor.
Alle rangnummers van de rijen optellen, dus alle voormetingen, nametingen en
tussenmetingen.
Fr berekenen:
Fr = ( (12/(N*k*(k+1)) ) * sum(R.i^2) ) – (3*N*(k+1) )
df = k-1
visualize.chisq(F.r, df, section=”upper”)
Document Outline
College 38 – WSR-t – Non-parametrisch toetsen
1. Wilcoxon rank-sum test
2. Wilcoxon signed-rank test
3. Kruskal-Wallis test
4. Friedman’s ANOVA
College 39 – WSR-t – Bayesiaans redeneren & parameter schatting
College 40 – WSR-t – Bayesiaans redeneren & hypothesis testing
College 42 – WSR-t – Netwerkmodellen
College 43 – WSR-t – Against Methodolatry
Filmpje 1 – credibility & possibility
Filmpje 2 – Bayes theorem
Filmpje 3 – Frequentisme vs Bayesianisme
Artikel 1: Kinds versus continua: a review of psychometric approaches to uncover the structure of psychiatric constructs
Artikel 2: Toward a Model-Based Approach to the Clinical Assessment of Personality Psychopathology
Artikel 3: Network Analysis: an integrative approach to the structure of psychopathology
Artikel 4: Introduction to qualitative psychological research
Artikel 5: Bayes and the probability of hypotheses