Hoe kan een t-toets worden gebruikt om de verdelingen tussen groepen gegevens te vergelijken?
Geplaatst op februari 10, 2021 door adminIk begrijp dat de t-test wordt gebruikt om het verschil in gemiddelden voor twee populaties te testen wanneer de populaties relatief vergelijkbare varianties hebben, de eenheden onafhankelijk zijn en ze zijn normaal (vooral bij kleinere steekproeven).
Ik vroeg me echter af hoe t-tests worden gebruikt om te kijken naar het verschil in de verdeling van gegevens tussen twee groepen? Ik vraag dit omdat het in feite de formulering is die wordt gebruikt door de vraag die ik probeer te beantwoorden. Het vraagt om te vergelijken of de uitkeringen van het item van belang verschillen met behulp van een t-toets.
De reden dat ik in de war ben, is dat, hoewel ik begrijp dat het gemiddelde een product is van de distributie en t-tests sterk kunnen worden beïnvloed door uitschieters, dus de t-test kan wat informatie geven over twee distributies, er zou een geval kunnen zijn waarbij de twee distributies erg op elkaar leken, maar de effectgrootte was eenvoudig omdat ze op verschillende manieren waren gecentreerd, en er zou een geval kunnen zijn waarin de twee distributies er funky uitzagen met verschilvariaties en zo, en dat zou kunnen leiden tot dezelfde t-stat. Dus hoe zou je iets van een t-test kunnen zien?
Reacties
- Terwijl je schrijft, vergelijken t-tests de middelen. Dat is een aspect van een distributie. T-tests vergelijken geen varianties, scheefheid, kurtosis of andere aspecten van distributie. Laat ons alstublieft weten wat u probeert te vergelijken.
- Het is ' een goede vraag: veel mensen die niet zo vertrouwd zijn met statistische ideeën als zou moeten gebruik (of denk dat ze zijn) vaak woordgroepen zoals " gebruik een t-test om twee distributies ook al vergelijkt dit verdelingen (of populaties) alleen in de extreem beperkte zin van het vergelijken van hun middelen. Dus als de t-toets de hypothese van gelijke gemiddelden verwerpt, a fortiori verschillen de verdelingen; maar in veel gevallen zal de t-test de hypothese niet verwerpen (misschien omdat de gemiddelden echt gelijk zijn), zelfs niet als de verdelingen anders heel verschillend zijn.
- Met de aannames die zijn gemaakt om de verdeling af te leiden van de teststatistiek onder de nulwaarde, is de gebruikelijke t-test met gelijke variantie inderdaad een vergelijking van verdelingen, aangezien de enige manier waarop de verdelingen dan kunnen verschillen, is dat de middelen verschillend zijn.
Answer
De typische opzet voor een twee-steekproef t-test is:
$$ X_1, \ dots, X_n \ overset {iid} \ sim N (\ mu_x, \ sigma ^ 2) $$
$$ Y_1, \ dots, Y_m \ overset {iid} \ sim N (\ mu_x + \ delta, \ sigma ^ 2) $$
$ $ H_0: \ delta = 0 $$
$$ H_a: \ delta \ ne0 $$
$$ \ text {(Of doe het eenzijdig.)} $$
Als u bij deze instelling merkt dat er t twee verschillende verdelingen, de enige manier waarop dat kan gebeuren, is als ze verschillen in gemiddelde.
Dan zou je kunnen zeggen dat de varianties ongelijk zijn, of op zijn minst rekening houden met die mogelijkheid, en dan testen op gemene verschillen toch. Dat krijgt de test van Welch … die nog steeds alleen test op verschillen in gemiddelde. Er kan een verschil in variantie zijn, en dat is misschien interessanter dan een verschil in gemiddelden, maar Welchs test zou geen verschillen in variantie moeten opsporen.
Een simulatie in R bevestigt dit.
set.seed(2019) times <- 10000 N <- 1000 Ps <- rep(NA,times) for (i in 1:times){ #the default t-test in R is the Welch test Ps[i] <- t.test(rnorm(N,0,1),rnorm(N,0,5))$p.value } length(Ps[Ps<0.1])/times length(Ps[Ps<0.05])/times
Op het $ 0,1 $ -niveau wijzen we ongeveer 10% van de tijd af, en op het $ 0,05 $ -level, weigeren we ongeveer 5% van de tijd. Dit is met een vrij grote steekproefomvang van 1000, dus zelfs subtiele verschillen zouden ontdekt moeten worden, maar dat zijn ze niet . Dus je hebt gelijk dat de t-test niet veel voor je doet als je verschillen wilt onderzoeken die niet alleen de gemiddelde zijn.
Anderen hebben dit echter ook opgemerkt, en daar zijn tests voor verdelingsverschillen in het algemeen. De klassieke volledige distributietest is de Kolmogorov-Smirnnov (KS) -test. Het onderzoekt de grootste (technisch supremum) verticale afstand tussen twee (empirische) CDFs. Het is bekend dat de KS-test een gebrek aan kracht heeft om verschillen die ver weg in de staarten worden gevonden te verwerpen, maar het is nog steeds een populaire test. Enkele andere zijn onder meer Anderson-Darling en Kuiper. Sommige spelen met simulaties geven aan dat Kuiper is bij de drie de beste in het detecteren van staartverschillen, hoewel ik niet bijzonder grondig ben geweest in mijn onderzoek hiernaar.
Wat je verkiest te onderzoeken, hangt af van wat je wilt weten. Misschien is het wel goed genoeg om te weten dat de middelen anders zijn, in welk geval t-testen of Welch-testen helemaal in orde kunnen zijn!
Antwoord
Gedeeltelijk beantwoord in opmerkingen:
Terwijl u schrijft, vergelijken t-tests gemiddelden. Dat is een aspect van een distributie. T-tests vergelijken geen varianties, scheefheid, kurtosis of andere aspecten van distributie. Laat ons weten wat u probeert te vergelijken.
– Peter Flom
Het is een goede vraag: veel mensen die niet zo vertrouwd zijn met statistische ideeën als ze zouden moeten zijn (of denken dat ze zijn), gebruiken vaak uitdrukkingen als gebruik een t-test om twee distributies te testen [of te vergelijken] , zelfs hoewel dit verdelingen (of populaties) alleen vergelijkt in de uiterst beperkte zin van het vergelijken van hun gemiddelden. Dus als de t-test de hypothese van gelijke gemiddelden verwerpt, verschillen de verdelingen a fortiori; maar in veel gevallen zal de t-test niet verwerpen de hypothese (misschien omdat de middelen echt gelijk zijn), zelfs als de distributies anders heel verschillend zijn.
– whuber
Met de aannames die worden gedaan om de verdeling van de teststatistiek onder de nul af te leiden , is de gebruikelijke t-test met gelijke variantie inderdaad een vergelijking van distributies, sinds de onl De manier waarop de distributies dan kunnen verschillen, is doordat de middelen verschillen.
– Glen_b
Geef een reactie