Wie kann ein T-Test verwendet werden, um die Verteilungen zwischen Datengruppen zu vergleichen?
On Februar 10, 2021 by adminIch verstehe, dass der t-Test verwendet wird, um den Mittelwertunterschied für zwei Populationen zu testen, wenn die Populationen relativ ähnliche Varianzen aufweisen, die Einheiten unabhängig sind und Sie sind normal (insbesondere bei kleineren Stichproben).
Ich habe mich jedoch gefragt, wie T-Tests verwendet werden, um den Unterschied in der Datenverteilung zwischen zwei Gruppen zu untersuchen. Ich frage dies, weil es im Grunde die Formulierung ist, die von der Frage verwendet wird, die ich zu beantworten versuche. Mit einem T-Test wird verglichen, ob die Verteilungen des interessierenden Gegenstands unterschiedlich sind.
Der Grund, warum ich verwirrt bin, ist, obwohl ich verstehe, dass der Mittelwert ein Produkt der Verteilung ist und T-Tests stark von Ausreißern beeinflusst werden können, so dass der T-Test einige Informationen über zwei Verteilungen liefern kann. Es könnte einen Fall geben, in dem die beiden Verteilungen sehr ähnlich waren, aber die Effektgröße einfach deshalb groß war, weil sie auf unterschiedliche Mittel zentriert waren, und es könnte einen Fall geben, in dem die beiden Verteilungen mit unterschiedlichen Varianzen und so weiter funky aussahen, und das könnte dazu führen der gleiche t-stat. Wie kann man also etwas von einem T-Test unterscheiden?
Kommentare
- Während Sie schreiben, vergleichen T-Tests Mittelwerte. Das ist ein Aspekt einer Distribution. T-Tests vergleichen keine Varianzen, Schiefen, Kurtosis oder andere Aspekte der Verteilung. Bitte lassen Sie uns wissen, was Sie zu vergleichen versuchen.
- Es ‚ ist eine gute Frage: Viele Menschen, die mit statistischen Ideen nicht so vertraut sind, wie sie sollten Verwenden Sie häufig Phrasen wie “ und verwenden Sie einen t-Test, um zwei Verteilungen zu testen [oder zu vergleichen] , obwohl dies Verteilungen (oder Populationen) nur in dem äußerst begrenzten Sinne vergleicht, ihre Mittelwerte zu vergleichen. Wenn also der t-Test die Hypothese gleicher Mittelwerte ablehnt, unterscheiden sich die Verteilungen a fortiori; In vielen Fällen wird der t-Test die Hypothese jedoch nicht ablehnen (möglicherweise weil die Mittelwerte wirklich gleich sind), selbst wenn die Verteilungen ansonsten sehr unterschiedlich sind.
- Mit den Annahmen, die getroffen werden, um die Verteilung abzuleiten Von der Teststatistik unter der Null ist der übliche t-Test mit gleicher Varianz tatsächlich ein Vergleich der Verteilungen, da sich die Verteilungen dann nur dadurch unterscheiden können, dass sie unterschiedlich sind.
Antwort
Das typische Setup für einen T-Test mit zwei Stichproben lautet:
$$ X_1, \ dots, X_n \ overset {iid} \ sim N (\ mu_x, \ sigma ^ 2) $$
$$ Y_1, \ dots, Y_m \ overset {iid} \ sim N (\ mu_x + \ delta, \ sigma ^ 2) $$
$ $ H_0: \ delta = 0 $$
$$ H_a: \ delta \ ne0 $$
$$ \ text {(oder einseitig ausführen.)} $$
Wenn Sie bei diesem Setup feststellen, dass es t gibt Bei zwei verschiedenen Verteilungen ist dies nur möglich, wenn sie sich im Mittelwert unterscheiden.
Dann möchten Sie vielleicht sagen, dass die Varianzen ungleich sind, oder zumindest diese Möglichkeit berücksichtigen, und dann auf Mittelwert testen Unterschiede sowieso. Das bringt den Test von „s to Welch“ … der immer noch nur auf Unterschiede im Mittelwert testet. Es könnte einen Unterschied in der Varianz geben, und das könnte interessanter sein als ein Unterschied in den Mitteln, aber der Welch-Test sollte keine Unterschiede in der Varianz erfassen.
Eine Simulation in R bestätigt dies. P. >
set.seed(2019) times <- 10000 N <- 1000 Ps <- rep(NA,times) for (i in 1:times){ #the default t-test in R is the Welch test Ps[i] <- t.test(rnorm(N,0,1),rnorm(N,0,5))$p.value } length(Ps[Ps<0.1])/times length(Ps[Ps<0.05])/times
Auf der $ 0.1 $ -Ebene lehnen wir ungefähr 10% der Zeit ab und auf der $ 0.05 $ -Ebene, wir lehnen ungefähr 5% der Zeit ab. Dies ist bei einer ziemlich großen Stichprobengröße von 1000 der Fall, so dass selbst subtile Unterschiede entdeckt werden sollten, dies jedoch nicht Sie haben also Recht, dass der T-Test nicht viel für Sie bedeutet, wenn Sie Unterschiede untersuchen möchten, die nicht nur der Mittelwert sind.
Andere haben dies jedoch auch bemerkt, und zwar dort sind Tests für Verteilungsunterschiede im Allgemeinen. Der klassische Vollverteilungstest ist der Kolmogorov-Smirnnov (KS) -Test. Es untersucht den größten (technisch höchsten) vertikalen Abstand zwischen zwei (empirischen) CDFs. Es ist bekannt, dass der KS-Test nicht in der Lage ist, Unterschiede zurückzuweisen, die weit draußen in den Schwänzen zu finden sind, aber er ist immer noch ein beliebter Test. Einige andere umfassen Anderson-Darling und Kuiper. Einige, die mit Simulationen herumspielen, weisen mich darauf hin Kuiper ist der beste unter den dreien, wenn es darum geht, Schwanzunterschiede zu erkennen, obwohl ich dies nicht besonders gründlich untersucht habe.
Was Sie erforschen möchten, hängt davon ab, was Sie wissen möchten. Vielleicht ist es das Gut genug, dass Sie wissen, dass die Mittel unterschiedlich sind. In diesem Fall sind T-Tests oder Welch-Tests möglicherweise völlig in Ordnung!
Antwort
Teilweise in Kommentaren beantwortet:
Während Sie schreiben, vergleichen T-Tests die Mittelwerte. Das ist ein Aspekt einer Distribution. T-Tests vergleichen keine Varianzen, Schiefen, Kurtosis oder andere Aspekte der Verteilung. Bitte lassen Sie uns wissen, was Sie vergleichen möchten.
– Peter Flom
Es ist eine gute Frage: Viele Leute, die mit statistischen Ideen nicht so vertraut sind, wie sie sein sollten (oder denken), verwenden häufig Sätze wie „Verwenden Sie einen T-Test, um zwei Verteilungen zu testen [oder zu vergleichen]“ obwohl dies Verteilungen (oder Populationen) nur in dem äußerst begrenzten Sinne vergleicht, ihre Mittelwerte zu vergleichen. Wenn also der t-Test die Hypothese gleicher Mittelwerte ablehnt, unterscheiden sich die Verteilungen erst recht, aber in vielen Fällen wird der t-Test nicht ablehnen die Hypothese (vielleicht weil die Mittelwerte wirklich gleich sind), auch wenn die Verteilungen ansonsten sehr unterschiedlich sind.
– whuber
Mit den Annahmen, die getroffen werden, um die Verteilung der Teststatistik unter Null abzuleiten, ist der übliche t-Test mit gleicher Varianz tatsächlich ein Vergleich von Verteilungen, da die onl Die Art und Weise, wie sich die Verteilungen dann unterscheiden können, besteht darin, dass die Mittel unterschiedlich sind.
– Glen_b
Schreibe einen Kommentar