T-test accoppiato e non accoppiato
Su Gennaio 31, 2021 da adminSupponi di avere 20 topi. Abbino i topi in qualche modo, così ottengo 10 paia. Ai fini di questa domanda, potrebbe essere un accoppiamento casuale, OPPURE potrebbe essere un accoppiamento sensato, come provare ad accoppiare topi della stessa cucciolata, dello stesso sesso, con peso simile, OPPURE potrebbe essere un accoppiamento deliberatamente stupido come cercando di accoppiare topi con pesi il più possibile disuguali. Quindi uso numeri casuali per assegnare un topo in ciascuna coppia al gruppo di controllo e laltro topo al gruppo da trattare. Ora faccio lesperimento, trattando solo i topi da trattare, ma per il resto non prestando alcuna attenzione agli arrangiamenti appena fatti.
Quando si arriva ad analizzare i risultati, si potrebbe usare t- test o test t accoppiati. In che modo, se ce ne saranno, le risposte saranno diverse? (Fondamentalmente sono interessato alle differenze sistematiche di qualsiasi parametro statistico che deve essere stimato.)
Il motivo per cui lo chiedo è che un articolo con cui sono stato recentemente coinvolto è stato criticato da un biologo per aver utilizzato un appaiato t-test piuttosto che un test t spaiato. Naturalmente, nellesperimento vero e proprio, la situazione non era così estrema come la situazione che ho abbozzato e cerano, a mio parere, buone ragioni per laccoppiamento. Ma il biologo non era daccordo.
Mi sembra che non sia possibile migliorare in modo errato la significatività statistica (diminuire il valore p), nelle circostanze che ho abbozzato, utilizzando un t-test accoppiato , piuttosto che un test non accoppiato, anche se non è appropriato accoppiare. Tuttavia, potrebbe peggiorare la significatività statistica se i topi fossero mal accoppiati. È corretto?
Risposta
Sono daccordo con i punti che sia Frank che Peter sostengono ma penso che ci sia una formula semplice questo arriva al cuore della questione e può essere utile da prendere in considerazione per lOP.
Siano $ X $ e $ Y $ due variabili casuali la cui correlazione è sconosciuta.
Sia $ Z = XY $
Qual è la varianza di $ Z $?
Ecco la formula semplice: $$ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y) – 2 \ text {Cov } (X, Y). $$ E se $ \ text {Cov} (X, Y) > 0 $ (cioè $ X $ e $ Y $ sono correlati positivamente)?
Quindi $ \ text {Var} (Z) \ lt \ text {Var} (X) + \ text {Var } (Y) $. In questo caso, se laccoppiamento viene effettuato a causa di una correlazione positiva, come quando si ha a che fare con lo stesso soggetto prima e dopo lintervento, lassociazione aiuta perché la differenza accoppiata indipendente ha una varianza inferiore a quella ottenuta per il caso non accoppiato. Il metodo ha ridotto la varianza. Il test è più potente. Questo può essere mostrato in modo drammatico con i dati ciclici. Ho visto un esempio in un libro in cui volevano vedere se la temperatura a Washington DC è più alta che a New York City. Quindi hanno preso la temperatura media mensile in entrambe le città per dire 2 anni. Ovviamente cè unenorme differenza nel corso dellanno a causa delle quattro stagioni. Questa variazione è troppo grande perché un test t non accoppiato rilevi una differenza. Tuttavia, labbinamento basato sullo stesso mese dello stesso anno elimina questo effetto stagionale e il $ t $ -test accoppiato ha mostrato chiaramente che la temperatura media in DC tendeva ad essere più alta che a New York. $ X_i $ (temperatura a NY nel mese $ A $) e $ Y_i $ (temperatura in DC nel mese $ A $) sono positivamente correlate perché le stagioni sono le stesse a New York e DC e le città sono abbastanza vicine che lo saranno spesso sperimentare gli stessi sistemi meteorologici che influenzano la temperatura. DC potrebbe essere un po più caldo perché è più a sud.
Nota che maggiore è la covarianza o correlazione, maggiore è la riduzione della varianza.
Ora supponiamo che $ \ text {Cov} (X, Y) $ sia negativo.
Quindi $ \ text {Var} (Z) \ gt \ text {Var} (X) + \ text {Var} (Y) $. Ora laccoppiamento sarà peggio del non accoppiamento perché la varianza è effettivamente aumentata!
Quando $ X $ e $ Y $ non sono correlati, probabilmente non importa quale metodo usi . Il caso di accoppiamento casuale di Peter è simile a questa situazione.
Commenti
- Michael, perché ” < ” e ” > ” hanno significati speciali nelle pagine Web, per evitare che grandi parti del testo scompaiano dalla tua vista è essenziale che tu utilizza il markup $ \ TeX $ per loro nelle equazioni (i codici sono ” \ lt ” e ” \ gt ” rispettivamente). Ho segnato le due equazioni che ti hanno causato questo problema.In futuro, leggi ciò che pubblichi subito dopo averlo pubblicato per assicurarti che le persone vedano ciò che pensavi avrebbero visto, quindi sentiti libero di segnalare il tuo post allattenzione del moderatore se cè qualche problema con il markup.
- @whuber Grazie. Generalmente controllo durante e dopo la pubblicazione perché trovo che confondo molto le equazioni, specialmente quando si scrive in indice. Manca questo è insolito e probabilmente è successo perché era un post lungo e sono passato con noncuranza a qualcosaltro che volevo o dovevo fare. A volte una telefonata mi distrae e mi dimentico di controllare. Per quanto riguarda i simboli speciali che fanno scomparire il testo in un post, lho osservato. Penso che una soluzione semplice sia assicurarti di lasciare uno spazio dopo il simbolo. Penso che abbia funzionato per me in passato.
- +1, davvero perfetto. Nota che se $ X $ & $ Y $ sono perfettamente non correlati nel tuo campione , $ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y) $.
- @MichaelChernick Nel caso in cui Cov (X, Y) < 0, ho un domanda: se il mio obiettivo è dedurre E [X] -E [Y] dal mio esperimento, allora anche se ho condotto uno studio accoppiato, quando analizzo i miei dati, posso ancora Fingere che il risultato del mio esperimento sia una realizzazione di UNPAIRED randomizzato sperimentare. Posso farlo? Perché se hai davvero fatto un esperimento casuale non accoppiato, puoi letteralmente ottenere lo stesso risultato. Quindi posso semplicemente prendere la media di ciascun gruppo (ignorare le cose di accoppiamento) e prendere la differenza della media dei due gruppi. Questo è uno stimatore imparziale di E [Z]. Per la varianza del mio stimatore, uso solo …
- @MichaelChernick la varianza campione del gruppo X e del gruppo Y e riassumo
Risposta
Piuttosto che accoppiare è probabilmente meglio comprendere il modello di dati sottostante. Se laccoppiamento viene eseguito per affrontare uneterogeneità incontrollata, di solito è il caso (tranne negli studi sui gemelli) che laccoppiamento controlla solo parzialmente questa fonte di variabilità e la regressione multipla farebbe meglio. Questo perché la corrispondenza su variabili continue spesso si traduce in una variabilità residua a causa dellimpossibilità di eseguire una corrispondenza esatta su tali variabili.
Commenti
- Se noi Tutti dovrebbero fare la regressione, perché i libri sul design sperimentale, come il libro di David Cox ‘, sottolineano limportanza dellaccoppiamento o del raggruppamento negli esperimenti biologici? Laccoppiamento evita lipotesi nascosta di dipendenza lineare implicata nella regressione. Ma forse ci sono altri motivi: chiunque ??
Risposta
I due test (accoppiati e non accoppiati) chiedono domande diverse in modo che possano ottenere risposte diverse. Laccoppiamento corretto è quasi sempre più potente dellaccoppiamento non accoppiato: questo è davvero il punto dellaccoppiamento. Quindi, poiché dici che laccoppiamento è corretto, è probabile che il valore p per il tuo test accoppiato sia inferiore a quello per gli stessi dati non accoppiati. Potresti, ovviamente, fare entrambe le cose e vedere di persona.
Pertanto, la risposta al tuo dilemma è sostanziale, non statistica. Il tuo abbinamento è giusto?
Potresti ottenere un risultato significativo dallaccoppiamento casuale rispetto a un test non accoppiato? Vediamo:
set.seed(2910110192) x <- rnorm(100, 10, 2) y <- rnorm(100, 10, 2) t.test(x, y) t.test(x, y, paired = T)
Sì, puoi, anche se qui la differenza è molto piccola, laccoppiamento aveva una p inferiore. Ho eseguito quel codice più volte. Non sorprende che a volte una p sia più bassa, a volte laltra, ma la differenza era piccola in tutti i casi. Tuttavia, sono sicuro che in alcune situazioni la differenza nei valori p potrebbe essere grande.
Commenti
- Grazie per la risposta, ma la mia domanda è stata posta per differenze sistematiche . Ovviamente, in un lungo periodo di x ‘ s e y ‘ s, x e y a volte sembrano molto ben accoppiati , e occasionalmente come se fossero stati deliberatamente accoppiati male. Sicuramente ‘ è una questione statistica se, scegliendo xey in modo casuale, la distribuzione dei valori p è la stessa nei due test. Suppongo che ‘ non dovrebbe essere troppo difficile per qualcuno che conosce più statistiche teoriche di me calcolare effettivamente le due distribuzioni teoriche dei valori p. La mia ipotesi è che siano gli stessi.
- Nel caso in cui fossi coinvolto, il valore p per unpaired era di circa .04 e per paired .001. Secondo il biologo critico, dovremmo citare .04. Secondo me, il miglioramento del valore p indica fortemente che il nostro abbinamento era valido. Affermo che qui cè una domanda oggettiva nelle statistiche, con una risposta oggettiva, e che ‘ non è solo una questione di buon giudizio biologico riguardo alla validità del particolare accoppiamento– -la seconda sembra essere lopinione di Peter Flom e del biologo critico.
- Penso che le statistiche raccontino la storia.Entrambi i risultati devono essere divulgati, ma fintanto che i dati sono corretti e la correlazione può essere spiegata, il test accoppiato è più accurato perché tiene conto della correlazione.
Risposta
Ora capisco molto meglio cosa mi preoccupava dei test t accoppiati rispetto a quelli non accoppiati e dei valori p associati. Scoprirlo è stato un viaggio interessante e ci sono state molte sorprese lungo la strada. Una sorpresa è derivata da unindagine sul contributo di Michael. Questo è irreprensibile in termini di consigli pratici. Inoltre, dice quello che penso che praticamente tutti gli statistici credano, e ha diversi voti positivi a sostegno di questo. Tuttavia, come parte di teoria, non è letteralmente corretto. Lho scoperto elaborando le formule per i valori p, e poi pensando attentamente a come utilizzare le formule per portare a controesempi. Sono un matematico di formazione e il controesempio è un controesempio di “matematico”. “Non è qualcosa che potresti incontrare nelle statistiche pratiche, ma era il tipo di cosa che stavo cercando di scoprire quando ho chiesto al mio originale domanda.
Ecco il codice R che fornisce il controesempio:
vLength <- 10; meanDiff <-10^9; numSamples <- 3; pv <- function(vLength,meanDiff) { X <- rnorm(vLength) Y <- X - meanDiff + rnorm(vLength,sd=0.0001) Paired <- t.test(X,Y,var.equal=T,paired=T) NotPaired <- t.test(X,Y,var.equal=T,paired=F) c(Paired$p.value,NotPaired$p.value,cov(X,Y)) } ans <- replicate(numSamples,pv(vLength,meanDiff))
Nota le seguenti caratteristiche: X e Y sono due tuple di 10 la cui differenza è enorme e quasi costante. Per molte cifre significative, la correlazione è 1.000 …. Il valore p per il test non appaiato è circa 10 ^ 40 volte inferiore al valore p per il test appaiato. Quindi questo contraddice il racconto di Michael, a condizione che si legga il suo racconto letteralmente, in stile matematico. Qui finisce la parte della mia risposta relativa alla risposta di Michael.
Ecco i pensieri suggeriti da La risposta di Peter. Durante la discussione della mia domanda originale, ho congetturato in un commento che due particolari distribuzioni di valori p che suonano diversi sono in realtà le stesse. Ora posso provarlo. Ciò che è più importante è che la dimostrazione riveli la natura fondamentale di un valore p, così fondamentale che nessun testo (che ho incontrato) si preoccupa di spiegare. Forse tutti gli statistici professionisti conoscono il segreto, ma a me la definizione di valore p mi è sempre sembrata strana e artificiale. Prima di rivelare il segreto dello statistico, permettimi di specificare la domanda.
Sia $ n > 1 $ e scegliamo casualmente e indipendentemente due $ n $ – casuali tuple da una distribuzione normale. Ci sono due modi per ottenere un valore p da questa scelta. Uno è usare un test t non accoppiato e laltro è usare un test t accoppiato. La mia congettura era che la distribuzione di p -valori che si ottengono sono gli stessi nei due casi. Quando ho iniziato a pensarci, ho deciso che questa congettura era stata avventata ed era falsa: il test spaiato è associato a una statistica t su $ 2 (n-1 ) $ gradi di libertà e il test accoppiato a una statistica t su $ n-1 $ gradi di libertà. Queste due distribuzioni sono diverse, quindi come diavolo potrebbero le distribuzioni associate dei valori p essere le stesse? Solo dopo molto Pensando ulteriormente mi sono reso conto che questo ovvio abbandono della mia congettura era troppo facile.
La risposta viene dalle seguenti considerazioni. Supponiamo $ f: (0, \ infty) \ to (0, \ infty) $ è un pdf continuo (ovvero il suo integrale ha valore uno). Un cambio di coordinate converte la distribuzione associata nella distribuzione uniforme su $ [0,1] $. La formula è $$ p = \ int_t ^ \ infty f (s) \, ds $$ e questo è spiegato in molti testi. Ciò che i testi non riescono a sottolineare nel contesto dei valori p è che questa è esattamente la formula che fornisce il valore p dalla statistica t, quando $ f $ è il pdf per la t -distribuzione. (Sto cercando di mantenere la discussione il più semplice possibile, perché è davvero semplice. Una discussione più completa tratterebbe i test t unilaterali e bilaterali in modo leggermente diverso, potrebbero sorgere fattori di 2 e la statistica t potrebbe trovarsi in $ (- \ infty, \ infty) $ invece che in $ [0, \ infty) $. Ometto tutto quel disordine.)
Si applica esattamente la stessa discussione quando si trova il valore p associato a una qualsiasi delle altre distribuzioni standard nelle statistiche. Ancora una volta, se i dati sono distribuiti casualmente (questa volta secondo una distribuzione diversa), i valori p risultanti saranno distribuiti uniformemente in $ [0,1] $.
Come si applica ai nostri test t accoppiati e non accoppiati? Il punto è nel test t accoppiato, con campioni scelti in modo indipendente e casuale, come nel mio codice sopra, il valore di t segue effettivamente un distribuzione t (con $ n-1 $ gradi di libertà). Quindi i valori p che risultano dalla replica della scelta di X e Y molte volte seguono la distribuzione uniforme su $ [0,1] $. Lo stesso è tr ue per il test t spaiato, sebbene questa volta la distribuzione t abbia $ 2 (n-1) $ gradi di libertà. Tuttavia, i valori p che risultano hanno anche una distribuzione uniforme su $ [0,1] $, secondo largomento generale che ho fornito sopra.Se il codice di Peter sopra viene applicato per determinare i valori p, si ottengono due metodi distinti per estrarre un campione casuale dalla distribuzione uniforme su $ [0,1] $. Tuttavia le due risposte non sono indipendenti.
Commenti
- Non ‘ credo che il valore p abbia segreti misteriosi. Alcune persone hanno un momento difficile con esso. È la probabilità di osservare un valore come esterno o più estremo di quello che è stato effettivamente osservato quando lipotesi nulla è VERA. Penso che tu abbia avuto questo diritto in una delle tue formule. Penso che tu abbia affermato che p- i valori sono distribuiti uniformemente. Sì, sono daccordo con questo quando lipotesi nulla è vera. Tieni presente che con il tuo test t lipotesi nulla potrebbe non essere vera. Quindi il valore p non è uniforme. Dovrebbe essere concentrato più vicino a 0.
- In secondo luogo, stiamo parlando di due diverse statistiche di test. Una è basata sullaccoppiamento e laltra non nel tuo esempio. Che io labbia menzionato o meno nella mia risposta il test t spaiato ha una distribuzione t centrale con 2n-2 gradi di libertà mentre la distribuzione t corrispondente per il test t appaiato ha n-1 gradi di libertà. Quindi quello con il maggior numero di gradi di libertà è più vicino alla distribuzione normale standard rispetto agli altri. È importante quando applichi questi test a dati reali? No! Non quando n è ragionevolmente grande.
- Come nota a margine, una limitazione del test accoppiato richiede la stessa dimensione del campione che dovresti avere se tutti i dati possono essere accoppiati. Ma il test non accoppiato è valido con dimensioni del campione non uguali. Quindi, in generale, il test non accoppiato ha n + m-2 gradi di libertà.
- La tua risposta è lunga e astratta e ho provato a guadare attraverso di essa ma non ho ‘ Capire il controesempio. È solo che ‘ non vedo dove prendi in considerazione lipotesi nulla e i dati reali. Il valore p osservato è lintegrale della distribuzione t appropriata per la statistica del test dati i dati. Confronti questi numeri per le due distribuzioni t e lo stesso insieme di dati comune. Se condizionate i dati osservati, queste distribuzioni uniformi non giocano alcun ruolo. Mi dispiace ma non ‘ per vedere che la tua risposta risponde davvero alla tua domanda.
- Michael: concentrati solo sul codice R che ho dato. Ci vuole solo un secondo per correre. Lipotesi nulla è che X e Y provengano dalla stessa distribuzione normale, che è, ovviamente, selvaggiamente falsa nel mio caso. Nel mio esempio Cov (X, Y) > 0 e tuttavia il test non accoppiato dà più significato del test accoppiato.
Risposta
Vorrei offrire unaltra prospettiva. Spesso, laccoppiamento è fatto per ridurre il bias. Supponi di essere interessato a sapere se lesposizione E è un fattore di rischio per un risultato continuo Y. Per ogni soggetto E +, ottieni un soggetto abbinato per età e sesso che è E-. Ora, potremmo eseguire un test t accoppiato o un test t non accoppiato. Penso che dovremmo spiegare esplicitamente la corrispondenza e condurre un test t accoppiato. È più basato sui principi in quanto tiene conto del design. Se prendere in considerazione labbinamento nellanalisi è una questione del compromesso bias-varianza. La contabilizzazione della corrispondenza nellanalisi fornisce una maggiore protezione contro i bias, ma può aumentare la varianza. Fare un test t non accoppiato può essere più efficiente, ma non fornirebbe alcuna protezione contro i pregiudizi.
Lascia un commento