Test t apparié ou non apparié
On janvier 31, 2021 by adminSupposons que jai 20 souris. Je jumelle les souris dune certaine manière, de sorte que jobtiens 10 paires. Aux fins de cette question, il pourrait sagir dun appariement aléatoire, OU il pourrait sagir dun appariement sensé, comme essayer dapparier des souris de la même portée, du même sexe, avec un poids similaire, OU ce pourrait être un appariement délibérément stupide comme essayer de jumeler des souris avec des poids aussi inégaux quils pourraient lêtre. Jutilise ensuite des nombres aléatoires pour attribuer une souris dans chaque paire au groupe témoin et lautre souris au groupe à traiter. Je fais maintenant lexpérience, en ne traitant que les souris à traiter, mais sinon en ne prêtant aucune attention aux arrangements qui viennent dêtre faits.
Quand on vient danalyser les résultats, on peut soit utiliser des t- test ou test t apparié. De quelle manière, le cas échéant, les réponses différeront-elles? (Je suis essentiellement intéressé par les différences systématiques de tout paramètre statistique qui doit être estimé.)
La raison pour laquelle je pose cette question est quun article avec lequel jai récemment été impliqué a été critiqué par un biologiste pour avoir utilisé une paire test t plutôt quun test t non apparié. Bien sûr, dans lexpérience réelle, la situation nétait pas aussi extrême que la situation que jai esquissée, et il y avait, à mon avis, de bonnes raisons de lappariement. Mais le biologiste nétait pas daccord.
Il me semble quil nest pas possible daméliorer de manière incorrecte la signification statistique (diminuer la valeur p), dans les circonstances que jai esquissées, en utilisant un test t apparié , plutôt quun test non apparié, même sil est inapproprié de lappairer. Cela pourrait cependant aggraver la signification statistique si les souris étaient mal appariées. Est-ce vrai?
Réponse
Je suis daccord avec les arguments de Frank et Peter, mais je pense quil existe une formule simple cela va au cœur du problème et peut valoir la peine dêtre pris en compte par lOP.
Soit $ X $ et $ Y $ deux variables aléatoires dont la corrélation est inconnue.
Soit $ Z = XY $
Quelle est la variance de $ Z $?
Voici la formule simple: $$ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y) – 2 \ text {Cov } (X, Y). $$ Et si $ \ text {Cov} (X, Y) > 0 $ (cest-à-dire $ X $ et $ Y $ sont positivement corrélés)?
Puis $ \ text {Var} (Z) \ lt \ text {Var} (X) + \ text {Var } (Y) $. Dans ce cas, si lappariement est fait en raison dune corrélation positive, comme lorsque vous traitez avec le même sujet avant et après lintervention, lappariement est utile car la différence appariée indépendante a une variance inférieure à la variance que vous obtenez pour le cas non apparié. La méthode a réduit la variance. Le test est plus puissant. Cela peut être montré de façon spectaculaire avec des données cycliques. Jai vu un exemple dans un livre où ils voulaient voir si la température à Washington DC est plus élevée quà New York. Ils ont donc pris la température mensuelle moyenne dans les deux villes pendant par exemple 2 ans. Bien sûr, il y a une énorme différence au cours de lannée en raison des quatre saisons. Cette variation est trop importante pour quun test t non apparié détecte une différence. Cependant, lappariement basé sur le même mois de la même année élimine cet effet saisonnier et le test par paire $ t $ a clairement montré que la température moyenne à Washington était généralement plus élevée quà New York. $ X_i $ (température à NY au mois $ A $) et $ Y_i $ (température à DC au mois $ A $) sont positivement corrélés car les saisons sont les mêmes à New York et DC et les villes sont suffisamment proches pour quelles éprouver les mêmes systèmes météorologiques qui affectent la température. DC peut être un peu plus chaud parce quil est plus au sud.
Notez que plus la covariance ou la corrélation est grande, plus la réduction de la variance est grande.
Supposons maintenant que $ \ text {Cov} (X, Y) $ est négatif.
Puis $ \ text {Var} (Z) \ gt \ text {Var} (X) + \ text {Var} (Y) $. Maintenant, lappariement sera pire que de ne pas lappairer car la variance est en fait augmentée!
Lorsque $ X $ et $ Y $ ne sont pas corrélés, la méthode que vous utilisez na probablement pas dimportance . Le cas dappariement aléatoire de Peter est comme cette situation.
Commentaires
- Michael, parce que » < » et » > » ont des significations spéciales sur les pages Web, pour éviter que de grandes parties de votre texte disparaissent simplement de votre vue, il est essentiel que vous utilisez le balisage $ \ TeX $ pour eux dans les équations (les codes sont » \ lt » et » \ gt » respectivement). Jai marqué les deux équations qui ont causé ce problème pour vous.À lavenir, veuillez lire ce que vous publiez immédiatement après lavoir publié pour vous assurer que les gens voient ce que vous pensiez voir, puis nhésitez pas à signaler votre message à lattention du modérateur en cas de problème avec le balisage.
- @whuber Merci. Je vérifie généralement pendant et après la publication car je trouve que je gâche beaucoup les équations, surtout lors de la souscription. Manquer celui-ci est inhabituel et sest probablement produit parce que cétait un long message et que je suis passé négligemment à quelque chose dautre que je voulais ou devais faire. Parfois, un coup de téléphone me distrait et joublie de vérifier. En ce qui concerne les symboles spéciaux qui font disparaître du texte dans un message, je lai observé. Je pense quune solution simple est de vous assurer de laisser un espace après le symbole. Je pense que cela a fonctionné pour moi dans le passé.
- +1, vraiment sur le point. Notez que si $ X $ & $ Y $ sont parfaitement décorrélés dans votre échantillon , $ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y) $.
- @MichaelChernick Pour le cas où Cov (X, Y) < 0, jai un question: Si mon objectif est de déduire E [X] -E [Y] de mon expérience, alors même si jai mené une étude par paires, lorsque janalyse mes données, je peux encore PRÉTENDRE que le résultat de mon expérience est une réalisation de UNPAIRED randomisé expérience. Puis-je faire ceci? Parce que si vous avez vraiment fait une expérience aléatoire non appariée, vous pouvez littéralement obtenir le même résultat. Ensuite, je peux simplement prendre la moyenne de chaque groupe (ignorer les trucs dappariement) et prendre la différence de la moyenne des deux groupes. Cest un estimateur sans biais de E [Z]. Pour la variance de mon estimateur, jutilise juste …
- @MichaelChernick la variance de léchantillon du groupe X et du groupe Y et les résume
Réponse
Plutôt que de jumeler, il est probablement préférable de comprendre le modèle de données sous-jacent. Si lappariement est fait pour faire face à une hétérogénéité incontrôlée, il est généralement (sauf dans les études de jumeaux) que lappariement ne contrôle que partiellement cette source de variabilité et la régression multiple ferait mieux. En effet, lappariement sur des variables continues entraîne fréquemment une variabilité résiduelle car il nest pas possible de faire lappariement exact sur de telles variables.
Commentaires
- Si nous devraient tous faire de la régression, pourquoi les livres sur la conception expérimentale, comme celui de David Cox ‘, insistent-ils sur limportance de lappariement ou du regroupement dans les expériences biologiques? Lappariement évite lhypothèse cachée de dépendance linéaire quimplique la régression. Mais peut-être il y a dautres raisons: nimporte qui ??
Réponse
Les deux tests (appariés et non appariés) demandent questions différentes pour qu’ils puissent obtenir des réponses différentes. Un appariement correct est presque toujours plus puissant que non apparié – cest vraiment le point de lappairage. Ainsi, puisque vous dites que lappairage est correct, il est probable que la valeur p de votre test apparié soit inférieure à celle des mêmes données non appariées. Vous pourriez, bien sûr, faire les deux et voir par vous-même.
Par conséquent, la réponse à votre dilemme est substantielle, pas statistique. Votre association est-elle correcte?
Pourriez-vous en savoir plus résultat significatif dun appariement aléatoire que dun test non apparié? Voyons:
set.seed(2910110192) x <- rnorm(100, 10, 2) y <- rnorm(100, 10, 2) t.test(x, y) t.test(x, y, paired = T)
Oui, vous pouvez, bien quici la différence soit très petite, lappariement avait un p inférieur. Jai exécuté ce code plusieurs fois. Sans surprise, parfois un p est plus bas, parfois lautre, mais la différence était faible dans tous les cas. Cependant, je suis sûr que dans certaines situations, la différence entre les valeurs de p pourrait être importante.
Commentaires
- Merci pour la réponse, mais ma question est posée pour les différences systématiques . De toute évidence, dans une longue série de x ‘ s et y ‘ s, x et y semblent parfois très bien appariés , et parfois comme sils avaient été délibérément mal appariés. Il est certain que ‘ est une question statistique de savoir si, en choisissant x et y au hasard, la distribution des valeurs p est la même sur les deux tests. Je suppose quil ne devrait pas ‘ être trop difficile pour quelquun qui connaît plus de statistiques théoriques que moi de calculer en fait les deux distributions théoriques des valeurs p. Je suppose que ce sont les mêmes.
- Dans le cas réel dans lequel jai été impliqué, la valeur p pour non apparié était denviron 0,04 et pour appariée 0,001. Selon le biologiste critique, nous devrions citer 0,04. Selon moi, lamélioration de la valeur p indique fortement que notre appariement était valide. Je prétends quil y a ici une question objective dans les statistiques, avec une réponse objective, et que ‘ nest pas simplement une question de bon jugement biologique quant à la validité de lappariement particulier – -ce dernier semble être lopinion de Peter Flom et du biologiste critique.
- Je pense que les statistiques racontent lhistoire.Les deux résultats doivent être divulgués, mais tant que les données sont correctes et que la corrélation peut être expliquée, le test apparié est plus précis car il prend en compte la corrélation.
Réponse
Je comprends maintenant beaucoup mieux ce qui minquiétait à propos des tests t appariés ou non appariés et des valeurs p associées. Le découvrir a été un voyage intéressant et il y a eu de nombreuses surprises en cours de route. Une surprise a résulté dune enquête sur la contribution de Michael. Cest irréprochable en termes de conseils pratiques. De plus, il dit ce que je pense que pratiquement tous les statisticiens croient, et il a plusieurs votes favorables pour étayer cela. Cependant, comme un morceau de théorie, ce n’est pas littéralement correct. Je l’ai découvert en élaborant les formules des valeurs p, puis en réfléchissant attentivement à la manière d’utiliser les formules pour conduire à des contre-exemples. Je suis mathématicien de formation, et le contre-exemple est un contre-exemple de «mathématicien». Ce nest pas quelque chose que vous rencontreriez dans les statistiques pratiques, mais cest cest le genre de chose que jessayais de découvrir quand jai demandé mon original question.
Voici le code R qui donne le contre-exemple:
vLength <- 10; meanDiff <-10^9; numSamples <- 3; pv <- function(vLength,meanDiff) { X <- rnorm(vLength) Y <- X - meanDiff + rnorm(vLength,sd=0.0001) Paired <- t.test(X,Y,var.equal=T,paired=T) NotPaired <- t.test(X,Y,var.equal=T,paired=F) c(Paired$p.value,NotPaired$p.value,cov(X,Y)) } ans <- replicate(numSamples,pv(vLength,meanDiff))
Notez les caractéristiques suivantes: X et Y sont deux 10 tuples dont la différence est énorme et presque constante. Pour de nombreux chiffres significatifs, la corrélation est de 1.000 … La valeur p pour le test non apparié est environ 10 ^ 40 fois plus petite que la valeur p pour le test apparié. Donc, cela contredit le récit de Michael, à condition que lon lise son récit littéralement, à la manière des mathématiciens. Ici se termine la partie de ma réponse liée à la réponse de Michael.
Voici les réflexions suscitées par Réponse de Peter. Au cours de la discussion de ma question initiale, jai conjecturé dans un commentaire que deux distributions particulières de valeurs p qui semblent différentes sont en fait les mêmes. Je peux maintenant le prouver. Ce qui est plus important, cest que la preuve révèle la nature fondamentale dune valeur p, si fondamentale quaucun texte (que jai rencontré) ne se soucie dexpliquer. Peut-être que tous les statisticiens professionnels connaissent le secret, mais pour moi, la définition de la valeur p ma toujours paru étrange et artificielle. Avant de révéler le secret du statisticien, permettez-moi de préciser la question.
Soit $ n > 1 $ et choisissez au hasard et indépendamment deux $ n $ – tuples dune distribution normale. Il y a deux façons dobtenir une valeur p à partir de ce choix. Lune consiste à utiliser un test t non apparié, et lautre à utiliser un test t apparié. Ma conjecture était que la distribution de p -valeurs que lon obtient est la même dans les deux cas. Quand jai commencé à y réfléchir, jai décidé que cette conjecture avait été imprudente et était fausse: le test non apparié est associé à une statistique t sur $ 2 (n-1 ) $ degrés de liberté, et le test apparié à une statistique t sur $ n-1 $ degrés de liberté. Ces deux distributions sont différentes, alors comment diable les distributions associées des valeurs p pourraient-elles être les mêmes? après réflexion, je me suis rendu compte que ce rejet évident de ma conjecture était trop facile.
La réponse vient des considérations suivantes. Supposons $ f: (0, \ infty) \ to (0, \ infty) $ est un pdf continu (cest-à-dire que son intégrale a la valeur un). Un changement de coordonnées convertit la distribution associée en distribution uniforme sur $ [0,1] $. La formule est $$ p = \ int_t ^ \ infty f (s) \, ds $$ et cela est expliqué dans de nombreux textes. Ce que les textes ne parviennent pas à souligner dans le contexte des p-values, cest quil sagit exactement de la formule qui donne la p-value de la statistique t, lorsque $ f $ est le pdf du t -Distribution. (Jessaie de garder la discussion aussi simple que possible, car cest vraiment simple. Une discussion plus complète traiterait les tests t unilatéraux et bilatéraux légèrement différemment, des facteurs de 2 pourraient survenir et la statistique t pourrait se trouver dans $ (- \ infty, \ infty) $ au lieu de dans $ [0, \ infty) $. Jomets tout ce fouillis.)
Exactement la même discussion sapplique lors de la recherche de la valeur p associé à lune des autres distributions standard dans les statistiques. Encore une fois, si les données sont distribuées aléatoirement (cette fois selon une distribution différente), alors les valeurs p résultantes seront distribuées uniformément dans $ [0,1] $.
Comment cela sapplique-t-il à nos tests t appariés et non appariés? Le point est dans le test t apparié, avec des échantillons choisis indépendamment et au hasard, comme dans mon code ci-dessus, la valeur de t suit en effet un distribution t (avec $ n-1 $ degrés de liberté). Ainsi, les valeurs p qui résultent de la réplication du choix de X et Y plusieurs fois suivent la distribution uniforme sur $ [0,1] $. Il en va de même pour tr ue pour le test t non apparié, bien que cette fois la distribution t ait $ 2 (n-1) $ degrés de liberté. Néanmoins, les valeurs p qui en résultent ont également une distribution uniforme sur $ [0,1] $, par largument général que jai donné ci-dessus.Si le code de Peter ci-dessus est appliqué pour déterminer les valeurs p, alors nous obtenons deux méthodes distinctes pour tirer un échantillon aléatoire de la distribution uniforme sur $ [0,1] $. Cependant, les deux réponses ne sont pas indépendantes.
Commentaires
- Je ne ‘ Je pense que la valeur p a des secets mystérieux. Certaines personnes ont un Cest la probabilité dobserver une valeur comme extereme ou plus extrême que ce qui a été réellement observé lorsque lhypothèse nulle est VRAI. Je pense que vous aviez ce droit dans lune de vos formules. Je pense que vous avez dit que p- les valeurs sont uniformément distribuées. Oui, je suis daccord avec cela lorsque lhypothèse nulle est vraie. Gardez à lesprit quavec votre test t, lhypothèse nulle peut ne pas être vraie. Alors la valeur p nest pas uniforme. Elle doit être concentrée plus près de 0.
- Deuxièmement, nous parlons de deux statistiques de test différentes. Lune est basée sur lappariement et lautre non dans votre exemple. Que je lai mentionné ou non dans ma réponse le test t non apparié a une distribution t centrale avec 2n-2 degrés de liberté tandis que la distribution t correspondante pour le test t apparié a n-1 degrés de liberté. Ainsi, celui avec le plus grand nombre de degrés de liberté est plus proche de la distribution normale standard que lautre. Est-ce important lorsque vous appliquez ces tests à des données réelles? Non! Pas quand n est raisonnablement grand.
- En guise de remarque supplémentaire, une limitation du test apparié nécessite une taille déchantillon égale que vous devriez avoir si toutes les données peuvent être appariées. Mais le test non apparié est valide avec des tailles déchantillon inégales. Donc, en général, le test non apparié a n + m-2 degrés de liberté.
- Votre réponse est longue et abstraite et jai essayé de la parcourir mais je nai pas ‘ Je ne comprends pas le contre-exemple. Je ne vois ‘ pas où vous prenez en compte lhypothèse nulle et les données réelles. La valeur p observée est lintégrale de la distribution t appropriée pour la statistique de test étant donné les données. Vous comparez ces nombres pour les deux distributions t et le même ensemble de données commun. Si vous conditionnez sur les données observées, ces distributions uniformes ne jouent aucun rôle. Je suis désolé mais je ne ‘ pas voir que votre réponse répond vraiment à votre question.
- Michael: concentrez-vous simplement sur le code R que jai donné. Cela ne prend quune seconde à courir. Lhypothèse nulle est que X et Y proviennent de la même distribution normale, ce qui est, bien sûr, complètement faux dans mon cas. Dans mon exemple Cov (X, Y) > 0 et néanmoins le test non apparié donne plus de signification que le test apparié.
Réponse
Je proposerais une autre perspective. Souvent, lappariement est effectué pour réduire les biais. Supposons que vous souhaitiez savoir si lexposition E est un facteur de risque pour un résultat continu Y. Pour chaque sujet E +, vous obtenez un sujet correspondant à lâge et au sexe qui est E-. Maintenant, nous pourrions faire soit un test t apparié, soit un test t non apparié. Je pense que nous devrions expliquer explicitement lappariement et effectuer un test t apparié. Il est plus fondé sur des principes en ce quil prend en compte la conception. La prise en compte de lappariement dans lanalyse est une question de compromis biais-variance. La prise en compte de lappariement dans lanalyse offre une meilleure protection contre les biais, mais peut augmenter la variance. Faire un test t non apparié peut être plus efficace, mais cela ne fournirait aucune protection contre les biais.
Laisser un commentaire