짝짓기 대 비 짝짓기 t- 테스트
On 1월 31, 2021 by admin마우스가 20 개 있다고 가정합니다. 나는 어떤 식 으로든 마우스를 페어링하여 10 쌍을 얻습니다. 이 질문의 목적을 위해 무작위 페어링이 될 수도 있고, 같은 쓰레기, 같은 성별, 비슷한 무게의 마우스를 페어링하려는 것과 같은 합리적인 페어링 일 수도 있고, 또는 다음과 같은 의도적으로 어리석은 페어링 일 수도 있습니다. 가능한 한 같지 않은 무게를 가진 쥐를 짝짓기하려고합니다. 그런 다음 난수를 사용하여 각 쌍의 마우스 하나를 제어 그룹에 할당하고 다른 마우스를 치료할 그룹에 할당합니다. 나는 지금 실험을하는데, 치료할 쥐만 치료하고, 그렇지 않으면 방금 만든 배열에는 전혀 신경을 쓰지 않습니다.
결과를 분석 할 때 unpaired t-를 사용할 수 있습니다. 테스트 또는 쌍을 이룬 t- 테스트. 어떤 방식으로 대답이 다를까요? (저는 기본적으로 추정해야하는 통계적 매개 변수의 체계적인 차이에 관심이 있습니다.)
제가 최근에 참여한 논문이 쌍을 사용하는 것에 대해 생물 학자로부터 비판을 받았기 때문입니다. 짝을 이루지 않은 t- 테스트가 아니라 t- 테스트 물론, 실제 실험에서 상황은 내가 스케치 한 상황만큼 극단적이지 않았고, 짝을 이룰 좋은 이유가 있다고 생각합니다. 하지만 생물학자는 동의하지 않았습니다.
제가 스케치 한 상황에서 쌍을 이룬 t- 검정을 사용하여 통계적 유의성을 잘못 개선 (p- 값 감소)하는 것은 불가능한 것 같습니다. , 페어링이 부적절하더라도 페어링되지 않은 테스트가 아닙니다. 그러나 마우스가 잘못 짝을 이루면 통계적 유의성을 악화시킬 수 있습니다. 이게 맞나요?
답변
프랭크와 피터의 주장에 동의하지만 간단한 공식이 있다고 생각합니다. 이 문제의 핵심이되고 OP가 고려할 가치가있을 수 있습니다.
$ X $와 $ Y $는 상관 관계를 알 수없는 두 개의 무작위 변수입니다.
Let $ Z = XY $
$ Z $의 차이는 무엇입니까?
다음은 간단한 공식 : $$ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y)-2 \ text {Cov } (X, Y). $$ $ \ text {Cov} (X, Y) > 0 $ (즉, $ X $ 및 $ Y $는 양의 상관 관계가 있음)?
그런 다음 $ \ text {Var} (Z) \ lt \ text {Var} (X) + \ text {Var } (Y) $. 이 경우, 짝짓기 이전과 이후에 동일한 주제를 다룰 때와 같이 양의 상관 관계로 인해 페어링이 이루어지면 독립적 인 짝짓기 차이가 짝을 이루지 않은 사례에 대해 얻은 분산보다 분산이 낮기 때문에 도움이됩니다. 이 방법은 분산을 줄였습니다. 테스트가 더 강력합니다. 이것은 순환 데이터로 극적으로 나타날 수 있습니다. 저는 워싱턴 DC의 온도가 뉴욕보다 높은지 확인하고자하는 책에서 한 예를 보았습니다. 그래서 그들은 2 년 동안 두 도시의 월평균 기온을 측정했습니다. 물론 사계절 때문에 일년 내내 큰 차이가 있습니다. 이 변동은 비 대응 t 검정이 차이를 탐지하기에는 너무 큽니다. 그러나 같은 해의 같은 달을 기준으로 한 페어링은 이러한 계절적 효과를 제거하고 페어링 된 $ t $ -test는 DC의 평균 기온이 뉴욕보다 높은 경향이 있음을 분명히 보여주었습니다. $ X_i $ ($ A $ 월의 뉴욕 기온) 및 $ Y_i $ ($ A $ 월의 DC 기온)은 계절이 NY와 DC에서 동일하고 도시가 충분히 가깝기 때문에 양의 상관 관계가 있습니다. 온도에 영향을 미치는 동일한 기상 시스템을 경험하십시오. DC는 더 남쪽에 있기 때문에 약간 더 따뜻할 수 있습니다.
공분산 또는 상관 관계가 클수록 분산이 감소합니다.
이제 $ \ text {Cov} (X, Y) $가 음수라고 가정합니다.
그런 다음 $ \ text {Var} (Z) \ gt \ text {Var} (X) + \ text {Var} (Y) $. 이제 분산이 실제로 증가하기 때문에 페어링이 페어링되지 않는 것보다 더 나빠질 것입니다!
$ X $와 $ Y $가 서로 관련이없는 경우 사용하는 방법은 중요하지 않습니다. . Peter의 무작위 페어링 사례는이 상황과 같습니다.
댓글
- Michael, 왜냐하면 ” < ” 및 ” > “는 웹 페이지에서 특별한 의미를 갖습니다. 텍스트의 큰 폭이보기에서 사라지는 것을 방지하려면 필수 방정식에서 $ \ TeX $ 마크 업을 사용합니다 (코드는 ” \ lt ” 및 ” \ gt “). 이 문제를 일으킨 두 가지 방정식을 표시했습니다.앞으로는 게시 후 즉시 게시 한 내용을 읽고 사람들이 볼 것이라고 생각한 내용을 볼 수 있는지 확인한 다음, 마크 업에 문제가있는 경우 언제든지 게시물에 플래그를 지정하여 운영자의주의를 기울이십시오.
- @whuber 감사합니다. 나는 특히 구독 할 때 방정식을 많이 엉망으로 만들기 때문에 일반적으로 게시 도중과 이후에 확인합니다. 이것을 놓치는 것은 드문 일이며 아마도 긴 게시물이었고 내가 원했거나해야 할 다른 일을 부주의하게 진행했기 때문에 발생했을 것입니다. 때로는 전화가 산만 해져 확인하는 것을 잊습니다. 게시물에서 텍스트가 사라지는 특수 기호와 관련하여 나는 그것을 관찰했습니다. 간단한 해결책은 기호 뒤에 공백을 두는 것입니다. 과거에는 그것이 저에게 효과적이라고 생각합니다.
- +1, 정말 정점입니다. $ X $ & $ Y $가 샘플 에서 완전히 상관 관계가없는 경우 $ \ text {Var} (Z) = \ text {Var} (X) + \ text {Var} (Y) $.
- @MichaelChernick Cov (X, Y) < 0 인 경우 질문 : 내 목표가 내 실험에서 E [X] -E [Y]를 추론하는 것이라면 쌍을 이룬 연구를 수행 했더라도 데이터를 분석 할 때 내 실험 결과가 미지급 무작위 배정을 실현 한 것처럼 가장 할 수 있습니다. 실험. 할 수 있나요? 짝을 이루지 않은 무작위 실험을 실제로 수행했다면 문자 그대로 동일한 결과를 얻을 수 있기 때문입니다. 그런 다음 각 그룹의 평균 (페어링 항목 무시)을 취하고 두 그룹 평균의 차이를 취할 수 있습니다. 이것은 E [Z]의 편향되지 않은 추정량입니다. 내 추정기의 분산을 위해 …
- @MichaelChernick 그룹 X와 그룹 Y의 표본 분산을 사용하여 요약합니다
Answer
쌍을 이루는 것보다 기본 데이터 모델을 이해하는 것이 좋습니다. 제어되지 않은 이질성을 처리하기 위해 페어링이 수행되는 경우 일반적으로 페어링이이 변동성 원인을 부분적으로 만 제어하고 다중 회귀가 더 잘 수행되는 경우 (쌍둥이 연구 제외)입니다. 이는 연속 변수에 대한 일치가 해당 변수에 대해 정확한 일치를 수행 할 수 없기 때문에 종종 잔차 가변성을 발생시키기 때문입니다.
댓글
- 모두 회귀를 수행해야합니다. David Cox ‘의 책과 같은 실험 설계에 관한 책이 생물학적 실험에서 짝짓기 또는 그룹화의 중요성을 강조하는 이유는 무엇입니까? 페어링은 회귀에 수반되는 선형 의존성의 숨겨진 가정을 피합니다. 하지만 다른 이유가있을 수 있습니다. 누구 ??
답변
두 테스트 (페어링 및 비 페어링)는 다른 질문에 답할 수 있습니다. 올바른 페어링은 거의 항상 페어링되지 않은 것보다 더 강력합니다. 이것이 실제로 페어링의 요점입니다. 따라서 페어링이 정확하다고 말 했으므로 페어링 된 테스트의 p- 값이 페어링되지 않은 동일한 데이터보다 낮을 가능성이 높습니다. 물론 두 가지를 모두 수행하여 직접 확인할 수 있습니다.
그러므로 딜레마에 대한 답은 통계적이 아니라 실질적입니다. 페어링이 맞습니까?
더 많은 것을 얻을 수 있습니까? 페어링되지 않은 테스트보다 무작위 페어링의 중요한 결과입니까? 다음을 보겠습니다.
set.seed(2910110192) x <- rnorm(100, 10, 2) y <- rnorm(100, 10, 2) t.test(x, y) t.test(x, y, paired = T)
예, 가능합니다. 여기서 차이는 매우 작지만 더 낮은 p. 이 코드를 여러 번 실행했습니다. 당연히 때로는 하나의 p가 더 낮고 때로는 다른 p가 더 낮지 만 모든 경우에 차이가 작았습니다. 그러나 상황에 따라 p 값의 차이가 클 수 있다고 확신합니다.
댓글
- 답변 해 주셔서 감사합니다. 체계적인 차이 때문입니다. 분명히 x ‘ s 및 y ‘의 장기 실행에서 x와 y는 때때로 매우 잘 짝을 이룬 것처럼 보입니다. , 그리고 때로는 의도적으로 잘못 짝을 이룬 것처럼 보입니다. 확실히 ‘ x와 y를 무작위로 선택할 때 p- 값의 분포가 두 테스트에서 동일한 지 여부는 통계적인 질문입니다. 저는 ‘ ‘ p- 값의 두 이론적 분포를 실제로 계산하는 것보다 더 많은 이론적 통계를 아는 사람에게 너무 어렵지 않아야한다고 생각합니다. 내 생각 엔 그것들이 같다고 생각합니다.
- 제가 참여한 실제 사례에서 짝을 이루지 않은 경우의 p- 값은 약 .04이고 짝을 이룬 .001의 경우였습니다. 비판 생물 학자에 따르면 우리는 .04를 인용해야합니다. 나에 따르면 p- 값의 개선은 우리의 페어링이 유효했음을 강력하게 나타냅니다. 저는 여기 통계에 객관적인 답변과 함께 객관적인 질문이 있다고 주장하며 ‘ 특정 쌍의 타당성에 대한 생물학적 판단의 문제가 아니라- -후자는 Peter Flom과 비판 생물학 자의 의견 인 것 같습니다.
- 통계가 이야기를 말해주는 것 같습니다.두 결과를 모두 공개해야하지만 데이터가 정확하고 상관 관계를 설명 할 수있는 한 쌍 테스트는 상관 관계를 고려하기 때문에 더 정확합니다.
Answer
이제 쌍을 이루는 t- 검정과 쌍을 이루지 않는 t- 검정 및 관련 p- 값에 대해 걱정하던 점을 훨씬 더 잘 이해했습니다. 알아내는 것은 흥미로운 여정이었고 그 과정에서 많은 놀라움이있었습니다. Michael의 기여를 조사한 결과 한 가지 놀라운 결과가 나왔습니다. 이것은 실질적인 조언 측면에서 비난 할 수없는 일입니다. 게다가 그는 거의 모든 통계학자가 믿는 바를 말하며이를 뒷받침 할 여러 찬성표를 가지고 있습니다. 그러나 한 조각으로서 이론은 말 그대로 정확하지 않습니다. 저는 p- 값에 대한 공식을 계산 한 다음 공식을 사용하여 반례로 이끄는 방법을 신중하게 생각함으로써 이것을 발견했습니다. 저는 훈련을 통해 수학자가되고 반례 “수학자”의 반례 “입니다. 실제 통계에서 볼 수있는 것은 아니지만 제 원본을 물었을 때 알아 내려고했던 것이 질문입니다.
반대 예를 제공하는 R 코드는 다음과 같습니다.
vLength <- 10; meanDiff <-10^9; numSamples <- 3; pv <- function(vLength,meanDiff) { X <- rnorm(vLength) Y <- X - meanDiff + rnorm(vLength,sd=0.0001) Paired <- t.test(X,Y,var.equal=T,paired=T) NotPaired <- t.test(X,Y,var.equal=T,paired=F) c(Paired$p.value,NotPaired$p.value,cov(X,Y)) } ans <- replicate(numSamples,pv(vLength,meanDiff))
다음 기능에 유의하세요. X 및 Y는 차이가 크고 거의 일정한 두 개의 10 튜플. 많은 유효 숫자에 대해 상관 관계는 1.000입니다 …. 짝을 이루지 않은 검정에 대한 p- 값은 짝을 이룬 검정에 대한 p- 값보다 약 10 ^ 40 배 더 작습니다. 따라서 이것은 문자 그대로 수학자 스타일로 자신의 계정을 읽는 경우 Michael의 설명과 모순됩니다. 여기에서 Michael의 답변과 관련된 내 답변의 일부를 끝냅니다.
여기에 의해 촉발 된 생각이 있습니다. Peter s answer. 내 원래 질문을 논의하는 동안, 나는 서로 다른 소리로 들리는 p- 값의 두 가지 특정 분포가 실제로 동일하다는 의견을 추측했습니다. 이제 이것을 증명할 수 있습니다. 더 중요한 것은 증명이 p- 값의 근본적인 특성, 너무 근본적이므로 설명 할 텍스트가 없습니다. 전문 통계 학자라면 누구나 그 비밀을 알고 있을지 모르지만, 나에게는 p- 값의 정의가 항상 이상하고 인위적으로 보였습니다. 통계학 자의 비밀을 알려 드리기 전에 질문을 지정하겠습니다.
$ n > 1 $로하고 무작위로 독립적으로 두 개의 무작위 $ n $-를 선택합니다. 이 선택에서 p- 값을 얻는 방법에는 두 가지가 있습니다. 하나는 짝을 이루지 않은 t- 검정을 사용하는 것이고 다른 하나는 짝을 이룬 t- 검정을 사용하는 것입니다. 내 추측은 p의 분포가 -값은 두 경우에서 동일합니다. 처음 생각하기 시작했을 때 저는이 추측이 어리 석고 거짓이라고 결정했습니다. 짝을 이루지 않은 검정은 $ 2 (n-1)의 t- 통계와 연관되어 있습니다. ) $ 자유도, 그리고 $ n-1 $ 자유도에 대한 t- 통계에 대한 쌍 검정.이 두 분포는 서로 다르므로 어떻게 관련 p- 값 분포가 동일 할 수 있습니까? 내 추측에 대한이 명백한 일축이 너무 쉽다는 것을 깨달았다 고 생각했습니다.
답은 다음과 같은 고려 사항에서 나옵니다. $ f : (0, \ infty) \ to (0, \ infty) $는 연속 pdf입니다 (즉, 적분 값이 1 임). 좌표를 변경하면 관련 분포가 $ [0,1] $의 균일 분포로 변환됩니다. 공식은 $$ p = \ int_t ^ \ infty f (s) \, ds $$이며이 정도는 많은 텍스트에서 설명됩니다. p- 값의 맥락에서 텍스트가 지적하지 못하는 것은 $ f $가 t에 대한 pdf 일 때 t- 통계로부터 p- 값을 제공하는 공식이 정확히 있다는 것입니다. -분포. (나는 토론을 가능한 한 간단하게 유지하려고합니다. 정말 간단하기 때문입니다. 더 완전한 토론은 단측 및 양면 t- 검정을 약간 다르게 취급하고 2의 요인이 발생할 수 있으며 t- 통계 $ [0, \ infty) $ 대신 $ (-\ infty, \ infty) $에있을 수 있습니다. 모든 혼란을 생략합니다.)
p- 값을 찾을 때 정확히 동일한 논의가 적용됩니다. 통계의 다른 표준 분포와 연관됩니다. 다시 한 번 데이터가 무작위로 분포되면 (이번에는 다른 분포에 따라) 결과 p- 값이 $ [0,1] $에 균일하게 분포됩니다.
이것은 쌍을 이루는 t- 검정과 쌍을 이루지 않는 t- 검정에 어떻게 적용됩니까? 요점은 쌍을 이루는 t- 검정에 있으며, 위의 코드에서와 같이 독립적으로 무작위로 선택된 샘플을 사용하여 t의 값은 실제로 a를 따릅니다. t- 분포 ($ n-1 $ 자유도 포함) 따라서 X와 Y의 선택을 여러 번 복제 한 결과 인 p- 값은 $ [0,1] $의 균일 분포를 따릅니다. 동일하게 tr 이번에는 t- 분포가 $ 2 (n-1) $ 자유도를 갖지만 짝을 이루지 않은 t- 검정의 경우입니다. 그럼에도 불구하고, 그 결과로 얻은 p- 값은 위에서 언급 한 일반적인 인수에 의해 $ [0,1] $에 균일 한 분포를 갖습니다.위의 Peter의 코드를 적용하여 p- 값을 결정하면 $ [0,1] $의 균일 분포에서 무작위 표본을 추출하는 두 가지 다른 방법을 얻습니다. 그러나 두 답변은 독립적이지 않습니다.
댓글
- 나는 ‘ p- 값에 신비한 종파가 있다고 생각하지 않습니다. 어떤 사람들은 귀무 가설이 참일 때 실제로 관찰 된 것보다 더 극단적 인 값 또는 극단으로 값을 관찰 할 확률입니다. 당신의 공식 중 하나에서 그 권리가 있다고 생각합니다. 저는 당신이 p- 값이 균일하게 분포되어 있습니다. 예, 귀무 가설이 참일 때 동의합니다. t 검정을 사용하면 귀무 가설이 참이 아닐 수 있습니다. 그러면 p- 값이 균일하지 않습니다. 0에 더 가깝게 집중되어야합니다.
- 두 번째로 우리는 두 가지 다른 테스트 통계에 대해 이야기하고 있습니다. 하나는 페어링을 기반으로하고 다른 하나는 귀하의 예에없는 것입니다. 내 답변에서 언급했는지 여부 짝을 이루지 않은 t 검정은 자유도가 2n-2 인 중심 t 분포를 갖는 반면, 쌍을 이룬 t 검정에 해당하는 t 분포는 자유도가 n-1입니다. 따라서 자유도가 큰 쪽이 다른 쪽보다 표준 정규 분포에 더 가깝습니다. 이 테스트를 실제 데이터에 적용 할 때 중요합니까? 아니! n이 합리적으로 큰 경우는 아닙니다.
- 참고로, 쌍을 이룬 테스트의 한계는 모든 데이터가 쌍을 이룰 수있는 경우 가져야하는 동일한 샘플 크기를 요구합니다. 그러나 짝이없는 검정은 표본 크기가 같지 않은 경우 유효합니다. 따라서 일반적으로 짝을 이루지 않은 테스트는 n + m-2 자유도를 갖습니다.
- 당신의 대답은 길고 추상적이며 나는 그것을 통과하려고 노력했지만 나는하지 않았습니다. ‘ 반례를 이해하지 못합니다. 귀무 가설과 실제 데이터를 어디에서 고려하는지 ‘ 알 수 없습니다. 관측 된 p- 값은 주어진 데이터에 대한 검정 통계량에 대한 적절한 t 분포의 적분입니다. 두 t 분포와 동일한 공통 데이터 세트에 대해 이러한 숫자를 비교합니다. 관측 된 데이터를 조건화하면 이러한 균일 분포가 아무런 역할을하지 않습니다. 죄송 합니다만 ‘ 당신의 대답이 정말로 당신의 질문에 대한 답을 찾을 수 없습니다.
- Michael : 제가 제공 한 R 코드에만 집중하세요. 실행하는 데 1 초 밖에 걸리지 않습니다. 귀무 가설은 X와 Y가 동일한 정규 분포에서 나온다는 것입니다. 물론 제 경우에는 매우 거짓입니다. 내 예에서는 Cov (X, Y) > 0이지만 짝을 이루지 않은 테스트가 짝을 이룬 테스트보다 더 중요합니다.
답변
다른 관점을 제시하겠습니다. 종종 페어링이 수행되어 편향을 줄입니다. 노출 E가 지속적인 결과 Y에 대한 위험 요소인지 여부에 관심이 있다고 가정합니다. 각 E + 대상에 대해 연령 및 성별이 일치하는 대상인 E-를 얻습니다. 이제 우리는 쌍을 이루는 t- 검정이나 쌍을 이루지 않는 t- 검정을 할 수 있습니다. 나는 우리가 명시 적으로 일치를 설명하고 쌍을 이룬 t- 검정을 수행해야한다고 생각합니다. 디자인을 고려한다는 점에서 더 원칙적입니다. 분석에서 매칭을 고려할지 여부는 편향-분산 트레이드 오프의 문제입니다. 분석에서 일치를 설명하면 편향에 대해 더 많은 보호를 제공하지만 분산을 증가시킬 수 있습니다. 짝을 이루지 않은 t- 테스트를 수행하는 것이 더 효율적일 수 있지만 편견에 대한 보호를 제공하지는 않습니다.
답글 남기기