추정자와 추정치의 관계는 무엇입니까?
On 2월 10, 2021 by admin견적 자와 추정치의 관계는 무엇입니까?
댓글
- " 통계에서 추정기는 관찰 된 데이터를 기반으로 주어진 수량의 추정치를 계산하는 규칙입니다. 따라서 규칙과 그 결과 (추정치)가 구별됩니다. " (Wikipedia 기사 en.wikipedia.org/wiki/Estimator 의 첫 번째 줄)
- + 1 나는이 질문에 찬성합니다 (명백한 위키피디아 페이지에 잘 공식화 된 답변이 있음에도 불구하고). 여기에 대답하려는 초기 시도가 약간의 미묘함을 지적했기 때문입니다.
- @whuber, 모델 매개 변수를 말할 수 있습니까? 추정치는 추정치입니까?
- @loganecolss 추정치는 수학적 함수입니다. 이는 데이터 집합에 대해 얻을 수있는 값 (추정치)과 구별됩니다. 차이를 이해하는 한 가지 방법은 특정 데이터 세트가 서로 다른 추정자 (예 : 최대 값)를 사용하는 선형 회귀의 기울기와 동일한 추정값 을 생성한다는 것입니다. 예를 들어, 가능성 또는 반복적으로 재가 중 된 최소 제곱). 추정치를 생성하는 데 사용 된 추정자와 구별하지 않으면 그 진술이 무엇을 말하는지 이해할 수 없습니다.
- @whuber, 특정 데이터 세트 $ D $를 사용하더라도 다른 추정자가 다른 예상치, 그렇지 않습니까? '
답변
E . L. Lehmann은 그의 고전적인 점 추정 이론 에서 1-2 페이지에서이 질문에 답합니다.
관찰은 다음과 같습니다. 이제 알려진 클래스에 속하는 공동 확률 분포 $ P $ 를 따르는 것으로 가정되는 임의 변수에 의해 취해진 값으로 가정됩니다 …
… 이제 포인트 추정을 전문화하겠습니다 … $ g $ 가 [규정 된 분포 클래스에 정의 된 실수 값 함수라고 가정합니다. ] 그리고 $ g $ 의 가치를 알고 싶습니다. [실제 분포가 무엇이든간에 $ \ theta $ ]. 불행히도 $ \ theta $ 및 따라서 $ g (\ theta) $ 는 알 수 없습니다. 그러나 데이터를 사용하여 $ g (\ theta) $ 의 추정치를 얻을 수 있습니다.이 값은 $ g (\ theta) $ .
즉, 추정기 는 확실한 수학적 특정 문제가 생성 할 수있는 가능한 데이터 집합에 대한 숫자 ( 추정 )를 제공하는 절차입니다. 이 숫자는 데이터 생성 프로세스의 명확한 숫자 속성 ( $ g (\ theta) $ )을 나타 내기위한 것입니다. 이를 " 견적이라고 부를 수 있습니다. "
추정기 자체는 아닙니다 . 랜덤 변수 : 그것은 단지 수학적 함수일뿐입니다. 그러나 그것이 생성하는 추정은 그 자체가 랜덤 변수로 모델링 된 데이터를 기반으로합니다. 이것은 추정 을 만듭니다 (데이터에 의존하는 것으로 간주 됨). 무작위 변수로 변환하고 특정 데이터 세트 에 대한 특정 추정치 는 해당 무작위 변수의 실현이됩니다.
하나 (기존의) 보통 최소 제곱 공식에서 데이터는 순서쌍 $ (x_i, y_i) $ 으로 구성됩니다. $ x_i $ 는 (예를 들어, 투여되는 약물의 양일 수 있음) 각 $ y_i $ (예 : 약물에 대한 반응)은 다음과 같이 가정됩니다. 정상이지만 평균을 알 수없는 확률 분포에서 비롯됨 $ \ mu_i $ 및 공통 분산 $ \ sigma ^ 2 $ . 또한 평균은 $ \ mu_i = \ beta_0 + \ 공식을 통해 $ x_i $ 와 관련이 있다고 가정합니다. beta_1 x_i $ . 이 세 가지 매개 변수는 $ \ sigma $ , $ \ beta_0 $ 및 $ \ beta_1 $ –의 모든 값에 대한 $ y_i $ 의 기본 분포를 결정합니다. $ x_i $ . 따라서 해당 분포의 모든 속성은 $ (\ sigma, \ beta_0, \ beta_1) $ 의 함수로 생각할 수 있습니다.이러한 속성의 예로는 절편 $ \ beta_0 $ , 기울기 $ \ beta_1 $ , $ \ cos (\ sigma + \ beta_0 ^ 2-\ beta_1) $ 또는 $ x 값의 평균 = 2 $ (이 공식에 따라)는 $ \ beta_0 + 2 \ beta_1 $ 이어야합니다.
이 OLS에서 컨텍스트에서 추정 자의 비 예제 는 pan class = “math 인 경우 $ y $ 의 값을 추측하는 절차입니다. -container “> $ x $ 이 (가) 2로 설정되었습니다.이 값은 $ y $ 이기 때문에 추정기가 아닙니다 . 무작위 (데이터의 임의성과 완전히 분리 된 방식) : 분포와 관련이 있더라도 분포의 (정확한 숫자) 속성이 아닙니다. (방금 본 것처럼 $ y $ 의 $ x = 2에 대한 기대치 $ 는 $ \ beta_0 + 2 \ beta_1 $ 와 같으며 추정 할 수 있습니다.)
Lehmann의 공식에서는 거의 모든 공식은 거의 모든 속성에 대한 추정치가 될 수 있습니다. 추정자와 추정치간에 고유 한 수학적 연결은 없습니다. 그러나 추정자가 합리적 일 가능성을 미리 평가할 수 있습니다. 추정하려는 양에 가깝습니다.이를 수행하는 방법과이를 활용하는 방법은 추정 이론의 주제입니다.
댓글
- (+ 1) 매우 정확하고 상세한 응답입니다.
- 무작위 변수 자체의 함수도 랜덤 변수가 아닌가요?
- @jsk 제가 시도한 구분은 여기서 make는 $$ \ Omega \ to \ mathbb {R} ^ n \ to \ mathbb {R}. $$ 함수의 구성을 고려하여 명확히 할 수 있습니다. 첫 번째 함수는 랜덤 변수 $ X입니다. $; 두 번째 것 ($ t $라고 부름)은 여기서 추정기 로, 두 가지의 구성 $$ t \ circ X : \ Omega \ to \ mathbb { R} $$는 " 예상 " 또는 " 예상 절차입니다. ", 정확히 말하면 임의의 변수입니다.
- @whuber 게시물에서 "라고 말합니다. 견적 자 자체는 임의의 변수가 아닙니다. " 귀하와 내가 동의하는 것으로 보이는 요점을 명확히하기 위해 귀하의 게시물을 수정하려고했지만 누군가 내 수정을 거부 한 것 같습니다. 아마도 그들은 귀하의 편집을 선호 할 것입니다!
- 채팅에서이 토론을 계속 하겠습니다.
답변
요약 : 견적자는 함수 및 추정치는 관찰 된 샘플을 요약하는 값입니다.
추정기 는 무작위 표본을 매개 변수 추정치에 매핑합니다.
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ 추정치는 n 랜덤 변수 $ X_1, X_2, …, X_n $는 랜덤 변수 $ \ hat {\ Theta} $입니다. 예를 들어 추정치는 샘플 평균입니다. $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An 추정값 $ \ hat {\ theta} $는 추정값 함수를 소문자 관측 샘플 $ x_1, x_2, …, x_n $에 적용한 결과입니다.
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ 예를 들어, 관측 된 표본 $ x_1, x_2, …, x_n $의 추정치는 표본 평균입니다. : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
댓글
- 추정치는 RV이고 추정치는 일정합니까?
- 귀하의 결론이 @whuber iv id =와 충돌하지 않습니까?
- ' “cdfec71169″>
? 여기에서 추정치는 RV라고 말하지만 whuber는 그렇지 않다고 말합니다.
답변
선형 회귀 모델의 맥락에서 whuber의 답변을 설명하는 것이 도움이 될 수 있습니다. 이변 량 데이터가 있고 Ordinary Least Squares를 사용하여 다음을 제시한다고 가정 해 보겠습니다. 모델 :
Y = 6X + 1
이 시점에서 X의 값을 가져 와서 모델에 연결하고 결과 Y를 예측할 수 있습니다. 이런 의미에서 모델의 일반 형식 ( mX + B ) 견적 자 로.샘플 데이터 (위의 m 및 B 에 대한 특정 값을 계산하기 위해 일반 모델에 연결 한 것으로 추정 됨)는 을 얻을 수있는 근거를 제공했습니다. m 및 B 에 대한 추정치 .
의 값에 관계없이 아래 스레드의 @ whuber s 포인트와 일치합니다. Y 선형 회귀의 맥락에서 예측 된 값으로 간주되는 특정 추정값 집합이 생성합니다.
(몇 번 수정 됨) 아래 댓글)
댓글
- 예측자를 멋지게 정의했습니다. 미묘하지만 중요한 것은 )은 추정기와 다릅니다.이 맥락에서 추정치는 데이터에서 매개 변수 1과 6을 계산하는 데 사용되는 최소 제곱 공식입니다.
- 흠, 저는 ' 그런 의미는 아닙니다, @whuber,하지만 귀하의 의견은 제가 알아 차리지 못한 내 언어의 중요한 모호성을 보여주고 있다고 생각합니다. ' 전에. 여기서 요점은 방정식 Y = mX + B (위에 사용 된)의 일반적인 형식을 추정 자로 생각할 수 있다는 점입니다. 반면 해당 공식의 특정 예 (예 : 1 + 6X)에 의해 생성 된 특정 예측 값은 다음과 같습니다. 추정. 그 차이를 포착하기 위해 위의 단락을 편집 해 보겠습니다 …
- btw, 저는 ' 이 개념에 대한 대부분의 교과서 토론에서 접했던 " 표기법입니다. ' 결국 '가 더 나은 경로일까요?
- 원래 답변에서 정확성과 기술성 사이에 좋은 매체를 맞췄다 고 생각합니다. 계속 유지하세요! 모자가 필요하지는 않지만 '하지만 추정기가 다른 유사한 모양과 어떻게 구별되는지 보여줄 수 있다면 가장 도움이 될 것입니다. 그러나 Y 값을 예측 하는 것과 m 또는 b 와 같은 매개 변수를 추정 하는 것의 차이에 유의하십시오. Y는 랜덤 변수로 해석 될 수 있습니다. m과 b는 그렇지 않습니다 (베이지안 설정 제외).
- 실제로 매개 변수 대 값 측면에서 매우 좋은 점입니다. 다시 편집 중 …
답변
데이터를 받았는데 세타라는 변수를 관찰했다고 가정 해 보겠습니다. . 이제 데이터는 데이터 분포에서 가져올 수 있습니다.이 분포의 경우 무작위 변수 인 세타의 해당 값이 있습니다. MAP 또는 평균을 사용하여 데이터 분포가 변경 될 때마다이 랜덤 변수의 추정치를 계산할 수 있습니다. 따라서 랜덤 변수 세타는 특정 유형의 데이터에 대한 관찰되지 않은 변수의 단일 값인 추정 으로 알려져 있습니다.
추정치는 데이터이며 랜덤 변수이기도합니다. 분포 유형이 다르면 데이터 유형이 다르므로 추정치가 다르므로이 랜덤 변수를 추정기 .
답글 남기기