EstimatorとEstimateの関係は何ですか?
On 2月 10, 2021 by admin推定量と推定値の関係は何ですか?
コメント
- "統計では、推定量は、観測データに基づいて特定の数量の推定値を計算するためのルールです。したがって、ルールとその結果(推定値)は区別されます。"(Wikipediaの記事 en.wikipedia.org/wiki/Estimator の最初の行。
- + 1ここで答えようとした最初の試みがいくつかの微妙な点を指摘しているため、私はこの質問に賛成しています(明らかなウィキペディアのページによく定式化された答えがあります)。
- @whuber、モデルパラメータを言うことができます推定量は推定量ですか?
- @loganecolss推定量は数学関数です。これは、任意のデータセットに対して取得できる値(推定値)とは区別されます。違いを理解する1つの方法は、特定のデータセットが、異なる推定量(最大値など)を使用した線形回帰の勾配の同じ推定値を生成することに注意することです。たとえば、最尤法または反復的に再重み付けされた最小二乗法)。推定値とそれらの推定値を生成するために使用された推定量を区別しないと、そのステートメントが何を言っているのかさえ理解できません。
- @ whuber、1つの特定のデータセット$ D $があっても、異なる推定量は異なる見積もり、'ではありませんか?
回答
E 。 L. Lehmannは、彼の古典的な点推定の理論で、この質問に1〜2ページで答えています。
観察結果は次のとおりです。現在、いくつかの既知のクラスに属する、同時確率分布 $ P $ に従うと想定される確率変数がとる値であると仮定されています…
…ここで点推定に特化しましょう…
$ g $ が[規定された分布のクラスで定義された実数値関数であると仮定します]そして、 $ g $ [実際の分布が何であれ、 $ \の値を知りたいと思います。 theta $ ]。残念ながら、 $ \ theta $ 、したがって $ g(\ theta)$ は不明です。ただし、このデータを使用して、 $ g(\ theta)$ の推定値を取得できます。これは、 $ g(\ theta)$ 。
つまり、推定量は明確な数学です。特定の問題が生成する可能性のあるデータの可能なセットの数値(推定)を思い付く手順。この数値は、データ生成プロセスの明確な数値プロパティ( $ g(\ theta)$ )を表すことを目的としています。これを"推定値と呼ぶ場合があります。"
推定量自体はではありません確率変数:これは単なる数学関数です。ただし、生成される推定値は、それ自体が確率変数としてモデル化されたデータに基づいています。これにより、推定値が作成されます(データに依存すると考えられます)。確率変数に変換すると、特定のデータセットの特定の推定値がその確率変数の実現になります。
1つの(従来の)通常の最小値二乗定式化では、データは順序付けられたペア $(x_i、y_i)$ で構成されます。
このOLSではコンテキストでは、推定値の非例は、 $ y $ の値を
Lehmannの公式では、ほぼどの数式もほぼすべてのプロパティの推定量になる可能性があります。推定量と推定量の間に固有の数学的リンクはありません。ただし、推定量が合理的になる可能性を事前に評価できます。推定する予定の量に近い。これを行う方法とその活用方法は、推定理論の主題です。
コメント
- (+ 1)非常に正確で詳細な応答。
- ランダム変数自体の関数でもランダム変数でもありませんか?
- @jsk私が試みていた区別はここでのmakeは、関数の構成を検討することで明確になります$$ \ Omega \ to \ mathbb {R} ^ n \ to \ mathbb {R}。$$最初の関数はランダム変数$ Xです$; 2番目のもの($ t $と呼びます)はここでは推定量と呼ばれ、 2つの構成 $$ t \ circ X:\ Omega \ to \ mathbb { R} $$は、"推定"または"推定手順です。"これは-あなたが正しく言うように-確率変数です。
- @whuberあなたの投稿では、"と言います推定量自体は確率変数ではありません。"あなたと私が同意しているように見える点を明確にするためにあなたの投稿を編集しようとしましたが、誰かが私の編集を拒否したようです。おそらく彼らはあなたの編集を好むでしょう!
- チャットでこの議論を続けましょう。
回答
要するに:推定量は関数と推定値は、観測されたサンプルを要約する値です。
推定量は、次の関数です。確率サンプルをパラメーター推定値にマップします。
$$ \ hat {\ Theta} = t(X_1、X_2、…、X_n)$$ n の推定量に注意してください。 em>確率変数$ X_1、X_2、…、X_n $は確率変数$ \ hat {\ Theta} $です。たとえば、推定量はサンプル平均です。$$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ Estimate $ \ hat {\ theta} $は、推定値関数を小文字の観測サンプル$ x_1、x_2、…、x_n $に適用した結果です:
$$ \ hat {\ theta} = t(x_1、x_2、…、x_n)$$たとえば、観測されたサンプルの推定値$ x_1、x_2、…、x_n $はサンプルの平均です:$$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
コメント
- 見積もりはRVですが、見積もりは一定ですか?
- '結論は@whuber ' s?ここでは、推定量はRVであると言いますが、whuberはそうではないと言います。
- はい、@ whuber 'のステートメント"推定量自体は確率変数ではありません。'は単なる数学関数"です。確率変数の関数も確率変数です。 onlinecourses.science.psu.edu/stat414/node/128
回答
線形回帰モデルのコンテキストでwhuberの答えを説明すると役立つ場合があります。たとえば、2変量データがあり、通常の最小二乗法を使用して次のことを考え出すとします。モデル:
Y = 6X + 1
この時点で、Xの任意の値を取得し、それをモデルにプラグインして、結果Yを予測できます。この意味で、モデルの一般的な形式の個々のコンポーネントについて考えることができます( mX + B )推定値として。サンプルデータ(上記の m と B の特定の値を計算するために汎用モデルにプラグインしたと思われます)は、を思い付くための基礎を提供しました。それぞれ m と B の推定値。
の値に関係なく、以下のスレッドの@whuberのポイントと一致します。 Y 特定の推定量のセットが生成するのは、線形回帰のコンテキストでは、予測値と見なされます。
(編集-数回-以下のコメント)
コメント
- 予測子を適切に定義しました。微妙に(ただし重要なことですが) )推定量とは異なります。このコンテキストでの推定量は、データからパラメーター1と6を計算するために使用される最小二乗式です。
- うーん、私はしませんでした' tはそのように意味します、@ whuber、しかしあなたのコメントは私が気づかなかった私の言語の重要な曖昧さを示していると思います'前。ここでの重要な点は、方程式Y = mX + B(上記で使用)の一般的な形式を推定量と考えることができるのに対し、その式の特定の例(たとえば、1 + 6X)によって生成される特定の予測値は次のとおりです。見積り。上記の段落を編集して、その違いを理解してみましょう…
- ところで、私は' hat "この概念のほとんどの教科書の議論で遭遇した'表記。おそらく、'の方が良いルートなのだろうか?
- 元の答えでは、正確さと専門性の中間にあると思います。それを維持してください。 '帽子は必要ありませんが、推定量が他の似たようなものとどのように区別されるかを示すことができれば、それが最も役立ちます。ただし、値Yを予測することと m や b などのパラメータを推定することの違いに注意してください。 Yは確率変数として解釈できます。 mとbはそうではありません(ベイジアン設定を除く)。
- 実際、パラメータと値の点で非常に良い点です。もう一度編集しています…
回答
データを受け取り、シータと呼ばれる観測変数があるとします。 。これで、データはデータの分布から取得できます。この分布には、確率変数であると推測するシータの対応する値があります。データの分布が変化するたびに、MAPまたは平均を使用してこの確率変数の推定値を計算できます。したがって、確率変数シータは推定と呼ばれ、特定のタイプのデータの観測されていない変数の単一の値です。
Estimatorはデータであり、これも確率変数です。分布の種類ごとに、データの種類が異なるため、推定値も異なります。したがって、この対応する確率変数は、推定量。
コメントを残す