Welche Beziehung besteht zwischen Schätzer und Schätzung?
On Februar 10, 2021 by adminWie ist die Beziehung zwischen Schätzer und Schätzung?
Kommentare
- “ In der Statistik ist ein Schätzer eine Regel zur Berechnung einer Schätzung einer bestimmten Menge auf der Grundlage beobachteter Daten: Somit werden die Regel und ihr Ergebnis (die Schätzung) unterschieden. “ (Erste Zeile des Wikipedia-Artikels en.wikipedia.org/wiki/Estimator ).
- + 1 Ich stimme dieser Frage zu (trotz des Vorhandenseins einer gut formulierten Antwort auf einer offensichtlichen Wikipedia-Seite), da erste Versuche, sie hier zu beantworten, auf einige Feinheiten hingewiesen haben.
- @whuber, kann ich die Modellparameter sagen Schätzungen sind der Schätzer?
- @loganecolss Ein Schätzer ist eine mathematische Funktion. Dies unterscheidet sich von dem Wert (der Schätzung), den es für jeden Datensatz erreichen könnte. Eine Möglichkeit, den Unterschied zu erkennen, besteht darin, zu beachten, dass bestimmte Datensätze dieselben Schätzungen beispielsweise der Steigung in einer linearen Regression unter Verwendung verschiedener Schätzer (wie z. B. Maximum) erzeugen Zum Beispiel Wahrscheinlichkeit oder iterativ neu gewichtete kleinste Quadrate). Ohne Schätzungen von den Schätzern zu unterscheiden, die zur Erstellung dieser Schätzungen verwendet wurden, könnten wir nicht verstehen, was diese Aussage überhaupt sagt.
- @whuber, selbst mit einem bestimmten Datensatz $ D $, könnten verschiedene Schätzer auch unterschiedliche geben Schätzungen, nicht ‚ t sie?
Antwort
E. . L. Lehmann beantwortet diese Frage in seiner klassischen Theorie der Punktschätzung auf den Seiten 1-2.
Die Beobachtungen sind Es wird nun postuliert, dass dies die Werte sind, die von Zufallsvariablen angenommen werden, von denen angenommen wird, dass sie einer gemeinsamen Wahrscheinlichkeitsverteilung folgen, $ P $ , die zu einer bekannten Klasse gehört …
… spezialisieren wir uns jetzt auf die Punktschätzung … Nehmen wir an, dass $ g $ eine reelle Funktion ist, die [für die festgelegte Verteilungsklasse definiert ist ] und dass wir den Wert von $ g $ [bei welcher tatsächlichen Verteilung auch immer wissen möchten, $ \ Theta $ ]. Leider ist $ \ theta $ und damit $ g (\ theta) $ unbekannt. Die Daten können jedoch verwendet werden, um eine Schätzung von $ g (\ theta) $ zu erhalten, ein Wert, von dem man hofft, dass er nahe an $ g (\ theta) $ .
In Worten: Ein Schätzer ist eine bestimmte Mathematik Verfahren, das eine Zahl (die Schätzung ) für jeden möglichen Datensatz liefert, den ein bestimmtes Problem erzeugen könnte. Diese Zahl soll eine bestimmte numerische Eigenschaft ( $ g (\ theta) $ ) des Datengenerierungsprozesses darstellen. Wir könnten dies den “ Schätzer nennen. “
Der Schätzer selbst ist nicht eine Zufallsvariable: Es ist nur eine mathematische Funktion. Die Schätzung, die sie erzeugt, basiert jedoch auf Daten, die selbst als Zufallsvariablen modelliert werden. Dadurch wird die Schätzung (als abhängig von den Daten gedacht) erstellt. in eine Zufallsvariable und eine bestimmte Schätzung für einen bestimmten Datensatz wird eine Realisierung dieser Zufallsvariablen.
In einem (herkömmlichen) gewöhnlichen Minimum Bei der Quadratformulierung bestehen die Daten aus geordneten Paaren $ (x_i, y_i) $ . Die $ x_i $ haben wurde vom Experimentator bestimmt (dies können beispielsweise Mengen eines verabreichten Arzneimittels sein). Es wird angenommen, dass jeder $ y_i $ (zum Beispiel eine Reaktion auf das Arzneimittel) stammen aus einer Wahrscheinlichkeitsverteilung, die normal ist, aber einen unbekannten Mittelwert $ \ hat mu_i $ und common Varianz $ \ sigma ^ 2 $ . Weiterhin wird angenommen, dass die Mittelwerte über eine Formel $ \ mu_i = \ beta_0 + \ mit dem $ x_i $ zusammenhängen beta_1 x_i $ . Diese drei Parameter – $ \ sigma $ , $ \ beta_0 $ und $ \ beta_1 $ – Bestimmen Sie die zugrunde liegende Verteilung von $ y_i $ für einen beliebigen Wert von $ x_i $ . Daher kann jede Eigenschaft dieser Verteilung als Funktion von $ (\ sigma, \ beta_0, \ beta_1) $ betrachtet werden.Beispiele für solche Eigenschaften sind der Achsenabschnitt $ \ beta_0 $ , die Steigung $ \ beta_1 $ , der Wert von $ \ cos (\ sigma + \ beta_0 ^ 2 – \ beta_1) $ oder sogar der Mittelwert beim Wert $ x = 2 $ , was (gemäß dieser Formulierung) $ \ beta_0 + 2 \ beta_1 $ sein muss.
In diesem OLS Im Kontext wäre ein Nicht-Beispiel eines Schätzers eine Prozedur, um den Wert von $ y $ zu erraten, wenn $ x $ wurde auf 2 gesetzt. Dies ist kein Schätzer, da dieser Wert von $ y $ ist ist zufällig (in einer Weise, die vollständig von der Zufälligkeit der Daten getrennt ist): Es ist keine (bestimmte numerische) Eigenschaft der Verteilung, obwohl sie mit dieser Verteilung zusammenhängt. (Wie wir gerade gesehen haben, ist die Erwartung von $ y $ für $ x = 2 $ , gleich $ \ beta_0 + 2 \ beta_1 $ , kann geschätzt werden.)
In Lehmanns Formulierung fast Jede Formel kann ein Schätzer für nahezu jede Eigenschaft sein. Es gibt keine inhärente mathematische Verbindung zwischen einem Schätzer und einem Schätzer. Wir können jedoch im Voraus die Wahrscheinlichkeit einschätzen, dass ein Schätzer vernünftig ist In der Nähe der Menge, die geschätzt werden soll. Möglichkeiten, dies zu tun und wie man sie ausnutzt, sind Gegenstand der Schätzungstheorie.
Kommentare
- (+ 1) Eine sehr genaue und detaillierte Antwort.
- Ist nicht eine Funktion einer Zufallsvariablen selbst auch eine Zufallsvariable?
- @jsk Ich denke, die Unterscheidung, die ich versucht habe make kann hier durch Berücksichtigung der Zusammensetzung der Funktionen $$ \ Omega \ bis \ mathbb {R} ^ n \ bis \ mathbb {R} geklärt werden. $$ Die erste Funktion ist eine Zufallsvariable $ X. $; Der zweite (nennen wir es $ t $) wird hier als Schätzer bezeichnet, und die Zusammensetzung der beiden $$ t \ circ X: \ Omega \ to \ mathbb { R} $$ ist eine “ Schätzung “ oder “ Schätzprozedur „, was – wie Sie richtig sagen – eine Zufallsvariable ist.
- @whuber In Ihrem Beitrag sagen Sie “ Der Schätzer selbst ist keine Zufallsvariable. “ Ich habe versucht, Ihren Beitrag zu bearbeiten, um den Punkt zu klären, über den Sie und ich uns einig zu sein scheinen, aber es scheint, dass jemand meine Bearbeitung abgelehnt hat. Vielleicht würden sie Ihre Bearbeitung vorziehen!
- Lassen Sie uns diese Diskussion im Chat fortsetzen .
Antwort
Kurz gesagt: Ein Schätzer ist a Funktion und Schätzung ist ein Wert, der eine beobachtete Stichprobe zusammenfasst.
Ein Schätzer ist eine Funktion, die ordnet der Parameterschätzung eine Zufallsstichprobe zu:
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ Beachten Sie, dass ein Schätzer von n Zufallsvariablen $ X_1, X_2, …, X_n $ ist eine Zufallsvariable $ \ hat {\ Theta} $. Ein Schätzer ist beispielsweise der Stichprobenmittelwert: $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An Schätzung $ \ hat {\ theta} $ ist das Ergebnis der Anwendung der Schätzfunktion auf eine in Kleinbuchstaben beobachtete Stichprobe $ x_1, x_2, …, x_n $:
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ Beispielsweise ist eine Schätzung der beobachteten Stichprobe $ x_1, x_2, …, x_n $ der Stichprobenmittelwert : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
Kommentare
- Schätzer ist ein Wohnmobil, während Schätzung eine Konstante ist?
- Ist ‚ nicht Ihre Schlussfolgerung, die mit @whuber ‚ s? Hier sagen Sie, Schätzer ist RV, aber Whuber sagt etwas anderes.
- Ja, ich bin mit der Aussage von @whuber ‚ “ Der Schätzer selbst ist keine Zufallsvariable: ‚ ist nur eine mathematische Funktion „. Eine Funktion der Zufallsvariablen ist auch eine Zufallsvariable. onlinecourses.science.psu.edu/stat414/node/128
Antwort
Es kann hilfreich sein, die Antwort von whuber im Kontext eines linearen Regressionsmodells zu veranschaulichen. Nehmen wir an, Sie haben einige bivariate Daten und verwenden gewöhnliche kleinste Quadrate, um Folgendes zu finden Modell:
Y = 6X + 1
An diesem Punkt können Sie einen beliebigen Wert von X nehmen, ihn in das Modell einfügen und das Ergebnis Y vorhersagen. In diesem Sinne können Sie an die einzelnen Komponenten der generischen Form des Modells ( mX +) denken B ) als Schätzer .Die Beispieldaten (die Sie vermutlich in das generische Modell eingefügt haben, um die spezifischen Werte für m und B oben zu berechnen) bildeten eine Grundlage, auf der Sie erstellen konnten Schätzungen für m bzw. B .
In Übereinstimmung mit den @ whuber-Punkten in unserem Thread unten, unabhängig von den Werten von Y Ein bestimmter Satz von Schätzern, für den Sie generiert werden, wird im Kontext der linearen Regression als vorhergesagte Werte betrachtet.
(einige Male bearbeitet, um die Werte widerzuspiegeln) Kommentare unten)
Kommentare
- Sie haben einen Prädiktor gut definiert. Es ist subtil (aber wichtig) Der Schätzer ist in diesem Zusammenhang die Formel der kleinsten Quadrate, die zur Berechnung der Parameter 1 und 6 aus den Daten verwendet wird.
- Hmm, ich habe nicht ‚ Ich meine es nicht so, @whuber, aber ich denke, Ihr Kommentar zeigt eine wichtige Mehrdeutigkeit in meiner Sprache, die ich ‚ nicht bemerkt habe Vor. Der Hauptpunkt hier ist, dass Sie sich die generische Form der Gleichung Y = mX + B (wie oben verwendet) als Schätzer vorstellen können, während die bestimmten vorhergesagten Werte, die durch bestimmte Beispiele dieser Formel (z. B. 1 + 6X) erzeugt werden, sind Schätzungen. Lassen Sie mich versuchen, den obigen Absatz zu bearbeiten, um diese Unterscheidung zu erfassen …
- Übrigens, ich ‚ versuche dies zu erklären, ohne die hat “ Notation, die ich ‚ in den meisten Lehrbuchdiskussionen dieses Konzepts angetroffen habe. Vielleicht ist das ‚ doch die bessere Route?
- Ich denke, Sie haben in Ihrer ursprünglichen Antwort ein gutes Medium zwischen Genauigkeit und Technik gefunden: Weiter so! Sie benötigen ‚ keine Hüte, aber wenn Sie zeigen können, wie sich ein Schätzer von anderen, ähnlich aussehenden Dingen unterscheidet, wäre dies am hilfreichsten. Beachten Sie jedoch den Unterschied zwischen Vorhersagen eines Werts Y und Schätzen eines Parameters wie m oder b . Y könnte als Zufallsvariable interpretiert werden; m und b sind nicht (außer in einer Bayesschen Umgebung).
- in der Tat ein sehr guter Punkt in Bezug auf Parameter gegenüber Werten dort. Erneutes Bearbeiten …
Antwort
Angenommen, Sie haben einige Daten erhalten und eine beobachtete Variable namens Theta . Jetzt können Ihre Daten aus einer Datenverteilung stammen. Für diese Verteilung gibt es einen entsprechenden Theta-Wert, den Sie ableiten und der eine Zufallsvariable ist. Sie können den MAP oder den Mittelwert zur Berechnung der Schätzung dieser Zufallsvariablen verwenden, wenn sich die Verteilung Ihrer Daten ändert. Daher ist die Zufallsvariable Theta als Schätzung bekannt, ein einzelner Wert der nicht beobachteten Variablen für einen bestimmten Datentyp.
Während Schätzer Ihre Daten sind, ist dies auch eine Zufallsvariable. Für verschiedene Arten von Verteilungen haben Sie verschiedene Arten von Daten und somit eine unterschiedliche Schätzung. Daher wird diese entsprechende Zufallsvariable als Schätzer .
Schreibe einen Kommentar