Vad är sambandet mellan uppskattaren och uppskattningen?
On februari 10, 2021 by adminVad är sambandet mellan estimator och estimat?
Kommentarer
- ” I statistik är en uppskattning en regel för att beräkna en uppskattning av en given kvantitet baserat på observerade data: så skiljer man regeln och dess resultat (uppskattningen). ”570de15fa5”>
(Första raden i Wikipedia-artikeln en.wikipedia.org/wiki/Estimator ).
Svar
E . L. Lehmann, i sin klassiska Theory of Point Estimation , svarar på denna fråga på s. 1-2.
Observationerna är nu postuleras som värdena som slumpmässiga variabler antas följa en gemensam sannolikhetsfördelning, $ P $ , som tillhör någon känd klass …
… låt oss nu specialisera oss i punktuppskattning … antar att $ g $ är en verkligt värderad funktion definierad [på den angivna klassen av distributioner ] och att vi skulle vilja veta värdet av $ g $ [oavsett vilken faktiska fördelning som gäller, $ \ theta $ ]. Tyvärr är $ \ theta $ , och därmed $ g (\ theta) $ okänd. Uppgifterna kan dock användas för att få en uppskattning av $ g (\ theta) $ , ett värde som man hoppas kommer att vara nära $ g (\ theta) $ .
Med ord: en uppskattare är en bestämd matematisk procedur som kommer med ett nummer ( uppskattningen ) för alla möjliga uppsättningar data som ett visst problem kan ge. Det talet är avsett att representera någon bestämd numerisk egenskap ( $ g (\ theta) $ ) för datagenereringsprocessen; vi kan kalla detta ” estimand. ”
Själva uppskattaren är inte en slumpmässig variabel: den är bara en matematisk funktion. Uppskattningen den producerar är dock baserad på data som själva modelleras som slumpmässiga variabler. Detta gör att uppskattningen (tänkt som beroende på data) till en slumpmässig variabel och en viss uppskattning för en viss uppsättning data blir en realisering av den slumpmässiga variabeln.
I en (konventionell) vanlig minst kvadratformulering, data består av ordnade par $ (x_i, y_i) $ . $ x_i $ har har fastställts av experimentet (de kan till exempel vara mängder av ett läkemedel). Varje $ y_i $ (till exempel ett svar på läkemedlet) antas kommer från en sannolikhetsfördelning som är Normal men med okänt medelvärde $ \ mu_i $ och gemensam varians $ \ sigma ^ 2 $ . Vidare antas det att medel är relaterade till $ x_i $ via en formel $ \ mu_i = \ beta_0 + \ beta_1 x_i $ . Dessa tre parametrar – $ \ sigma $ , $ \ beta_0 $ och $ \ beta_1 $ – bestäm den underliggande fördelningen av $ y_i $ för valfritt värde på $ x_i $ . Därför kan vilken som helst egenskap hos den distributionen ses som en funktion av $ (\ sigma, \ beta_0, \ beta_1) $ .Exempel på sådana egenskaper är avlyssningen $ \ beta_0 $ , lutningen $ \ beta_1 $ , värdet på $ \ cos (\ sigma + \ beta_0 ^ 2 – \ beta_1) $ , eller till och med medelvärdet till värdet $ x = 2 $ , som (enligt denna formulering) måste vara $ \ beta_0 + 2 \ beta_1 $ .
I denna OLS sammanhang skulle ett icke-exempel för en uppskattning vara ett förfarande för att gissa på värdet av $ y $ om $ x $ sattes lika med 2. Detta är inte en uppskattning eftersom detta värde $ y $ är slumpmässigt (på ett sätt helt skilt från dataens slumpmässighet): det är inte en (bestämd numerisk) egenskap hos distributionen, även om den är relaterad till den distributionen. (Som vi just såg dock förväntningen för $ y $ för $ x = 2 $ , lika med $ \ beta_0 + 2 \ beta_1 $ , kan uppskattas.)
I Lehmanns formulering, nästan vilken formel som helst kan vara en uppskattning av nästan vilken egendom som helst. Det finns ingen inneboende matematisk koppling mellan en uppskattning och en uppskattning. nära den kvantitet den är tänkt att uppskatta. Sätt att göra detta och hur man utnyttjar dem är föremål för uppskattningsteori.
Kommentarer
- (+ 1) Ett mycket exakt och detaljerat svar.
- Är inte en funktion av en slumpmässig variabel också en slumpmässig variabel?
- @jsk Jag tror att skillnaden jag försökte gör här kan klargöras genom att beakta sammansättningen av funktioner $$ \ Omega \ till \ mathbb {R} ^ n \ till \ mathbb {R}. $$ Den första funktionen är en slumpmässig variabel $ X $; den andra (kallas $ t $) kallas en uppskattare här, och sammansättningen av de två $$ t \ circ X: \ Omega \ till \ mathbb { R} $$ är en ” uppskattning ” eller ” uppskattningsprocedur, ” vilket är – som du korrekt säger – en slumpmässig variabel.
- @whuber I ditt inlägg säger du ” Uppskattaren i sig är inte en slumpmässig variabel. ” Jag försökte redigera ditt inlägg för att klargöra den punkt som du och jag verkar komma överens om, men det verkar som om någon avvisade min redigering. Kanske föredrar de din redigering!
- Låt oss fortsätta denna diskussion i chatt .
Svar
Kort sagt: en uppskattare är en funktion och en uppskattning är ett värde som sammanfattar ett observerat prov.
En estimator är en funktion som mappar ett slumpmässigt urval till parameteruppskattningen:
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ Observera att en uppskattning av n slumpmässiga variabler $ X_1, X_2, …, X_n $ är en slumpmässig variabel $ \ hat {\ Theta} $. Till exempel är en uppskattare medelvärdet av exemplet: $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An uppskattning $ \ hat {\ theta} $ är resultatet av att tillämpa uppskattningsfunktionen på ett gemenerligt observerat prov $ x_1, x_2, …, x_n $:
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ Exempelvis är en uppskattning av det observerade provet $ x_1, x_2, …, x_n $ provmedlet : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
Kommentarer
- uppskattaren är en husbil, medan uppskattningen är konstant?
- Är inte ’ t din slutsats som strider mot @whuber ’ s? Här säger du att estimator är RV, men whuber säger något annat.
- Ja, jag håller inte med @whuber ’ s uttalande ” Uppskattaren i sig är inte en slumpmässig variabel: den ’ är bara en matematisk funktion ”. En funktion av slumpmässig variabel är också en slumpmässig variabel. onlinecourses.science.psu.edu/stat414/node/128
Svar
Det kan vara bra att illustrera whubers svar i samband med en linjär regressionsmodell. Låt oss säga att du har några bivariata data och att du använder ordinära minsta kvadrater för att komma med följande modell:
Y = 6X + 1
Vid denna tidpunkt kan du ta valfritt värde av X, ansluta det till modellen och förutsäga resultatet, Y. I den meningen kan du tänka på de enskilda komponenterna i modellens generiska form ( mX + B ) som uppskattare .Exempeldata (som du antagligen kopplat in i den generiska modellen för att beräkna de specifika värdena för m och B ovan) gav en grund för att du kunde komma fram till uppskattningar för m respektive B .
Överensstämmer med @whubers punkter i vår tråd nedan, oavsett värden på Y en viss uppsättning uppskattare som genererar dig för, betraktas, i samband med linjär regression, som förutsagda värden.
(redigeras – några gånger – för att återspegla kommentarer nedan)
Kommentarer
- Du har snyggt definierat en prediktor. Det är subtilt (men viktigt ) skiljer sig från en uppskattning. Uppskattaren är i detta sammanhang den minsta kvadratformeln som används för att beräkna parametrarna 1 och 6 från data.
- Hmm, jag gjorde inte ’ t menar det så, @whuber, men jag tror att din kommentar illustrerar en viktig tvetydighet i mitt språk som jag inte ’ inte märkte innan. Huvudpoängen här är att du kan tänka på den generiska formen av ekvationen Y = mX + B (som används ovan) som en estimator, medan de specifika förutsagda värdena som genereras av specifika exempel på den formeln (t.ex. 1 + 6X) är uppskattningar. Låt mig försöka redigera stycket ovan för att fånga den skillnaden …
- btw, jag ’ jag försöker förklara detta utan att införa ” hat ” notation som jag ’ har stött på i de flesta läroböksdiskussioner om detta koncept. Kanske att ’ trots allt är den bättre vägen?
- Jag tror att du har nått ett bra medium mellan noggrannhet och tekniskhet i ditt ursprungliga svar: fortsätt! Du behöver ’ t behöver hattar, men om du lyckas visa hur en uppskattning skiljer sig från andra, liknande saker, skulle det vara till stor hjälp. Men observera skillnaden mellan förutsäga ett värde Y och uppskatta en parameter som m eller b . Y kan tolkas som en slumpmässig variabel; m och b är inte (utom i Bayesian-inställning).
- verkligen en mycket bra punkt när det gäller parametrar kontra värden där. Redigerar igen …
Svar
Antag att du fick lite data och att du hade någon observerad variabel som heter theta . Nu kan dina data komma från en distribution av data, för denna distribution finns det ett motsvarande värde av theta som du drar slutsatsen som är en slumpmässig variabel. Du kan använda MAP eller medel för att beräkna uppskattningen av denna slumpmässiga variabel när distributionen av dina data ändras. Så den slumpmässiga variabeln theta är känd som en uppskattning , ett enda värde på den icke observerade variabeln för en viss typ av data.
Medan estimator är dina data, som också är en slumpmässig variabel. För olika typer av distributioner har du olika typer av data och därmed har du en annan uppskattning och därmed kallas denna motsvarande slumpmässiga variabel estimator .
Lämna ett svar