Wat is de relatie tussen schatter en schatting?
Geplaatst op februari 10, 2021 door adminWat is de relatie tussen schatter en schatting?
Opmerkingen
- ” In statistieken is een schatter een regel voor het berekenen van een schatting van een bepaalde hoeveelheid op basis van geobserveerde gegevens: zo worden de regel en het resultaat (de schatting) onderscheiden. ” (eerste regel van het Wikipedia-artikel en.wikipedia.org/wiki/Estimator ).
- + 1 Ik stem deze vraag op (ondanks de aanwezigheid van een goed geformuleerd antwoord op een voor de hand liggende Wikipedia-pagina) omdat de eerste pogingen om deze hier te beantwoorden op enkele subtiliteiten hebben gewezen.
- @whuber, mag ik de modelparameters zeggen schattingen zijn de schatter?
- @loganecolss Een schatter is een wiskundige functie. Dat onderscheidt zich van de waarde (de schatting) die het zou kunnen bereiken voor elke set gegevens. Een manier om het verschil te begrijpen, is op te merken dat bepaalde gegevenssets dezelfde schattingen produceren van bijvoorbeeld de helling in een lineaire regressie met verschillende schatters (zoals Maximum Waarschijnlijkheid of iteratief opnieuw bekeken kleinste vierkanten, bijvoorbeeld). Zonder schattingen te onderscheiden van de schatters die zijn gebruikt om die schattingen te maken, zouden we niet kunnen begrijpen wat die bewering zelfs zegt.
- @whuber, zelfs met één bepaalde dataset $ D $, zou een andere schatter ook verschillende schattingen, don ‘ t zij?
Antwoord
E . L. Lehmann beantwoordt deze vraag in zijn klassieke Theory of Point Estimation op pagina 1-2.
De waarnemingen zijn nu gepostuleerd als de waarden die zijn overgenomen door willekeurige variabelen waarvan wordt aangenomen dat ze een gezamenlijke kansverdeling volgen, $ P $ , behorend tot een bekende klasse …
… laten we ons nu specialiseren in puntschatting … veronderstel dat $ g $ een functie met reële waarde is die is gedefinieerd [op basis van de voorgeschreven distributieklasse ] en dat we graag de waarde willen weten van $ g $ [ongeacht de daadwerkelijke verdeling die van kracht is, $ \ theta $ ]. Helaas is $ \ theta $ , en dus $ g (\ theta) $ , onbekend. De gegevens kunnen echter worden gebruikt om een schatting te krijgen van $ g (\ theta) $ , een waarde waarvan men hoopt dat deze in de buurt komt van $ g (\ theta) $ .
In woorden: een schatter is een duidelijke wiskundige procedure die een getal oplevert (de schatting ) voor elke mogelijke set gegevens die een bepaald probleem zou kunnen opleveren. Dat nummer is bedoeld om een bepaalde numerieke eigenschap ( $ g (\ theta) $ ) van het gegevensgeneratieproces weer te geven; we zouden dit de ” schattingen kunnen noemen. ”
De schatter zelf is niet een willekeurige variabele: het is slechts een wiskundige functie. De schatting die het oplevert, is echter gebaseerd op gegevens die zelf zijn gemodelleerd als willekeurige variabelen. Dit maakt de schatting (gedacht dat deze afhankelijk is van de gegevens) in een willekeurige variabele en een bepaalde schatting voor een bepaalde set gegevens wordt een realisatie van die willekeurige variabele.
In een (conventionele) gewone minste vierkantenformulering, de gegevens bestaan uit geordende paren $ (x_i, y_i) $ . De $ x_i $ hebben bepaald door de onderzoeker (dit kunnen bijvoorbeeld hoeveelheden van een medicijn zijn). Elke $ y_i $ (bijvoorbeeld een reactie op het medicijn) wordt verondersteld komen uit een kansverdeling die Normaal is maar met een onbekend gemiddelde $ \ mu_i $ en algemene variantie $ \ sigma ^ 2 $ . Verder wordt aangenomen dat de gemiddelden gerelateerd zijn aan de $ x_i $ via een formule $ \ mu_i = \ beta_0 + \ beta_1 x_i $ . Deze drie parameters – $ \ sigma $ , $ \ beta_0 $ en $ \ beta_1 $ –bepaal de onderliggende verdeling van $ y_i $ voor elke waarde van $ x_i $ . Daarom kan elke eigenschap van die distributie worden gezien als een functie van $ (\ sigma, \ beta_0, \ beta_1) $ .Voorbeelden van dergelijke eigenschappen zijn het intercept $ \ beta_0 $ , de helling $ \ beta_1 $ , de waarde van $ \ cos (\ sigma + \ beta_0 ^ 2 – \ beta_1) $ , of zelfs het gemiddelde op de waarde $ x = 2 $ , die (volgens deze formulering) $ \ beta_0 + 2 \ beta_1 $ moet zijn.
In deze OLS context, zou een niet-voorbeeld van een schatter een procedure zijn om te raden naar de waarde van $ y $ als $ x $ zijn gelijk gesteld aan 2. Dit is geen een schatter omdat deze waarde van $ y $ is willekeurig (op een manier volledig gescheiden van de willekeurigheid van de gegevens): het is geen (definitieve numerieke) eigenschap van de distributie, ook al is het gerelateerd aan die distributie. (Zoals we net hebben gezien, is de verwachting van $ y $ voor $ x = 2 $ , gelijk aan $ \ beta_0 + 2 \ beta_1 $ , kan worden geschat.)
In Lehmanns formulering, bijna elke formule kan een schatter zijn van bijna elke eigenschap. Er is geen inherent wiskundig verband tussen een schatter en een schatter. We kunnen echter vooraf de kans inschatten dat een schatter redelijkerwijs benadert de hoeveelheid die bedoeld is om te schatten. Manieren om dit te doen en hoe ze te exploiteren, zijn onderwerp van de schattingstheorie.
Opmerkingen
- (+ 1) Een zeer nauwkeurig en gedetailleerd antwoord.
- Is een functie van een willekeurige variabele zelf niet ook een willekeurige variabele?
- @jsk Ik denk dat het onderscheid dat ik probeerde te maken make here kan worden verduidelijkt door de samenstelling van functies $$ \ Omega \ to \ mathbb {R} ^ n \ to \ mathbb {R} te beschouwen. $$ De eerste functie is een willekeurige variabele $ Xde tweede (noem het $ t $) wordt hier een schatter genoemd, en de samenstelling van de twee $$ t \ circ X: \ Omega \ to \ mathbb { R} $$ is een ” schatting ” of ” schattingsprocedure, ” wat – zoals je terecht zegt – een willekeurige variabele is.
- @whuber In je bericht zeg je ” De schatter zelf is geen willekeurige variabele. ” Ik heb geprobeerd je bericht te bewerken om duidelijk te maken waar jij en ik het over eens zijn, maar het lijkt erop dat iemand mijn bewerking heeft afgewezen. Misschien geven ze de voorkeur aan jouw bewerking!
- Laat ons deze discussie voortzetten in de chat .
Answer
In het kort: een schatter is een functie en een schatting is een waarde die een waargenomen steekproef samenvat.
Een schatter is een functie die wijst een willekeurige steekproef toe aan de parameterschatting:
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ Merk op dat een schatter van n willekeurige variabelen $ X_1, X_2, …, X_n $ is een willekeurige variabele $ \ hat {\ Theta} $. Een schatter is bijvoorbeeld het steekproefgemiddelde: $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An schatting $ \ hat {\ theta} $ is het resultaat van het toepassen van de schatterfunctie op een waargenomen steekproef in kleine letters $ x_1, x_2, …, x_n $:
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ Bijvoorbeeld, een schatting van het waargenomen monster $ x_1, x_2, …, x_n $ is het gemiddelde van het monster : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
Reacties
- schatter is een RV, terwijl schatting een constante is?
- Is niet ‘ uw conclusie in strijd met @whuber ‘ s? Hier zegt u dat de schatter RV is, maar whuber zegt iets anders.
- Ja, ik ben het niet eens met de verklaring van @whuber ‘ s ” De schatter zelf is geen willekeurige variabele: het ‘ is slechts een wiskundige functie “. Een functie van willekeurige variabele is ook een willekeurige variabele. onlinecourses.science.psu.edu/stat414/node/128
Antwoord
Het kan handig zijn om het antwoord van Whuber te illustreren in de context van een lineair regressiemodel. Stel dat u enkele bivariate gegevens heeft en dat u gewone kleinste kwadraten gebruikt om het volgende te bedenken model:
Y = 6X + 1
Op dit punt kun je elke waarde van X nemen, deze in het model pluggen en de uitkomst voorspellen, Y. In die zin zou je kunnen denken aan de individuele componenten van de generieke vorm van het model ( mX + B ) als schatters .De voorbeeldgegevens (die u vermoedelijk in het generieke model had gestoken om de specifieke waarden voor m en B hierboven te berekenen) boden een basis waarop u schattingen voor respectievelijk m en B .
Komt overeen met de punten van @whuber in onze thread hieronder, ongeacht de waarden van Y een bepaalde set schatters genereert u, want in de context van lineaire regressie worden ze gezien als voorspelde waarden.
(een paar keer bewerkt om de opmerkingen hieronder)
Opmerkingen
- Je hebt mooi een voorspeller gedefinieerd. Het is subtiel (maar belangrijk ) anders dan een schatter. De schatter in deze context is de kleinste-kwadratenformule die wordt gebruikt om de parameters 1 en 6 uit de gegevens te berekenen.
- Hmm, ik heb ‘ bedoel ik het niet op die manier, @whuber, maar ik denk dat je opmerking een belangrijke dubbelzinnigheid illustreert in mijn taal die ik ‘ niet heb opgemerkt voordat. Het belangrijkste punt hier is dat u de generieke vorm van de vergelijking Y = mX + B (zoals hierboven gebruikt) als een schatter kunt beschouwen, terwijl de specifieke voorspelde waarden gegenereerd door specifieke voorbeelden van die formule (bijv. 1 + 6X) zijn schattingen. Laat me proberen de bovenstaande alinea te bewerken om dat onderscheid vast te leggen …
- trouwens, ik ‘ probeer dit uit te leggen zonder de ” hat ” notatie die ik ‘ ben tegengekomen in de meeste leerboekdiscussies over dit concept. Misschien is dat ‘ toch de betere route?
- Ik denk dat je in je oorspronkelijke antwoord een aardig medium hebt gevonden tussen nauwkeurigheid en technische details: ga zo door! Je hebt geen ‘ hoeden nodig, maar als het je lukt om te laten zien hoe een schatter zich onderscheidt van andere, soortgelijk ogende dingen, zou dat zeer nuttig zijn. Maar let op het onderscheid tussen het voorspellen van een waarde Y en het schatten van een parameter zoals m of b . Y zou kunnen worden geïnterpreteerd als een willekeurige variabele; m en b zijn dat niet (behalve in een Bayesiaanse setting).
- inderdaad, een heel goed punt in termen van parameters versus waarden daar. Opnieuw bewerken …
Answer
Stel dat je wat gegevens hebt ontvangen en je hebt een waargenomen variabele genaamd theta . Nu kunnen uw gegevens afkomstig zijn van een gegevensdistributie, voor deze distributie is er een overeenkomstige waarde van theta waarvan u afleidt dat dit een willekeurige variabele is. U kunt de MAP of het gemiddelde gebruiken om de schatting van deze willekeurige variabele te berekenen wanneer de verdeling van uw gegevens verandert. Dus de willekeurige variabele theta staat bekend als een schatting , een enkele waarde van de niet-waargenomen variabele voor een bepaald type gegevens.
Hoewel schatter uw gegevens zijn, die ook een willekeurige variabele zijn. Voor verschillende soorten verdelingen heb je verschillende soorten gegevens en dus heb je een andere schatting en daarom wordt deze corresponderende willekeurige variabele de schatter .
Geef een reactie