Jaký je vztah mezi odhadcem a odhadem?
On 10 února, 2021 by adminJaký je vztah mezi odhadcem a odhadem?
Komentáře
- “ Ve statistikách je odhadcem pravidlem pro výpočet odhadu dané veličiny na základě pozorovaných údajů: rozlišuje se tedy pravidlo a jeho výsledek (odhad). “ (první řádek článku na Wikipedii en.wikipedia.org/wiki/Estimator ).
- + 1 Hlasuji pro tuto otázku (navzdory přítomnosti dobře formulované odpovědi na zjevné stránce Wikipedie), protože počáteční pokusy o její zodpovězení zde ukázaly na některé jemnosti.
- @whuber, mohu říci parametry modelu odhady jsou odhadem?
- @loganecolss Odhad je matematická funkce. To se liší od hodnoty (odhadu), které může dosáhnout pro jakoukoli sadu dat. Jedním ze způsobů, jak ocenit rozdíl, je poznamenat, že určité soubory dat vytvoří stejné odhady , řekněme, sklon v lineární regresi pomocí různých odhadů (například Maximum Pravděpodobnost nebo iterativně vážící nejméně čtverců). Bez rozlišení odhadů od odhadů použitých k vytvoření těchto odhadů bychom nebyli schopni pochopit, co toto tvrzení dokonce říká.
- @whuber, dokonce ani s jednou určitou sadou dat $ D $, by jiný odhadce mohl také dát různé odhady, nedělejte ‚?
odpověď
E . L. Lehmann ve své klasické Teorii odhadu bodu odpovídá na tuto otázku na stranách 1-2.
Pozorování jsou nyní se předpokládá, že jde o hodnoty převzaté náhodnými proměnnými, u nichž se předpokládá, že sledují společné rozdělení pravděpodobnosti, $ P $ , patřící do některé známé třídy …
… specializujme se nyní na odhad bodů … předpokládejme, že $ g $ je funkce se skutečnou hodnotou [ve stanovené třídě distribucí ] a že bychom chtěli znát hodnotu $ g $ [při jakékoli skutečné distribuci, $ \ theta $ ]. $ \ theta $ , a tedy $ g (\ theta) $ bohužel není znám. Data však lze použít k získání odhadu $ g (\ theta) $ , což je hodnota, v kterou doufáme, blízká $ g (\ theta) $ .
Slovy: odhad je jednoznačný matematický postup, který přijde s číslem ( odhad ) pro jakoukoli možnou sadu dat, která by konkrétní problém mohl vyprodukovat. Toto číslo má představovat určitou jednoznačnou číselnou vlastnost procesu generování dat ( $ g (\ theta) $ ); můžeme to nazvat “ odhad. “
Samotný odhadce není náhodná proměnná: je to jen matematická funkce. Odhad, který vytváří, je však založen na datech, které jsou samy modelovány jako náhodné proměnné. To činí odhad (myšleno jako v závislosti na datech) do náhodné proměnné a konkrétní odhad pro konkrétní sadu dat se stane realizací této náhodné proměnné.
V jedné (konvenční) běžné nejméně formulace čtverců, data se skládají z uspořádaných párů $ (x_i, y_i) $ . $ x_i $ mají byly určeny experimentátorem (mohou to být například množství podaného léku). Předpokládá se, že každý $ y_i $ (například odpověď na lék) pocházejí z rozdělení pravděpodobnosti, které je normální, ale s neznámým průměrem $ \ mu_i $ a běžná variance $ \ sigma ^ 2 $ . Dále se předpokládá, že prostředky souvisejí s $ x_i $ pomocí vzorce $ \ mu_i = \ beta_0 + \ beta_1 x_i $ . Tyto tři parametry – $ \ sigma $ , $ \ beta_0 $ a $ \ beta_1 $ – určete základní distribuci $ y_i $ pro jakoukoli hodnotu $ x_i $ . Proto jakoukoli vlastnost této distribuce lze považovat za funkci $ (\ sigma, \ beta_0, \ beta_1) $ .Příklady takových vlastností jsou intercept $ \ beta_0 $ , sklon $ \ beta_1 $ , hodnota $ \ cos (\ sigma + \ beta_0 ^ 2 – \ beta_1) $ , nebo dokonce průměr na hodnotě $ x = 2 $ , což (podle této formulace) musí být $ \ beta_0 + 2 \ beta_1 $ .
V této OLS kontextu, nepříkladem odhadce by byl postup k uhodnutí hodnoty $ y $ , pokud $ x $ byly nastaveny na 2. Toto není není odhad, protože tato hodnota $ y $ je náhodné (svým způsobem zcela oddělené od náhodnosti dat): nejde o (definitivní číselnou) vlastnost distribuce, i když s touto distribucí souvisí. (Jak jsme právě viděli, očekávání $ y $ pro $ x = 2 $ , což se rovná $ \ beta_0 + 2 \ beta_1 $ , lze odhadnout.)
Ve formulaci Lehmann téměř jakýkoli vzorec může být odhadcem téměř jakékoli vlastnosti. Mezi odhadcem a odhadem neexistuje žádná inherentní matematická souvislost. Můžeme však předem posoudit šanci, že odhad bude přiměřeně blízko množství, které má odhadnout. Způsoby, jak toho dosáhnout, a jak je využít, jsou předmětem teorie odhadu.
Komentáře
- (+ 1) Velmi přesná a podrobná odpověď.
- Není funkce samotné náhodné proměnné také náhodnou proměnnou?
- @jsk Myslím, že rozdíl, o který jsem se snažil make here can be objasněno zvážením složení funkcí $$ \ Omega \ to \ mathbb {R} ^ n \ to \ mathbb {R}. $$ První funkcí je náhodná proměnná $ X $; druhý (říkejte tomu $ t $) se zde nazývá odhadce a složení dvou $$ t \ circ X: \ Omega \ to \ mathbb { R} $$ je “ odhad “ nebo “ postup odhadu, “ což je – jak správně říkáte – náhodná proměnná.
- @whuber Ve svém příspěvku říkáte “ Samotný odhadce není náhodná proměnná. “ Pokusil jsem se o úpravu vašeho příspěvku, abych objasnil věc, na které se my i já shodujeme, ale zdá se, že někdo moji úpravu odmítl. Možná by dali přednost vaší úpravě!
- Pojďme pokračovat v této diskusi v chatu .
Odpověď
Stručně: odhad je funkce a odhad je hodnota, která shrnuje pozorovaný vzorek.
estimator je funkce, která namapuje náhodný vzorek na odhad parametru:
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ Všimněte si, že odhad n náhodné proměnné $ X_1, X_2, …, X_n $ je náhodná proměnná $ \ hat {\ Theta} $. Například odhad je vzorový průměr: $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An odhad $ \ hat {\ theta} $ je výsledkem použití funkce odhadu na malý pozorovaný vzorek $ x_1, x_2, …, x_n $:
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ Například odhad pozorovaného vzorku $ x_1, x_2, …, x_n $ je průměr vzorku : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
Komentáře
- odhad je RV, zatímco odhad je konstantní?
- Není váš závěr ‚ v rozporu s @whuber ‚ s? Tady říkáte, že odhadcem je RV, ale whuber říká jinak.
- Ano, nesouhlasím s tvrzením @whuber ‚ “ Samotný odhadce není náhodná proměnná: ‚ jde pouze o matematickou funkci „. Funkce náhodné proměnné je také náhodná proměnná. onlinecourses.science.psu.edu/stat414/node/128
odpověď
Může být užitečné ilustrovat whuberovu odpověď v kontextu lineárního regresního modelu. Řekněme, že máte nějaká dvojrozměrná data a pomocí běžných nejmenších čtverců přijdete s následující model:
Y = 6X + 1
V tomto okamžiku můžete vzít jakoukoli hodnotu X, zapojit ji do modelu a předpovědět výsledek, Y. V tomto smyslu vás mohou napadnout jednotlivé komponenty obecné formy modelu ( mX + B ) jako odhady .Ukázková data (která jste pravděpodobně zapojili do obecného modelu k výpočtu konkrétních hodnot pro m a B výše) poskytla základ, na kterém byste mohli přijít s odhady pro m , respektive B .
V souladu s body @whuber v našem vlákně níže, bez ohledu na hodnoty Y určitá sada odhadů, které vás generují, jsou v kontextu lineární regrese považovány za predikované hodnoty.
(upraveno – několikrát – aby odráželo komentáře níže)
Komentáře
- Máte pěkně definovaný prediktor. Je nenápadný (ale důležitý) ) liší se od odhadce. Odhadcem je v tomto kontextu vzorec nejmenších čtverců použitý k výpočtu parametrů 1 a 6 z údajů.
- Hmm, neudělal jsem ‚ t to tak myslí, @ whuber, ale myslím, že tvůj komentář ilustruje v mém jazyce důležitou dvojznačnost, kterou jsem si ‚ nevšiml před. Hlavním bodem zde je, že si můžete představit obecnou formu rovnice Y = mX + B (jak je použita výše) jako odhad, zatímco konkrétní predikované hodnoty generované konkrétními příklady tohoto vzorce (např. 1 + 6X) jsou odhady. Pokusím se upravit výše uvedený odstavec, abych zachytil tento rozdíl …
- btw, pokouším se to vysvětlit bez zavedení iv id = „‚ 570de15fa5 „>
hat “ zápis, se kterým jsem se ‚ setkal ve většině učebnicových diskusí o tomto konceptu. Možná je to ‚ ta lepší cesta?
Odpověď
Předpokládejme, že jste obdrželi nějaká data a měli jste pozorovanou proměnnou zvanou theta . Nyní mohou vaše data pocházet z distribuce dat, pro tuto distribuci existuje odpovídající hodnota theta, kterou odvodíte, což je náhodná proměnná. Můžete použít MAP nebo průměr pro výpočet odhadu této náhodné proměnné, kdykoli se změní distribuce vašich dat. Náhodná proměnná theta je tedy známá jako odhad , což je jediná hodnota nepozorované proměnné pro konkrétní typ dat.
Zatímco odhadem jsou vaše data, která jsou také náhodnou proměnnou. U různých typů distribucí máte různé typy dat, a tedy máte jiný odhad, a proto se tato odpovídající náhodná proměnná nazývá estimator .
Napsat komentář