Mikä on estimaattorin ja estimaatin suhde?
On helmikuu 10, 2021 by adminMikä on estimaattorin ja estimaatin suhde?
Kommentit
- ” Tilastossa estimaattori on sääntö tietyn määrän estimaatin laskemiseksi havaittujen tietojen perusteella: siten sääntö ja sen tulos (arvio) erotetaan toisistaan. ” (Wikipedia-artikkelin ensimmäinen rivi fi.wikipedia.org/wiki/Estimator ).
- + 1 Äänestän tätä kysymystä (huolimatta siitä, että Wikipedia-sivulla on hyvin muotoiltu vastaus), koska ensimmäiset yritykset vastata tähän ovat osoittaneet joitain hienovaraisuuksia.
- @whuber, voinko sanoa malliparametrit estimaatit ovat estimaattori?
- @loganecolss Estimaattori on matemaattinen funktio. Se erotetaan arvosta (arvio), jonka se voi saavuttaa mille tahansa tietojoukolle. Yksi tapa arvostaa ero on huomata, että tietyt tietojoukot tuottavat samat arviot esimerkiksi kaltevuudesta lineaarisessa regressiossa käyttämällä erilaisia estimaattoreita (kuten Suurin Esimerkiksi todennäköisyys tai uudelleenarvioidut pienimmät neliöt). Ilman arvioiden erottamista estimaattoreista, joita käytetään näiden arvioiden tuottamiseen, emme pystyisi ymmärtämään, mitä lausunnossa jopa sanotaan.
- @whuber, vaikka yksi tietty datajoukko $ D $, erilainen estimaattori voisi antaa myös erilaisen arviot, älä ’ t?
Vastaa
E . L. Lehmann, klassisessa Pisteennusteen teoriassa , vastaa tähän kysymykseen sivuilla 1-2.
Havainnot ovat oletetaan nyt olevan satunnaismuuttujien ottamia arvoja, joiden oletetaan noudattavan yhteistä todennäköisyysjakaumaa $ P $ , jotka kuuluvat johonkin tunnettuun luokkaan …
… erikoistutkaamme nyt piste-estimointiin … oletetaan, että $ g $ on reaaliarvoinen funktio, joka määritetään [määrätyssä jakeluluokassa ] ja että haluaisimme tietää arvon $ g $ [missä tahansa todellisessa jakaumassa, $ \ theta $ ]. Valitettavasti $ \ theta $ ja siten $ g (\ theta) $ , ei tunneta. Tietoja voidaan kuitenkin käyttää arvion saamiseen $ g (\ theta) $ , arvoon, jonka toivotaan olevan lähellä $ g (\ theta) $ .
Sanalla: estimaattori on tarkka matemaattinen menettely, joka antaa numeron ( arvio ) kaikille mahdollisille tietojoukoille, joita tietty ongelma voi tuottaa. Tämän numeron on tarkoitus edustaa tiettyä tietojenkäsittelyprosessin tiettyä numeerista ominaisuutta ( $ g (\ theta) $ ); voimme kutsua tätä ” estimaatiksi. ”
Itse estimaattori ei satunnaismuuttuja: se on vain matemaattinen funktio. Sen tuottama arvio perustuu kuitenkin tietoihin, jotka itse mallinnetaan satunnaisina muuttujina. Tämä tekee arvion (ajatellaan riippuvan tiedoista) satunnaismuuttujaksi ja tietty arvio tietylle tietojoukolle tulee kyseisen satunnaismuuttujan toteutus.
Yhdessä (tavanomaisessa) tavallisessa vähiten neliöiden muoto, tiedot koostuvat järjestetyistä pareista $ (x_i, y_i) $ . $ x_i $ on kokeilija on määrittänyt (ne voivat olla esimerkiksi annettavan lääkkeen määrät). Jokaisen $ y_i $ (vastauksena lääkkeeseen) oletetaan olevan tulevat todennäköisyysjakaumasta, joka on Normaali, mutta tuntemattomalla keskiarvolla $ \ mu_i $ ja common varianssi $ \ sigma ^ 2 $ . Lisäksi oletetaan, että keskiarvot liittyvät $ x_i $ -kaavan $ \ mu_i = \ beta_0 + \ kautta beta_1 x_i $ . Nämä kolme parametria – $ \ sigma $ , $ \ beta_0 $ ja $ \ beta_1 $ – määritä $ y_i $ -jakauma mille tahansa arvolle $ x_i $ . Siksi kyseisen jakelun minkä tahansa ominaisuuden voidaan ajatella funktiona $ (\ sigma, \ beta_0, \ beta_1) $ .Esimerkkejä tällaisista ominaisuuksista ovat sieppaus $ \ beta_0 $ , kaltevuus $ \ beta_1 $ , arvo $ \ cos (\ sigma + \ beta_0 ^ 2 – \ beta_1) $ tai jopa keskiarvo arvossa $ x = 2 $ , jonka (tämän muotoilun mukaan) on oltava $ \ beta_0 + 2 \ beta_1 $ .
Tässä OLS: ssä estimaatista ei-esimerkki olisi menetelmä arvata $ y $ , jos $ x $ asetettiin yhtä suureksi kuin 2. Tämä ei ole arvio, koska tämä arvo $ y $ on satunnainen (tavallaan täysin erillinen datan satunnaisuudesta): se ei ole jakauman (selvä numeerinen) ominaisuus, vaikka se liittyy kyseiseen jakaumaan. (Kuten juuri näimme, $ y $ $ x = 2: n odotukset $ , joka on yhtä suuri kuin $ \ beta_0 + 2 \ beta_1 $ , voidaan arvioida.)
Lehmannin sanamuodossa lähes mikä tahansa kaava voi olla estimaattori melkein mille tahansa ominaisuudelle. Estimaattorin ja estimaatin välillä ei ole luontaista matemaattista yhteyttä. Voimme kuitenkin arvioida – etukäteen – mahdollisuuden, että estimaattori on kohtuudella lähellä määrää, jonka on tarkoitus arvioida. Arviointiteoria koskee tapoja tehdä tämä ja miten niitä hyödyntää.
Kommentit
- (+ 1) Erittäin tarkka ja yksityiskohtainen vastaus.
- Eivätkö satunnaismuuttujan itsensä funktio ole myös satunnaismuuttuja?
- @jsk Luulen, että yritin tehdä eron Tee tässä voidaan selventää tarkastelemalla funktioiden $$ \ Omega \ to \ mathbb {R} ^ n \ to \ mathbb {R} kokoonpanoa. $$ Ensimmäinen funktio on satunnaismuuttuja $ X $; toista (kutsu sitä $ t $) kutsutaan tässä estimaattoriksi , ja näiden kahden koostumus $$ t \ circ X: \ Omega \ to \ mathbb { R} $$ on ” arvio ” tai ” estimointimenettely, ” mikä on – kuten oikein sanot – satunnaismuuttuja.
- @whuber Viestissäsi sanot ” Estimaattori itsessään ei ole satunnainen muuttuja. ” Yritin muokata viestiäsi selvittääkseen asiaa, josta me ja minä näytämme olevan yhtä mieltä, mutta näyttää siltä, että joku hylkäsi muokkaukseni. Ehkä he haluaisivat muokkauksesi!
- Jatka jatka tätä keskustelua keskustelussa .
Vastaa
Lyhyesti: estimaattori on funktio ja arvio on arvo, joka tiivistää havaitun otoksen.
estimaattori on funktio, joka yhdistää satunnaisnäytteen parametriarvioon:
$$ \ hat {\ Theta} = t (X_1, X_2, …, X_n) $$ Huomaa, että estimaatti n satunnaismuuttujat $ X_1, X_2, …, X_n $ on satunnaismuuttuja $ \ hat {\ Theta} $. Estimaattori on esimerkiksi esimerkkikeskiarvo: $$ \ overline {X} = \ frac {1} {n} \ sum_ {n = 1} ^ nX_i $$ An arvio $ \ hat {\ theta} $ on tulosta estimaattofunktion soveltamisesta pienellä kirjaimella havaittuun otokseen $ x_1, x_2, …, x_n $:
$$ \ hat {\ theta} = t (x_1, x_2, …, x_n) $$ Esimerkiksi arvio havaitusta näytteestä $ x_1, x_2, …, x_n $ on näytekeskiarvo : $$ \ hat {\ mu} = \ overline {x} = \ frac {1} {n} \ sum_ {n = 1} ^ nx_i $$
kommentit
- estimaattori on RV, kun taas estimaatti on vakio?
- Eikö ’ t johtopäätöksesi ole ristiriidassa @whuberin kanssa ’ s? Tässä sanot estimaattorin olevan RV, mutta whuber sanoo toisin.
- Kyllä, olen eri mieltä @whuber ’ n lausunnosta ” Estimaattori itsessään ei ole satunnainen muuttuja: se ’ on vain matemaattinen funktio ”. Satunnaismuuttujan funktio on myös satunnaismuuttuja. onlinecourses.science.psu.edu/stat414/node/128
Vastaa
Voi olla hyödyllistä havainnollistaa Whuberin vastaus lineaarisen regressiomallin yhteydessä. Sanotaan, että sinulla on muuttujatietoja ja käytät tavallisia pienimpiä neliöitä seuraavien keksimiseksi: malli:
Y = 6X + 1
Tässä vaiheessa voit ottaa minkä tahansa X: n arvon, liittää sen malliin ja ennustaa lopputuloksen Y. Tässä mielessä saatat ajatella mallin yleisen muodon yksittäisiä komponentteja ( mX + B ) arvioijina .Esimerkkitiedot (jotka oletettavasti liitit yleiseen malliin laskeaksesi yllä olevien m ja B -arvojen erityisarvot) antoivat perustan arviot vastaavasti m ja B .
Johdonmukainen alla olevan säikeemme @whuberin pisteiden kanssa, riippumatta siitä, mitkä arvot ovat Y tietyt estimaattorijoukot, joille sinut luodaan, pidetään lineaarisen regressioiden yhteydessä ennustetuina arvoina.
(muokattu – muutama kerta vastaamaan alla olevat kommentit)
Kommentit
- Olet määrittänyt hienosti ennustajan. Se on hienovaraisesti (mutta tärkeätä ) erilainen kuin estimaattori. Tässä yhteydessä estimaattori on pienimmän neliösumman kaava, jota käytetään parametrien 1 ja 6 laskemiseen tiedoista.
- Hmm, en ’ Älä tarkoita sitä tällä tavalla, @whuber, mutta luulen, että kommenttisi kuvaa tärkeätä epäselvyyttä kielelläni, jota en huomannut ’ en huomannut ennen. Tärkein asia tässä on, että voit ajatella yhtälön Y = mX + B (kuten yllä) yleistä muotoa estimaattorina, kun taas kyseisen kaavan erityisten esimerkkien (esim. 1 + 6X) muodostamat ennustetut arvot ovat arviot. Saanen yrittää muokata yllä olevaa kohtaa ottaakseni huomioon tämän eron …
- btw, minä ’ m yritän selittää tämän ottamatta käyttöön ” hat ” -merkintä, jonka olen ’ tavannut useimmissa tämän käsitteen oppikeskusteluissa. Ehkä ’ on loppujen lopuksi parempi reitti?
- Luulen, että olet löytänyt mukavan välineen tarkkuuden ja teknisyyden välillä alkuperäisessä vastauksessasi: jatka sitä! Et tarvitse ’ hattuja, mutta jos pystyt osoittamaan, kuinka estimaattori erotetaan muista samanlaisen näköisistä asioista, siitä olisi eniten hyötyä. Huomaa kuitenkin ero ennustamisen arvon Y ja estimoinnin välillä parametrin, kuten m tai b välillä. Y voitaisiin tulkita satunnaismuuttujaksi; m ja b eivät ole (paitsi Bayesin asetuksessa).
- todellakin erittäin hyvä piste parametrien ja siellä olevien arvojen suhteen. Muokataan uudelleen …
Vastaa
Oletetaan, että olet saanut joitain tietoja ja sinulla on havaittu muuttuja nimeltä teeta . Nyt tietosi voivat olla peräisin datan jakelusta, tälle jakelulle on vastaava teetan arvo, jonka päätät, mikä on satunnainen muuttuja. Voit käyttää MAP: ää tai keskiarvoa tämän satunnaismuuttujan estimaatin laskemiseen aina, kun tietosi jakauma muuttuu. Joten satunnaismuuttuja theta tunnetaan nimellä estimaatti , tarkkailemattoman muuttujan yksittäinen arvo tietyntyyppisille tiedoille.
Vaikka estimaattori on tietosi, joka on myös satunnaismuuttuja. Eri tyyppisissä jakaumissa sinulla on erityyppisiä tietoja, joten sinulla on erilainen arvio, joten tätä vastaavaa satunnaismuuttujaa kutsutaan estimaattoriksi .
Vastaa