Central Limit Theorem behøver kun stikprøvestørrelse, N?
On februar 15, 2021 by adminJeg tror, at forklaring af den centrale grænsesætning har brug for to elementer: stikprøvestørrelsen og antallet af prøver, der er trukket.
Men ingen ser ud til at tale om antallet af prøver, der er trukket, når de laver en vis slutning $ \ mu $ ved hjælp af den centrale grænsesætning og kun nævner prøvestørrelsen, $ N $ og dens distribution, hvilket betyder, at de kun bruger en prøvegruppe til at udlede befolkningen $ \ mu $ .
Jeg troede dog, at der skulle være masser af prøver hver af mindst 30 elementer, og følgelig betyder masser af prøve “og” deres distribution, ikke kun fordelingen af en prøvegruppe.
Hjælp mig venligst med at forstå den centrale grænsesætning og udlede befolkningens gennemsnit, $ \ mu $ .
Kommentarer
- Kan nogen forklare, hvad ' er uklart om spørgsmålet?
- @ Glen_b Jeg don ' t forstår, hvordan " antallet af prøvestørrelser " og " antallet af tegneeksempler " er forskellige.
- Du ' tegner flere prøver, hver af størrelse N (" prøvestørrelse "); den anden mængde er hvor mange sådanne prøver du tegner (" antal prøver "). Jeg gætter på, at det kunne afklares lidt med en redigering.
- @Sycorax: Jeg ' har ryddet formuleringen lidt, men udover OP ikke har engelsk som førstesprog (og nogle større, men ikke ualmindelige misforståelser) syntes det klart for mig
- @Roy Jeg ' har lige bemærket der ' et relateret spørgsmål her: stats.stackexchange.com/questions/133931/…
Svar
-
En enkelt tilfældig variabel har en fordeling; et prøve gennemsnit fra en tilfældig prøve er en enkelt tilfældig variabel. Naturligvis kan du kun observere dens fordeling ved at se på flere tilfældige prøver (såsom flere eksempler); da antallet af sådanne prøver øges, vil prøven (empirisk) cdf nærme sig populationsfordelingsfunktionen. Standardfejlen i eksemplet cdf om populationen cdf falder som kvadratroden af stikprøvestørrelsen (firedobler stikprøvestørrelsen, og du halverer standardfejlen).
Kort sagt har antallet af prøver, du tager (hver i størrelse $ n $ ) ingen indflydelse på, hvor tæt fordelingen af prøve middel er at være normal … kun hvor nøjagtigt du kan se det, når du ser på en samling af prøver, betyder alt fra prøver af samme størrelse.
At se, hvor tæt du er på normalitet i en eller anden prøvestørrelse , har du muligvis brug for et betydeligt antal prøveorganer. I simuleringseksperimenter er det almindeligt at se på tusinder af sådanne prøver for at få en god fornemmelse af fordelingsformen.
Billedet viser histogrammer på 20, 300 og 100000 prøve middel til prøver af størrelse n = 30 fra en skæv fordeling . Vi har en vis fornemmelse af den brede form i den første, en noget klarere fornemmelse af den i den anden, men vi får en ret klar idé om formen på denne fordeling af prøve betyder i den tredje, hvor vi har en stor antal realiseringer af stikprøvernes gennemsnit.
I dette tilfælde betyder prøve ikke at have en normalfordeling tæt; n = 30 ville ikke være tilstrækkelig til at behandle disse midler som omtrent normalt fordelt (i det mindste ikke til typiske formål).
Hvis du vil have en god fornemmelse af, hvordan distributionens haler opfører sig, har du muligvis brug for et betydeligt større antal eksempler.
Men når du har at gøre med ægte data, får du generelt kun en enkelt prøve. Du skal basere din slutning (hvad enten du stoler på CLT eller ej) på den ene prøve.
-
Du er måske blevet vildledt af, hvad den centrale grænsesætning siger.
Den faktiske central grænsesætning siger intet, uanset om n = 30 eller om nogen anden endelig prøvestørrelse.
Det er i stedet en sætning om opførelsen af standardiserede midler (eller summer) i grænsen som n går til uendeligt.
-
Selvom det er sandt, at (under visse betingelser) vil prøveeksempler være omtrent normalfordelt (i en bestemt betydning af omtrentligt), hvis stikprøvestørrelse er stor nok, hvad der er “stor nok” til et eller andet formål afhænger af flere faktorer.Som vi ser i plottet ovenfor kan skævhed (for eksempel) have en væsentlig indvirkning på tilgangen til normalitet (hvis populationen er skæv, er fordelingen af prøveorganer også skæv, men mindre med stigende stikprøvestørrelse).
Kommentarer
- Tak for dit gode svar! Jeg har et hurtigt spørgsmål om det:
In short, the number of samples you take (each of size n) has no impact on how close the distribution of sample means is to being normal
. Baseret på dit plot betyder det, at du har tegnet 20, 300, 1000000 prøver (og få det samme antal prøveværdier), og at hver prøve i størrelse er 30, og uanset hvor mange prøver du har tegnet (eller hvor mange gange du har tegnet prøver ), det har ingen indflydelse på dist. af prøve betyder at være normalitet? Eller forstår jeg muligvis din artikel på en modsat måde …? - Fordi jeg lige har simuleret CLT af Python med ensartet dist. med 300 prøver (hver i størrelse er 10), og det ser ret normalt ud, og så er jeg lidt forvirret.
- Den form af distributionen du trækker på, betyder bestemt noget; uniformen er en ' pæn ' sag hvor n endnu mindre end 10 er ret tæt på det normale til de fleste formål (30 er for høj en bar, medmindre du ' kommer godt ind i halen). Hvis du havde udført 1000 prøver eller 1 (hver n = 10), er fordelingen af midler den samme, så længe du holder dig til den samme populationsfordeling. Hvis du vil efterligne mine billeder, skal du prøve en gammafordeling med form 0,05 (skala- eller hastighedsparameteren betyder ikke ', så længe du ikke ' t ændre det); ækvivalent kan du prøve en chi-firkant med 0,1 d.f.
- Bemærk at din prøve betyder fra en uniform er flot og normal, men er (påviseligt) faktisk ikke normal; de er lettere end de normale (de har faktisk et endeligt interval). Denne ikke-normalitet betyder måske ikke meget, afhængigt af hvad du ' gør med dem.
- Wow, yeah, gamma dist. viser tydeligt, hvad du forklarede ovenfor: antallet af prøve betyder ikke har nogen indvirkning. Jeg forstår forkert CLT, tak. Og jeg fandt også ud af, at jeg troede, at " punktestimering " er baseret på CLT, og kunne ikke ' t forstå, hvorfor punktestimering kun bruger en prøveindsamling til at udlede populationsparametre. Tak for din hjælp 🙂
Skriv et svar